CMU sphinx + megaHALL + espeak = sprechender computer

Du hast eine Idee für ein Projekt?
Antworten
Costi
User
Beiträge: 545
Registriert: Donnerstag 17. August 2006, 14:21

hello world!

ich denke es ist nicht alzu schwer ein:
-spracherkenungs-programm (CMU sphinx scheint die einzige open source loesung zusein)
-ein unterhaltungs chatbot (megahall ist dumm wie brot, aber unterhaltsam)
und...
-eine sprachwiedergabe (espeak ist schoen simpel)
zusammenzumatschen

ich frag mich warum niemand zuvor das gemacht hat (oder ?)


ich will das aber auf jeden fall in der schule als "5. pruefungskomponente" implementieren.


kommen wir also gleich zu meinem ersten problem:
wieso nimmt mein computer nichts auf?
ich benutze laut lspci einem:

Code: Alles auswählen

00:1b.0 Audio device: Intel Corporation 82801G (ICH7 Family) High Definition Audio Controller (rev 02)
habs auch mit zwei garantiert funktionierenden microfonen auf diversen arten mit verschiedenen programmen ausprobiert


danke
cp != mv
BlackJack

Das Soundproblem ist irgendwie keine Python-Frage. Da wärst Du in einem Linux-Forum vielleicht besser aufgehoben.

Oft ist das eine Frage der vielen Regler für Soundkarten. Das die entsprechenden Lautstärken eingestellt sind, aktiv sind, und das die Leitungen als Aufnahmegeräte ausgewählt sind.

Wobei es für Linux AFAIK keine (aktuelle) Spracherkennung gibt, mit der man beliebigen Text "eingeben" kann. Die aktiven Projekte, so auch CMU SPhinx, sind für interaktive Dialoge gedacht, bei denen der Wortschatz recht begrenzt ist und vor allem im Voraus bekannt sein muss.

Es gab wohl mal irgendwann ein kommerzielles IBM Viavoice für Linux, das aber nicht mehr gepflegt wird und es nur als Binärdateien für Uraltsysteme (libc und Kernel) gab/gibt.

Solltest also vorsichtig sein, das als Projekt fest zu legen.
fred.reichbier
User
Beiträge: 155
Registriert: Freitag 29. Dezember 2006, 18:27

Tag,

dieses HD-Audio-Zeugs (habe auch so einen) machen Probleme bei der Aufnahme. Hatte dasselbe Problem, du musst wahrscheinlich noch den richtigen Treiber installieren.

Gruß Fred
Benutzeravatar
nkoehring
User
Beiträge: 543
Registriert: Mittwoch 7. Februar 2007, 17:37
Wohnort: naehe Halle/Saale
Kontaktdaten:

notfalls ALSA aktualisieren... aber vielleicht liegt das Problem auch ganz woanders: Oeffne doch mal alsamixer in der Konsole und schau was er dir anzeigt. Denn standardmaessig schaltet ALSA IMHO die Soundeingaenge Stumm!
[url=http://www.python-forum.de/post-86552.html]~ Wahnsinn ist auch nur eine andere Form der Intelligenz ~[/url]
hackerkey://v4sw6CYUShw5pr7Uck3ma3/4u7LNw2/3TXGm5l6+GSOarch/i2e6+t2b9GOen7g5RAPa2XsMr2
Costi
User
Beiträge: 545
Registriert: Donnerstag 17. August 2006, 14:21

jahh, du hatest mit dem alsamixer recht, jetzt gehts!
cp != mv
Benutzeravatar
nkoehring
User
Beiträge: 543
Registriert: Mittwoch 7. Februar 2007, 17:37
Wohnort: naehe Halle/Saale
Kontaktdaten:

Costi hat geschrieben:jahh, du hatest mit dem alsamixer recht, jetzt gehts!
Na das freut mich doch zu hoeren... und wie geht es mit deinem Projekt voran?
[url=http://www.python-forum.de/post-86552.html]~ Wahnsinn ist auch nur eine andere Form der Intelligenz ~[/url]
hackerkey://v4sw6CYUShw5pr7Uck3ma3/4u7LNw2/3TXGm5l6+GSOarch/i2e6+t2b9GOen7g5RAPa2XsMr2
Costi
User
Beiträge: 545
Registriert: Donnerstag 17. August 2006, 14:21

och das projekt ist tot :cry:

ich dachte das man bei einer BLL mit dem fach informatik ein programm schreibt, linux auf seine uhr portiert - was auch immer

allerdings muessen wir uns zwischen einer facharbeit oder presentation entscheiden

schade, ich dachte das waere mal eine chance zu zeigen was man kann. aber omg - ich muss mich an sovielen anderen regeln halten das das inhaltliche wohl nur die nebensache wird.

die sind ja schlimmer als ein java-compiler!
cp != mv
Benutzeravatar
nkoehring
User
Beiträge: 543
Registriert: Mittwoch 7. Februar 2007, 17:37
Wohnort: naehe Halle/Saale
Kontaktdaten:

Eine BLL?
[url=http://www.python-forum.de/post-86552.html]~ Wahnsinn ist auch nur eine andere Form der Intelligenz ~[/url]
hackerkey://v4sw6CYUShw5pr7Uck3ma3/4u7LNw2/3TXGm5l6+GSOarch/i2e6+t2b9GOen7g5RAPa2XsMr2
Antworten