Seite 1 von 1
CMU sphinx + megaHALL + espeak = sprechender computer
Verfasst: Samstag 12. Januar 2008, 01:27
von Costi
hello world!
ich denke es ist nicht alzu schwer ein:
-spracherkenungs-programm (CMU sphinx scheint die einzige open source loesung zusein)
-ein unterhaltungs chatbot (megahall ist dumm wie brot, aber unterhaltsam)
und...
-eine sprachwiedergabe (espeak ist schoen simpel)
zusammenzumatschen
ich frag mich warum niemand zuvor das gemacht hat (oder ?)
ich will das aber auf jeden fall in der schule als "5. pruefungskomponente" implementieren.
kommen wir also gleich zu meinem ersten problem:
wieso nimmt mein computer nichts auf?
ich benutze laut lspci einem:
Code: Alles auswählen
00:1b.0 Audio device: Intel Corporation 82801G (ICH7 Family) High Definition Audio Controller (rev 02)
habs auch mit zwei garantiert funktionierenden microfonen auf diversen arten mit verschiedenen programmen ausprobiert
danke
Verfasst: Samstag 12. Januar 2008, 01:58
von BlackJack
Das Soundproblem ist irgendwie keine Python-Frage. Da wärst Du in einem Linux-Forum vielleicht besser aufgehoben.
Oft ist das eine Frage der vielen Regler für Soundkarten. Das die entsprechenden Lautstärken eingestellt sind, aktiv sind, und das die Leitungen als Aufnahmegeräte ausgewählt sind.
Wobei es für Linux AFAIK keine (aktuelle) Spracherkennung gibt, mit der man beliebigen Text "eingeben" kann. Die aktiven Projekte, so auch CMU SPhinx, sind für interaktive Dialoge gedacht, bei denen der Wortschatz recht begrenzt ist und vor allem im Voraus bekannt sein muss.
Es gab wohl mal irgendwann ein kommerzielles IBM Viavoice für Linux, das aber nicht mehr gepflegt wird und es nur als Binärdateien für Uraltsysteme (libc und Kernel) gab/gibt.
Solltest also vorsichtig sein, das als Projekt fest zu legen.
Verfasst: Samstag 12. Januar 2008, 14:39
von fred.reichbier
Tag,
dieses HD-Audio-Zeugs (habe auch so einen) machen Probleme bei der Aufnahme. Hatte dasselbe Problem, du musst wahrscheinlich noch den richtigen Treiber installieren.
Gruß Fred
Verfasst: Samstag 12. Januar 2008, 15:47
von nkoehring
notfalls ALSA aktualisieren... aber vielleicht liegt das Problem auch ganz woanders: Oeffne doch mal alsamixer in der Konsole und schau was er dir anzeigt. Denn standardmaessig schaltet ALSA IMHO die Soundeingaenge Stumm!
Verfasst: Freitag 1. Februar 2008, 13:57
von Costi
jahh, du hatest mit dem alsamixer recht, jetzt gehts!
Verfasst: Samstag 16. Februar 2008, 16:58
von nkoehring
Costi hat geschrieben:jahh, du hatest mit dem alsamixer recht, jetzt gehts!
Na das freut mich doch zu hoeren... und wie geht es mit deinem Projekt voran?
Verfasst: Dienstag 19. Februar 2008, 16:12
von Costi
och das projekt ist tot
ich dachte das man bei einer BLL mit dem fach informatik ein programm schreibt, linux auf seine uhr portiert - was auch immer
allerdings muessen wir uns zwischen einer facharbeit oder presentation entscheiden
schade, ich dachte das waere mal eine chance zu zeigen was man kann. aber omg - ich muss mich an sovielen anderen regeln halten das das inhaltliche wohl nur die nebensache wird.
die sind ja schlimmer als ein java-compiler!
Verfasst: Dienstag 19. Februar 2008, 18:27
von nkoehring
Eine BLL?
Verfasst: Dienstag 19. Februar 2008, 18:52
von BlackJack