Guten Abend,
Zunächst möchte ich noch sagen, dass ich sehr neu im Bezug auf Python bin und mich dementsprechend auch noch nicht so auskenne.
Mein mehr oder weniger kleines Projekt ist, dass ich eine Art von KI mit Hilfe von Python programmiere. Eine Art, weil es keine "richtige" KI ist, sondern nur Konkret bestimmte Befehle ausführt, wenn diese durch mich sprachlich zu stande kommen, also speech to text.
Danach wird mein gesprochenes Wort mit einer selbst geschriebenen Datenbank mit allen möglichen Befehlen geprüft.
Wenn es dann den richtigen Befehl gefunden hat, gibt es mit Hilfe von Text to speech das ganze wieder aus
Nochmal an einem Beispiel:
Ich sage "Hallo" --> Programm prüft Datenbank auf Befehl "Hallo" --> Gibt dann aus "Guten Tag"
Für mich ist es nicht wirklich wichtig, dass bei einem "Hi" beispielsweise nichts zurückkommt
Mit Hilfe von Vergleichsoperatoren Befehle sprachlich ausgeben
Wieso möchtest du das von Grund auf "neu" machen, wenn es fertige Programme bereits abbilden.
https://voiceattack.com/ kann das. Du kannst damit sogar Scripte starten, zumindest nach kurzen Googeln hab ich was gesehen.
Ich will dich nicht einbremsen, aber das Thema Speech Recognition aka Spracherkennung ist kein leichtes Thema.
Trotzdem absolut durchführbar!
Die o.g. Artikel hab ich einfach mal ausgewählt, um dir den Umfang und ein paar Möglichkeiten aufzuzeigen
https://voiceattack.com/ kann das. Du kannst damit sogar Scripte starten, zumindest nach kurzen Googeln hab ich was gesehen.
Ich will dich nicht einbremsen, aber das Thema Speech Recognition aka Spracherkennung ist kein leichtes Thema.
Trotzdem absolut durchführbar!
- https://github.com/mozilla/DeepSpeech
https://code.fb.com/ai-research/wav2letter/
https://medium.com/@rahulvaish/speech-t ... 7b510f06de
https://github.com/GoogleCloudPlatform/ ... oud-client
Die o.g. Artikel hab ich einfach mal ausgewählt, um dir den Umfang und ein paar Möglichkeiten aufzuzeigen
-
- User
- Beiträge: 4
- Registriert: Montag 18. März 2019, 20:45
-
- User
- Beiträge: 4
- Registriert: Montag 18. März 2019, 20:45
Dankeschön, dann habe ich ja für morgen was zum lesenTholo hat geschrieben: ↑Montag 18. März 2019, 21:43 Wieso möchtest du das von Grund auf "neu" machen, wenn es fertige Programme bereits abbilden.
https://voiceattack.com/ kann das. Du kannst damit sogar Scripte starten, zumindest nach kurzen Googeln hab ich was gesehen.
Ich will dich nicht einbremsen, aber das Thema Speech Recognition aka Spracherkennung ist kein leichtes Thema.
Trotzdem absolut durchführbar!Das sind so die Stichpunkte in der Thematik. Hatte mich da auch mal einlesen wollen. Aber das ganze ist ein Thema für sich...
- https://github.com/mozilla/DeepSpeech
https://code.fb.com/ai-research/wav2letter/
https://medium.com/@rahulvaish/speech-t ... 7b510f06de
https://github.com/GoogleCloudPlatform/ ... oud-client
Die o.g. Artikel hab ich einfach mal ausgewählt, um dir den Umfang und ein paar Möglichkeiten aufzuzeigen