Mit Hilfe von Vergleichsoperatoren Befehle sprachlich ausgeben

DerDeniz03 · Montag 18. März 2019, 21:08

Guten Abend,

Zunächst möchte ich noch sagen, dass ich sehr neu im Bezug auf Python bin und mich dementsprechend auch noch nicht so auskenne.

Mein mehr oder weniger kleines Projekt ist, dass ich eine Art von KI mit Hilfe von Python programmiere. Eine Art, weil es keine "richtige" KI ist, sondern nur Konkret bestimmte Befehle ausführt, wenn diese durch mich sprachlich zu stande kommen, also speech to text.

Danach wird mein gesprochenes Wort mit einer selbst geschriebenen Datenbank mit allen möglichen Befehlen geprüft.

Wenn es dann den richtigen Befehl gefunden hat, gibt es mit Hilfe von Text to speech das ganze wieder aus

Nochmal an einem Beispiel:

Ich sage "Hallo" --> Programm prüft Datenbank auf Befehl "Hallo" --> Gibt dann aus "Guten Tag"

Für mich ist es nicht wirklich wichtig, dass bei einem "Hi" beispielsweise nichts zurückkommt

Tholo · Montag 18. März 2019, 21:43

Wieso möchtest du das von Grund auf "neu" machen, wenn es fertige Programme bereits abbilden.
https://voiceattack.com/ kann das. Du kannst damit sogar Scripte starten, zumindest nach kurzen Googeln hab ich was gesehen.

Ich will dich nicht einbremsen, aber das Thema Speech Recognition aka Spracherkennung ist kein leichtes Thema.
Trotzdem absolut durchführbar!

https://github.com/mozilla/DeepSpeech
https://code.fb.com/ai-research/wav2letter/
https://medium.com/@rahulvaish/speech-t ... 7b510f06de
https://github.com/GoogleCloudPlatform/ ... oud-client

Das sind so die Stichpunkte in der Thematik. Hatte mich da auch mal einlesen wollen. Aber das ganze ist ein Thema für sich...
Die o.g. Artikel hab ich einfach mal ausgewählt, um dir den Umfang und ein paar Möglichkeiten aufzuzeigen

__deets__ · Montag 18. März 2019, 21:43

Und nun? Mir fehlt da die Frage. Was an diesem Problem ist dir unklar? Was hast du probiert?

DerDeniz03 · Montag 18. März 2019, 21:54

__deets__ hat geschrieben: ↑Montag 18. März 2019, 21:43 Und nun? Mir fehlt da die Frage. Was an diesem Problem ist dir unklar? Was hast du probiert?

Mit fehlt das ganze zwischen Eingabe und Ausgabe, also mit Hilfe eines Vergleichsoperators

DerDeniz03 · Montag 18. März 2019, 21:55

Tholo hat geschrieben: ↑Montag 18. März 2019, 21:43 Wieso möchtest du das von Grund auf "neu" machen, wenn es fertige Programme bereits abbilden.
https://voiceattack.com/ kann das. Du kannst damit sogar Scripte starten, zumindest nach kurzen Googeln hab ich was gesehen.

Ich will dich nicht einbremsen, aber das Thema Speech Recognition aka Spracherkennung ist kein leichtes Thema.
Trotzdem absolut durchführbar!
https://github.com/mozilla/DeepSpeech
https://code.fb.com/ai-research/wav2letter/
https://medium.com/@rahulvaish/speech-t ... 7b510f06de
https://github.com/GoogleCloudPlatform/ ... oud-client

Das sind so die Stichpunkte in der Thematik. Hatte mich da auch mal einlesen wollen. Aber das ganze ist ein Thema für sich...
Die o.g. Artikel hab ich einfach mal ausgewählt, um dir den Umfang und ein paar Möglichkeiten aufzuzeigen

Dankeschön, dann habe ich ja für morgen was zum lesen