Seite 1 von 1
Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 14:09
von meego
Kann man Python dazu verwenden? Falls nicht: Was wird dazu verwendet?
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 14:17
von BlackJack
@meego: Dazu installiert der Benutzer normalerweise Spracherkennungssoftware bei sich auf dem Rechner. Smartphones haben da oft schon was passendes vom Hersteller.
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 14:30
von meego
Bei Duolingo geht's über den Browser.
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 15:38
von BlackJack
Aus der FAQ: „Duolingo on the web requires the Adobe Flash plugin to accept speech input, so first ensure that you have Flash installed.“
Die schicken die Aufnahme also sehr wahrscheinlich zum Server und verarbeiten die da irgendwie.
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 16:12
von meego
Gibt es andere Möglichkeiten als Flash per Webbrowser? (Flash wird ja heute nicht mehr empfohlen.)
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 16:21
von Sirius3
@meego: da gibts ja was von Google oder Amazon, oder man macht das halt selbst:
da. Mikrofon ansprechen geht ja heutzutage bei den meisten Browsern per Javascript. Gibt es bestimmt auch schon fertige Anleitungen im Netz. Brauchst Du Hilfe beim Bedienen einer Suchmaschine?
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 16:45
von BlackJack
@meego: Es gibt zwar Möglichkeiten per JavaScript, die sind aber noch nicht standardisiert. Das heisst verschiedene Browser unterstützen verschieden viel von der API und nicht jeder stellt die Sachen unter den gleichen Namen zur Verfügung. Da müsste man sich also mindestens eine Abstraktionsbibliothek suchen (oder selber schreiben) und damit leben das nicht alle Browser(versionen) das dann auch können. Mit Flash hast Du da eine deutlich höhere Abdeckung und es funktioniert halt überall gleich.
Oder Du wartest bis die Web Audio API ein Standard geworden und den ganzen Browsern unterstützt wird.

Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 17:45
von DasIch
Die Web Audio API erlaubt dir auch nur Aufnahmen zu machen und diese zu verarbeiten. Speech Recognition bekommst du damit nicht und es scheint mir dass möchtest du haben. Zum einen haben sich Betriebssysteme dies ohnehin zur Aufgabe gemacht und damit macht es wenig Sinn dies nochmal zu implementieren, zum anderen ist dass ein sehr komplexes Problem und es braucht riesige Ressourcen um es zu lösen. Wenn du nicht Apple, Google oder Microsoft bist hast du diese Ressourcen wahrscheinlich nicht und wirst daran nicht herankommen und dass ist die optimistische Perspektive, realistisch ist dass du vollkommen versagst.
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 22:29
von meego
War das mit der Web Audio API und der Verbindung mit dem Wort Standard jetzt eine realistische Aussage oder eine Scherzhafte?
Was macht denn die verlinkte Python Library? Sendet die den ganzen Audiokram nur zur Verarbeitung an die APIs von Dritten? Gibt's in der Linuxwelt auch eine Anstrengung für diese Aufgabe oder bleibt das den genannten üblichen Verdächtigen vorbehalten?
Re: Userinput per Sprache über den Browser
Verfasst: Mittwoch 19. Oktober 2016, 23:02
von BlackJack
@meego: Ich denke schon das sich in der Richtung was weiterentwickeln wird, denn letztendlich wollen doch so einige Flash endlich beerdigen. Selbst Adobe.
Wie DasIch schon sagte: Spracherkennung ist nicht leicht. Alle die das *gut* machen, haben da fette Server hinter stehen, und auch sonst ordentlich Ressourcen. Oder sie sind Jahrzehnte im Geschäft und haben dadurch Erfahrung und Ressourcen.
Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 10:17
von meego
@B: Danke für die Infos. Dann sieht es für die Linuxwelt wohl düster aus, angenommen, die neuste These von Conversation as an interface ist wahr.
Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 10:33
von BlackJack
@meego: Wieso das? Es gibt doch die Lösungen in der Cloud, die auch von Windows und MacOS verwendet werden. Es sieht insgesamt eher düster für die Privatsphäre aus wenn die These stimmt, weil die Leute dann freiwillig aktiv auch was sie in ihren vier Wänden sprechen an die NSA liefern.

Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 10:39
von Sirius3
@meego: ich hab Dir doch einen Link zu einem Paket gegeben, wo auch ein Interface zu einer Offline-Speech-Recognition-Library existiert. Für Linux. Du mußt das halt selbst auf Deine Sprache trainieren.
Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 11:51
von meego
BlackJack hat geschrieben:Es sieht insgesamt eher düster für die Privatsphäre aus wenn die These stimmt, weil die Leute dann freiwillig aktiv auch was sie in ihren vier Wänden sprechen an die NSA liefern.

Eben.

Siri nutzt eine Cloud-Lösung?
Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 11:58
von BlackJack
@meego: Siri schickt die Audiodaten der Frage an Apple-Server. Erst dort wird Text daraus gemacht. Eventuell werden die Daten auf dem Client schon vorverarbeitet, aber Apple will ja Daten sammeln um die Spracherkennung immer besser zu trainieren. Allgemein, und natürlich auch für den individuellen Anwender. Das dürfte auch für die anderen Anbieter (Amazon, Google, Microsoft, …) gelten.
Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 13:25
von meego
Sehr interessant. Ich hoffe, die freie Welt findet doch noch eine Antwort darauf.
Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 13:42
von BlackJack
@meego: Na klar: Spracheingabe ist ja noch schlimmer als Klickibunti! Verwende gefälligst die Konsole.

Re: Userinput per Sprache über den Browser
Verfasst: Donnerstag 20. Oktober 2016, 15:35
von meego
@B: Ich hole bald meine Bashreferenz ab.

Aber die Masse wird sich leider von der Konsole nicht beeindrucken lassen.