zwei mögliche wege zur besseren übersetzung von text to speech
Verfasst: Donnerstag 10. März 2022, 23:47
heyho. ich habe letztens erst ein speech to text skript mit anschliesender übersetzung geschrieben. dies tut auch seine arbeit nur gibt es dabei eine verzögerung von speechReocgnition da es nicht permanent aufnehmen und schreiben kann. dies führt zu einer aufnahme lücke zwischen der spracherkennung ud dem ausgeben des textes. und da es eig in echtzeit die "untertitel" auspucken soll, weil ich es dafür geschrieben habe, habe ich mir überlegt es abzuändern. in der theorie wollte ich von einer website, die sprachditkierung macht und dabei viel schneller und akkurater ist, die stimme erkennen lassen und per beatuifulsoup den text kopieren, übersetzen und wieder ausspucken lassen. soweit so gut. das wollte ich machen und es funtkioniert theoretisch auch. es nimmt halt nur die html datei von neuem und greift somit nicht auf den text zu der schon ausgeschrieben wurde auf der html die ich schon geöffnet habe. deswegen habe ich mir jetzt überlegt ein Screen-Capturing programm zsm mit pytesseract laufen zu lassen. die frage ist hierbei wäre das hilfreicher oder genauso langsam? habt ihr lösungenzu meinem problem mit beautifulsoup und wenn ja was wäre sinvoller und weniger zeitauwändiger? und falls ihr lösungen zum grundliegendem problem habt, freue ich mich auch über diese. (der beautifulsoup code ist noch nicht zu ende gemacht aber wenn es sich nicht lohnt brauch ich mir die mühe auch nicht zu machen deswegen frag ich hier nach. ich denke als verständnis was ich mache reicht es)(der erste skript ist die eig spracherkennung die langsam ist und das zweite skript ist der anfang meiner bs methode)
Code: Alles auswählen
import speech_recognition
#import pyttsx3
from googletrans import Translator
recognizer = speech_recognition.Recognizer()
translator = Translator()
while True:
try:
with speech_recognition.Microphone() as source:
recognizer.adjust_for_ambient_noise(source, duration=0.2)
audio = recognizer.record(source, 3)
#audio = recognizer.listen(source,2)
text1 = recognizer.recognize_google(audio, language="de-DE")
text = text1.lower()
translation = translator.translate(text, dest='en')
print(translation.text)
except Exception as e:
continue
Code: Alles auswählen
from bs4 import BeautifulSoup
import requests
url = f'https://www.textfromtospeech.com/de/voice-to-text/'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
panel = soup.find('div' ,attrs={'class':'panel-body'})
print(panel)