Seite 1 von 1

IndexError: list index out of range

Verfasst: Montag 6. Juli 2020, 10:13
von samed06
Hi
Also ich bekomme diesen fehler: IndexError: list index out of range
und ich bin am ende ich habe vieles versucht aber es hat nichts gebracht deswegen frage ich euch jetzt um hilfe.

Code: Alles auswählen

import pytesseract
from PIL import Image

import urllib.request
import urllib.parse
import re

lang = 'tur+ger'

img = Image.open('1.jpg')

print(img)
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
result = pytesseract.image_to_string(img)
print(result)


query_string = urllib.parse.urlencode({"search_query" : result})
html_content = urllib.request.urlopen("http://www.youtube.com/results?" + query_string)
search_results = re.findall(r'href=\"\/watch\?v=(.{11})', html_content.read().decode())
print ("http://www.youtube.com/watch?v=" + search_results[0])
ich bedanke mich schonmal im voraus.

Re: IndexError: list index out of range

Verfasst: Montag 6. Juli 2020, 10:48
von __deets__
Bitte den vollständigen Fehler zeigen, sonst muss man raten.

Re: IndexError: list index out of range

Verfasst: Montag 6. Juli 2020, 11:07
von sparrow
Und wenn ich raten müsste: search_results hat keinen Inhalt, sprich der reguläre Ausdruck wird nicht fündig und search_results ist eine leere Liste.
Reguläre Ausdrücke zu benutzen um in HTML-Dokumenten etwas zu finden, sollte man nicht tun. Dafür bieten sich Parser wie BeatifulSoup an.

Re: IndexError: list index out of range

Verfasst: Montag 6. Juli 2020, 11:39
von samed06
ups

Traceback (most recent call last):

File "C:/Users/samyp/PycharmProjects/youtube/ocr.py", line 21, in <module>

print ("http://www.youtube.com/watch?v=" + search_results[0])

IndexError: list index out of range

Re: IndexError: list index out of range

Verfasst: Montag 6. Juli 2020, 11:42
von Jankie
Dann schau mal nach ob in search_results das drin ist was du erwartest. Trotzdem würde ich dir - wie sparrow auch - dazu raten bs4 zu nutzen, das erleichtert einiges.

Re: IndexError: list index out of range

Verfasst: Montag 6. Juli 2020, 12:24
von samed06
gut dann werde ich noch einwenig dran arbeiten
habe ja genug zeit ;-)
und natürlich das bs4 dafür benutzen.