Syntax Fehler Html

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
Assassin4711
User
Beiträge: 77
Registriert: Mittwoch 8. September 2021, 14:22

Hi Ihr Foren Mitglieder,

kann mir einer sagen was ich hier genau falsch läuft:

Traceback (most recent call last):
File "C:\Users\damat\Desktop\PythonProject\FinalScraper.py", line 9, in <module>
from functions import *
File "C:\Users\damat\Desktop\PythonProject\functions.py", line 20, in <module>
from create_clean_table import *
File "C:\Users\damat\Desktop\PythonProject\create_clean_table.py", line 1
<!DOCTYPE html>
^
SyntaxError: invalid syntax

Ich habe mir die einzeln .py von github heruntergeladen und versuche diese jetzt mit python 3.9.7 ans Laufen zu bringen. Bis dato mit noch sehr geringem Erfolg. Ziel ist es die Seite Oddsportal zu scrapen. Ich hangel mich jetzt quasi von Fehler zu Fehler und habe irgendwie das Gefühl als wäre der Scraper mit einer älteren Version von Python erstellt worde.

Es geht hierbei um den ScrapeOP von Seb943.

Kann mir ggfs. einer von euch helfen? Ich bin komplett neu bei python und habe bis dato nur mit VB programmiert.

Viele Grüße und DANKE
Dirk
__deets__
User
Beiträge: 14523
Registriert: Mittwoch 14. Oktober 2015, 14:29

Das ist HTML. Und nicht Python. Du hast da also das falsche abgespeichert.
Assassin4711
User
Beiträge: 77
Registriert: Mittwoch 8. September 2021, 14:22

############ Final oddsportal scraper

# ATP, baseball, basket, darts, eSports, football, nfl, nhl, rugby
''' Create 4 main functions : scrape_historical, scrape_specific_season, scrape current_season, scrape_next_games
NB : You need to be in the right repository to import functions...'''
import os

#os.chdir("C:\\Users\\damat\\Desktop\\WebScraping")
from functions import *

print('Data will be saved in the following directory:', os.getcwd())


scrape_oddsportal_historical(sport = 'soccer', country = 'france', league = 'ligue-1', start_season = '2010-2011', nseasons = 5, current_season = 'yes', max_page = 25)
scrape_oddsportal_current_season(sport = 'soccer', country = 'finland', league = 'veikkausliiga', season = '2020', max_page = 25)
scrape_oddsportal_specific_season(sport = 'soccer', country = 'finland', league = 'veikkausliiga', season = '2019', max_page = 25)
scrape_oddsportal_next_games(sport = 'tennis', country = 'germany', league = 'exhibition-bett1-aces-berlin-women', season = '2020')

so lautet der Code für die FinalScraper.py datei ... Das doch kein html, oder?


Kann ich irgendwie die 4 Dateien anhängen?
narpfel
User
Beiträge: 644
Registriert: Freitag 20. Oktober 2017, 16:10

@Assassin4711: Der Fehler tritt in `create_clean_table.py` auf.

Wenn du Code von GitHub benutzen willst, solltest du entweder einen Klon mit `git` machen oder die Option „Download as ZIP“ im grünen „Code“-Knopf auswählen, dann lädst du nicht aus Versehen HTML-Dateien herunter.
Assassin4711
User
Beiträge: 77
Registriert: Mittwoch 8. September 2021, 14:22

narpfel hat geschrieben: Mittwoch 8. September 2021, 15:52 @Assassin4711: Der Fehler tritt in `create_clean_table.py` auf.

Wenn du Code von GitHub benutzen willst, solltest du entweder einen Klon mit `git` machen oder die Option „Download as ZIP“ im grünen „Code“-Knopf auswählen, dann lädst du nicht aus Versehen HTML-Dateien herunter.
Ah das war ein guter Hinweis ... da habe ich wirlich was falsch runtergelden. jetzt läuft es schon einen tick weiter und ich habe NUR noch folgende Fehler:

We start to collect season 2010-2011
We start to scrape the page n°1
Traceback (most recent call last):
File "C:\Users\damat\AppData\Local\Programs\Python\Python39\lib\site-packages\selenium\webdriver\common\service.py", line 72, in start
self.process = subprocess.Popen(cmd, env=self.env,
File "C:\Users\damat\AppData\Local\Programs\Python\Python39\lib\subprocess.py", line 951, in __init__
self._execute_child(args, executable, preexec_fn, close_fds,
File "C:\Users\damat\AppData\Local\Programs\Python\Python39\lib\subprocess.py", line 1420, in _execute_child
hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: [WinError 2] Das System kann die angegebene Datei nicht finden

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "C:\Users\damat\Desktop\PythonProject\scrapeOP-master\FinalScraper.py", line 14, in <module>
scrape_oddsportal_historical(sport = 'soccer', country = 'france', league = 'ligue-1', start_season = '2010-2011', nseasons = 5, current_season = 'yes', max_page = 25)
File "C:\Users\damat\Desktop\PythonProject\scrapeOP-master\functions.py", line 1329, in scrape_oddsportal_historical
df = scrape_league_typeC(Season = start_season, sport = sport, country1 = country, tournament1 = league, nseason = nseasons, current_season = 'yes', max_page = max_page)
File "C:\Users\damat\Desktop\PythonProject\scrapeOP-master\functions.py", line 891, in scrape_league_typeC
scrape_current_tournament_typeC(sport = sport, tournament = tournament1, country = country1, SEASON = SEASON1, max_page = max_page)
File "C:\Users\damat\Desktop\PythonProject\scrapeOP-master\functions.py", line 789, in scrape_current_tournament_typeC
driver = webdriver.Chrome(executable_path = DRIVER_LOCATION)
File "C:\Users\damat\AppData\Local\Programs\Python\Python39\lib\site-packages\selenium\webdriver\chrome\webdriver.py", line 73, in __init__
self.service.start()
File "C:\Users\damat\AppData\Local\Programs\Python\Python39\lib\site-packages\selenium\webdriver\common\service.py", line 81, in start
raise WebDriverException(
selenium.common.exceptions.WebDriverException: Message: 'chromedriver1.exe' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org ... river/home

Hab ich da generell was falsch gemacht oder liegt es ggfs. einfach an den Daten die ich abfragen will?

VG

Dirk
narpfel
User
Beiträge: 644
Registriert: Freitag 20. Oktober 2017, 16:10

@Assassin4711: Was verstehst du denn an der Fehlermeldung nicht? Die sagt ja sehr deutlich, was gemacht werden muss, und linkt zu einer Seite, wo die Lösung beschrieben wird.
Assassin4711
User
Beiträge: 77
Registriert: Mittwoch 8. September 2021, 14:22

narpfel hat geschrieben: Mittwoch 8. September 2021, 16:29 @Assassin4711: Was verstehst du denn an der Fehlermeldung nicht? Die sagt ja sehr deutlich, was gemacht werden muss, und linkt zu einer Seite, wo die Lösung beschrieben wird.
ja hatte die Zeile vergessen zu ändern ... jetzt läuft es schonmal weiter und ich bekomme auch schon Ergebnisse

Danke dir schonmal ...
Antworten