Installieren von Deepparse

Probleme bei der Installation?
Antworten
Kai'Sa
User
Beiträge: 5
Registriert: Dienstag 2. August 2022, 19:18

Hallo Leute,

Ich möchte aus einer E-Mail Signatur Adressinformationen wie z.b.: Straße, Hausnr usw. rausfiltern.

Auf der Suche nach einer passenden Bibliothek bin ich nach etwas Recherche dann auf die Bib "Deepparse" gestoßen.

https://pypi.org/project/deepparse/

Die Bibliothek ist desshalb so interessant, weil Sie scheinbar auch für Deutsche Adressen anwendbar ist.
Nun wollte ich mir die Bibliothek runterladen um mit dieser etwas zumzuspielen und zu sehen ob sich die Bib auch dafür eignet.

Um "Deepparse" zu installieren benötige ich vorerst die "latest version of PyTorch and Python >= 3.7."

https://pytorch.org/get-started/locally/

Habe mir dann erstmals mit:

"conda install pytorch torchvision torchaudio cpuonly -c pytorch"

PyTorch installiert und geschaut ob ich die Pakete auch importieren kann. Soweit so gut.
Nun versuche ich dasselbe mit Deepparse.
Leider erscheint nach eingabe von: "pip install deepparse" die Folgende Fehlermeldung:

Code: Alles auswählen

Collecting deepparse
  Using cached deepparse-0.8.2-py3-none-any.whl (195 kB)
Collecting gensim>=4.0.0
  Using cached gensim-4.2.0-cp310-cp310-win_amd64.whl (23.9 MB)
Collecting bpemb
  Using cached bpemb-0.3.3-py3-none-any.whl (19 kB)
Requirement already satisfied: requests in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from deepparse) (2.28.1)
Requirement already satisfied: numpy in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from deepparse) (1.23.1)   
Collecting pandas
  Using cached pandas-1.4.3-cp310-cp310-win_amd64.whl (10.5 MB)
Collecting fasttext
  Using cached fasttext-0.9.2.tar.gz (68 kB)
  Preparing metadata (setup.py) ... done
Collecting poutyne
  Using cached Poutyne-1.12-py3-none-any.whl (211 kB)
Collecting pymagnitude-light
  Using cached pymagnitude_light-0.1.147-py3-none-any.whl (35 kB)
Requirement already satisfied: torch in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from deepparse) (1.12.0)
Collecting smart-open>=1.8.1
  Using cached smart_open-6.0.0-py3-none-any.whl (58 kB)
Collecting scipy>=0.18.1
  Using cached scipy-1.9.0-cp310-cp310-win_amd64.whl (38.6 MB)
Collecting Cython==0.29.28
  Using cached Cython-0.29.28-py2.py3-none-any.whl (983 kB)
Collecting sentencepiece
  Using cached sentencepiece-0.1.96-cp310-cp310-win_amd64.whl (1.1 MB)
Collecting tqdm
  Using cached tqdm-4.64.0-py2.py3-none-any.whl (78 kB)
Collecting pybind11>=2.2
  Using cached pybind11-2.10.0-py3-none-any.whl (213 kB)
Requirement already satisfied: setuptools>=0.7.0 in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from fasttext->deepparse) (58.1.0)
Collecting pytz>=2020.1
  Using cached pytz-2022.1-py2.py3-none-any.whl (503 kB)
Collecting python-dateutil>=2.8.1
  Using cached python_dateutil-2.8.2-py2.py3-none-any.whl (247 kB)
Collecting torchmetrics
  Using cached torchmetrics-0.9.3-py3-none-any.whl (419 kB)
Collecting xxhash>=1.0.1
  Using cached xxhash-3.0.0-cp310-cp310-win_amd64.whl (29 kB)
Collecting fasteners>=0.14.1
  Using cached fasteners-0.17.3-py3-none-any.whl (18 kB)
Collecting lz4>=1.0.0
  Using cached lz4-4.0.2-cp310-cp310-win_amd64.whl (98 kB)
Requirement already satisfied: idna<4,>=2.5 in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from requests->deepparse) (3.3)
Requirement already satisfied: charset-normalizer<3,>=2 in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from requests->deepparse) (2.1.0)
Requirement already satisfied: urllib3<1.27,>=1.21.1 in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from requests->deepparse) (1.26.11)
Requirement already satisfied: certifi>=2017.4.17 in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from requests->deepparse) (2022.6.15)
Requirement already satisfied: typing-extensions in c:\users\emir9\appdata\local\programs\python\python310\lib\site-packages (from torch->deepparse) (4.3.0)
Collecting six>=1.5
  Using cached six-1.16.0-py2.py3-none-any.whl (11 kB)
Collecting packaging
  Using cached packaging-21.3-py3-none-any.whl (40 kB)
Collecting colorama
  Using cached colorama-0.4.5-py2.py3-none-any.whl (16 kB)
Collecting pyparsing!=3.0.5,>=2.0.2
  Using cached pyparsing-3.0.9-py3-none-any.whl (98 kB)
Using legacy 'setup.py install' for fasttext, since package 'wheel' is not installed.
Installing collected packages: sentencepiece, pytz, xxhash, smart-open, six, scipy, pyparsing, pybind11, lz4, fasteners, Cython, colorama, tqdm, python-dateutil, pymagnitude-light,
 packaging, gensim, fasttext, torchmetrics, pandas, bpemb, poutyne, deepparse
  Running setup.py install for fasttext ... error
  error: subprocess-exited-with-error

  × Running setup.py install for fasttext did not run successfully.
  │ exit code: 1
  ╰─> [20 lines of output]
      C:\Users\Emir9\AppData\Local\Programs\Python\Python310\lib\site-packages\setuptools\dist.py:717: UserWarning: Usage of dash-separated 'description-file' will not be supported
 in future versions. Please use the underscore name 'description_file' instead
      building 'fasttext_pybind' extension
      error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/
      [end of output]

  note: This error originates from a subprocess, and is likely not a problem with pip.
error: legacy-install-failure

× Encountered error while trying to install package.
╰─> fasttext

note: This is an issue with the package mentioned above, not pip.
hint: See above for output from the failure.
Nun hab ich mir gedacht es liegt an dem Microsoft Visual C++ und hab dies über Folgende Webseite runtergeladen:

https://docs.microsoft.com/en-us/cpp/wi ... w=msvc-170

Rechner neu gestartet, jedoch wieder das Gleiche Problem.


Ich benutze PyCharm und habe mir auch Anaconda runtergeladen um es dort zu probieren. Ohne Erfolg.
Habe auch verschiedene Interpreter benutz: Python3.8 und die Aktuellste version 3.10 jedoch ohne erfolg.

Dies ist mein erster Post hier auf dem Forum und ich hoffe, ich habe mein Problem ausführlich geschildert.
Falls nicht, freue ich mich über feedback :)

Es kann natürlich auch sein dass ich die ganze Sache komplett falsch angehe.

Ich freue mich über jede Nachricht.
Grüßle :D
Benutzeravatar
__blackjack__
User
Beiträge: 10669
Registriert: Samstag 2. Juni 2018, 10:21
Wohnort: 127.0.0.1
Kontaktdaten:

Die interessante Zeile in der Ausgabe dürfte diese hier sein:
Using legacy 'setup.py install' for fasttext, since package 'wheel' is not installed.
Ich würde erst einmal das `wheel`-Package installieren und schauen, ob die Installation dann auch ohne selbst kompilieren von Modulen, die in C geschrieben sind, funktioniert.
„With the neutron bomb, which destroys life but not property, capitalism has found the weapon of its dreams.” — Edward Abbey
Kai'Sa
User
Beiträge: 5
Registriert: Dienstag 2. August 2022, 19:18

Hmm also bei ausführung von "pip install wheel"
kommt bloß:

Requirement already satisfied: wheel in c:\users\emir9\onedrive\desktop\python_projekte\teetasse\venv\lib\site-packages (0.37.1)
(Hab alles in einer neuen virtuellen umgebung probiert, daher der neue Pfad)

und bei wiederholter Installation von Deepparse dieselbe Fehlermeldung.

Weiß aber auch nicht was du genau meinst mit "ohne selbst kompilieren von Modulen, die in C geschrieben sind"
__deets__
User
Beiträge: 12289
Registriert: Mittwoch 14. Oktober 2015, 14:29

Na schau doch mal in deine Fehlermeldungen. Die sagt das doch klar, dass da ein Microsoft Compiler fehlt. Mit Angabe eines Links, woher man den bekommt. Weil da was gebaut werden soll.
Sirius3
User
Beiträge: 16232
Registriert: Sonntag 21. Oktober 2012, 17:20

In der Paket-Dokumentation steht, wie das Paket für MacOS und Linux übersetzt werden kann. Ob das überhaupt unter Windows lauffähig ist, ist also nicht klar. Und wenn, dann wahrscheinlich nur, wenn man viel Ahnung davon hat, wie man C-Pakete unter Windows zum Laufen bringen kann.
Wenn Du darin Erfahrung hast, kannst Du das weiter verfolgen, ansonsten würde ich Dir empfehlen, eine andere Bibliothek für Dein Problem zu suchen oder auf Linux umzusteigen.
Kai'Sa
User
Beiträge: 5
Registriert: Dienstag 2. August 2022, 19:18

@_deets_ - hab ich bereits gemacht, steht aber auch in meiner Frage.

@Sirius3 - Hmm okay ja gut ich versuchs mal in einer VM oder schaue mich nach einer anderen lösung um.

Danke :)
__deets__
User
Beiträge: 12289
Registriert: Mittwoch 14. Oktober 2015, 14:29

@Kai'Sa: ah, verzeih - das habe ich nicht gesehen. Der Tipp waere dann anaconda, wenn das nicht klappt, dann sieht's mau aus unter Windows (ohne das man viel Arbeit reinsteckt).
Kai'Sa
User
Beiträge: 5
Registriert: Dienstag 2. August 2022, 19:18

Unter anaconda funktioniert es leider auch nicht ^^ ich probier mir evtl einen eigenen Parser zu bauen mal sehen wie das klappt haha

Trotzdem vielen dank :)
Benutzeravatar
Dennis89
User
Beiträge: 524
Registriert: Freitag 11. Dezember 2020, 15:13

Hallo,
Kai'Sa hat geschrieben: Mittwoch 3. August 2022, 15:25 [...] ich versuchs mal in einer VM oder schaue mich nach einer anderen lösung um.
Wenn du Linux unter Windows nutzen willst, könntest du dir folgenden Link mal anschauen:
https://ubuntu.com/wsl


Grüße
Dennis
“A ship is always safe at the shore, but that is not what it is built for.”
Kai'Sa
User
Beiträge: 5
Registriert: Dienstag 2. August 2022, 19:18

Cool danke :)
Antworten