ich arbeite an meiner Bachelorarbeit und habe eine Excel-Datei mit ca. 11.000 Unternehmensnamen. Ziel ist es, jedem Unternehmen automatisiert eine passende Branche und ggf. Unterbranche (z. B. über den NACE-Code) zuzuordnen.
Aktuell habe ich nur die Unternehmensnamen, keine weiteren Informationen. Meine Idee ist, mithilfe von Python und einer API (z. B. OpenCorporates) oder ähnlichen Tools die Brancheninformationen abzurufen und die Tabelle so zu ergänzen:
Unternehmensname Branche Unterbranche
Siemens AG 27 – Herstellung von Maschinen 27.1 – Elektrotechnik
Deutsche Bank AG 64 – Finanzdienstleistungen 64.1 – Banken
Die Haupthürde besteht darin, allen 11.000 Unternehmen effizient und korrekt den NACE-Code und die Branche zuzuordnen. Da ich einen Business-Hintergrund habe, fehlt mir die technische Expertise für die Umsetzung.
Ich suche nach Ansätzen, um das Problem möglichst automatisiert zu lösen – sei es über APIs, externe Datenbanken oder andere Tools. Über Tipps und Unterstützung wäre ich sehr dankbar!
Ich kann hier leider keine files anhängen, deswegen falls mir wer gerne helfen würde... discord: manoskananos