ich bräuchte mal ein paar Denkanstöße und würde mich über einen interessanten Austausch freuen. Ich versuche mich aktuell an einer Machine Learning Lösung.
Zunächst einmal hier beispielhaft ein Ausschnitt aus dem Dataframe.
row | Aufgabe | Abteilung | Unterabteilung | Kosten
0 | 1 | Abteilung 1 | Team 1 | Ja
1 | 1 | Abteilung 1 | Team 2 | Ja
2 | 1 | Abteilung 3 | Team 5 | Nein
3 | 2 | Abteilung 2 | Team 3| Ja
4 | 3 | Abteilung 1 | Team 1 | Ja
5 | 3 | Abteilung 3 | Team 1 | Ja
Info: Abteilung 1: Team 1 ist nicht identisch mit Abteilung 3 : Team 1. Alle Unterabteilungen sind also verschieden.
Die Abteilungen werden den Aufgaben bislang manuell zugeteilt. Ich möchte nun herausfinden, ob man voraussagen kann, welche Abteilungen + Unterabteilungen betroffen sein werden.
Ich habe mir überlegt, dass ich die Abteilungen aggregiere und die Unterabteilungen.. Ich weiß aber nicht, ob das dann nicht etwas Overkill ist, denn die Daten muss ich ja anschließend auch weiterbearbeiten. Also hätte ich ja ein DF wie folgt:
row | Aufgabe | Abteilung | Unterabteilung | Kosten
0 | 1 | Abteilung 1: Team 1, Team 2 ; Abteilung 3: Team 5 | Ja, Ja, Nein
1 | 2 | Abteilung 2: Team 3 | Ja
2 | 3| Abteilung 1: Team 1, Abteilung 3: Team 1 | Ja, Ja
und dann fängts ja schon an, wie kann ich die Daten nun weiterverwenden, gar nicht mal so schön....also wohl nicht so klug?
Aber welche Möglichkeiten hätte ich denn sonst? Habt ihr Tipps?
Auf jeden Fall muss ich ja eine Gesamtbetrachtung für jede Aufgabe (kann wie eine ID gesehen werden) hinbekommen?
Irgendwie steh ich da grad wohl aufm Schlauch....Oder ist es tatsächlich nicht so einfach
