Die Suche ergab 16 Treffer
- Montag 13. August 2018, 07:25
- Forum: Wissenschaftliches Rechnen
- Thema: "Elbow point" in kmeans
- Antworten: 2
- Zugriffe: 1073
Re: "Elbow point" in kmeans
Ich mache das Clustering auf meine Artikel um herauszufinden, welche unterschiedlichen Verläufe der Verkaufszahlen es gibt. Möglicherweise finde ich so Artikelgruppen, die ich noch gar nicht auf dem Schirm hatte.
- Donnerstag 9. August 2018, 11:49
- Forum: Wissenschaftliches Rechnen
- Thema: "Elbow point" in kmeans
- Antworten: 2
- Zugriffe: 1073
"Elbow point" in kmeans
Hallo, mein kmeans-Algorithmus funktioniert mittlerweile, nun möchte ich die optimale Anzahl an Clustern automatisch bestimmen. Man muss zunächst sagen, dass die Daten sehr ähnlich sind (Verkaufswerte) und die Silhouettenkoeffizienten sehr niedrig sind. Ich habe hier mal beispielhaft die inertia_-We...
- Donnerstag 19. Juli 2018, 08:07
- Forum: Wissenschaftliches Rechnen
- Thema: CSV mit doppelten Index-Werten
- Antworten: 2
- Zugriffe: 909
Re: CSV mit doppelten Index-Werten
Hallo, ich habe es jetzt erstmal so gelöst: data_extracted = data.groupby(['DATE','ARTICLENO'])['QUANTITY'].sum().unstack(fill_value=0) Dann sieht das ganze ungefähr so aus: ARTICLENO 430270868 43067075 4300678899 450678432 \ DATE 2014-06-30 0 1169 1114 450 2014-07-07 448 1169 806 436 2014-08-11 481...
- Mittwoch 18. Juli 2018, 13:38
- Forum: Wissenschaftliches Rechnen
- Thema: CSV mit doppelten Index-Werten
- Antworten: 2
- Zugriffe: 909
CSV mit doppelten Index-Werten
Hallo zusammen, mein Cluserting ist mittlerweilte ganz ansehnlich geworden, das einzige Problem dass ich noch habe ist das Einlesen der CSV. Dort gibt es für jede Artikelnummer eine gewisse Anzahl Datums zu denen Verkaufswerte vorliegen. Dabei kommt es zu folgenden Sachen: Es gibt mehere Werte zum g...
- Dienstag 17. Juli 2018, 07:31
- Forum: Wissenschaftliches Rechnen
- Thema: Pandas Dataframe 'falsch herum'
- Antworten: 3
- Zugriffe: 3575
Re: Pandas Dataframe 'falsch herum'
Hallo, ein kleines Problem hätte ich noch: Die prozentuale Änderung wird jetzt wie gewünscht von oben nach unten berechnet: https://drive.google.com/file/d/1I1nRajU3Sbhw_ECMuv3gV68gqeSbVGUF/view?usp=drivesdk Zahl oben ist die n-te Artikelnummer aus dem Datensatz, die Zahl links ist der n-te Verkaufs...
- Montag 16. Juli 2018, 11:25
- Forum: Wissenschaftliches Rechnen
- Thema: Pandas Dataframe 'falsch herum'
- Antworten: 3
- Zugriffe: 3575
Re: Pandas Dataframe 'falsch herum'
Dankeschön weißt du zufällig, wie der kmeans-Algorithmus aus dem sklearn-package arbeitet?
arbeitet der von 'oben nach unten' oder von 'links nach rechts'?
Mein Fehler, das wäre die viel wichtigere Frage : D
arbeitet der von 'oben nach unten' oder von 'links nach rechts'?
Mein Fehler, das wäre die viel wichtigere Frage : D
- Montag 16. Juli 2018, 08:21
- Forum: Wissenschaftliches Rechnen
- Thema: Pandas Dataframe 'falsch herum'
- Antworten: 3
- Zugriffe: 3575
Pandas Dataframe 'falsch herum'
Hallo zusammen, ich versuche mich immernoch an meinem Clustering. Aktuell lese ich eine CSV-Datei mit Verkaufszahlen ein. Das zugehörige Dataframe sieht dann so aus: 0 1 2 3 4 5 6 7 8 9 ... 40 41 \ 0 348 381 335 347 279 290 250 305 257 285 ... 442 451 1 1149 1169 1136 1148 903 756 745 966 887 811 .....
- Donnerstag 12. Juli 2018, 17:37
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Das sind die geplotteten Centers des kmeans. Auf der Y-Achse sind die normalisierten Verkaufsmengen, auf der X-Achse noch der Index im Dataframe. Sinn machen tut es nicht, da bei Verkaufsmengen keine Gerade herauskommen sollte (und anhand der CSV weiß ich, dass es auch nicht sein kann). Aktuell habe...
- Donnerstag 12. Juli 2018, 08:14
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Also ich habe jetzt mal deinen Ansatz von oben weiter verfolgt: import pandas as pd from sklearn import preprocessing from sklearn.cluster import KMeans from matplotlib import pyplot as plp df = pd.read_csv('download.csv', skipinitialspace=True, parse_dates=['DATE'], index_col=['DATE'], nrows=500) m...
- Mittwoch 11. Juli 2018, 09:21
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Ja, die Einträge in der Liste der vorhersagenden sind unter sich gleich lang, aber sie sind nicht immer gleich lang wie die Einträge im Dataframe, mit denen das Cluster erstellt wurde. Ich muss da dann mit null auffüllen. Der kmeans-Algorithmus verlangt (aufgrund der euklidschen Distanz) gleich lang...
- Mittwoch 11. Juli 2018, 07:52
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Hallo, es gibt für jeden Tag einen Eintrag, allerdings haben die "Listen" nicht die gleiche Länge (sprich gleiches Enddatum), da die Artikel teilweise nicht am selben Tag "gestartet" wurden. Wie kann ich dann eine Artikelnummer normalisieren, die vorhergesagt werden soll? Die bra...
- Dienstag 10. Juli 2018, 13:27
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Hallo, ja, aber ich hätte ungern "Nullspalten" im Dataframe, weil das im Clustering blöd wird. Eigentlich hätte ich ganz gerne, dass alle bei Null anfangen und dann der Index das Datum angibt (Da ich für jeden Tag einen Eintrag habe, sollte das gehen). So könnte ich später auch neue Produk...
- Dienstag 10. Juli 2018, 11:23
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Hallo, danke nochmal : ) deine neue Variante macht es dann so, dass in der ersten Spalte alle Einträge der ersten Artikelnummer stehen, die restlichen Werte haben in diesem Bereich den Wert 0. In der zweiten Spalte beginnen die Werte der zweiten Artikelnummer dann da, wo die erste endete + 1. Kann m...
- Dienstag 10. Juli 2018, 10:16
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Hallo, wenn ich das .values weglasse, sind die Mengen im kompletten modelling_dataframe 0.0. Es sieht dann so aus: 430070868 430070875 ... QUANTITY 0.0000 0.0000 ... QUANTITY 0.0000 0.0000 ... ... Insgesamt gibt es diese Zeilen zehnmal (es gibt zehn Einträge für Quantity, also sozusagen falscherhum,...
- Dienstag 10. Juli 2018, 09:19
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Re: Kmeans mit Daten aus CSV
Hallo, vielen Dank für die schnelle Antwort. Ja, die Einrückungen sind leider verloren gegangen. Ich habe dieses Codeschnippsel einfach angefangen und rumgespielt, bis es das getan hat was es soll, verzeih mir bitte : ) Dein Code wirft in Zeile 14 eine Fehlermeldung: AssertionError: 10 columns passe...
- Dienstag 10. Juli 2018, 07:05
- Forum: Wissenschaftliches Rechnen
- Thema: Kmeans mit Daten aus CSV
- Antworten: 15
- Zugriffe: 2478
Kmeans mit Daten aus CSV
Hallo zusammen, ich bin neu hier und auch neu in Python (aber Softwareentwickler in Java, es geht also nur um die Syntax ;) ) und habe ein Problem mit einem privaten Projekt. Ich möchte einen Kmeans-Algorithmus benutzen, um aus einer CSV-Datei mit Verkaufsstatistiken Muster zu erkennen. Hier mal ein...