Die Suche ergab 16 Treffer

von Seppl2202
Montag 13. August 2018, 07:25
Forum: Wissenschaftliches Rechnen
Thema: "Elbow point" in kmeans
Antworten: 2
Zugriffe: 1068

Re: "Elbow point" in kmeans

Ich mache das Clustering auf meine Artikel um herauszufinden, welche unterschiedlichen Verläufe der Verkaufszahlen es gibt. Möglicherweise finde ich so Artikelgruppen, die ich noch gar nicht auf dem Schirm hatte.
von Seppl2202
Donnerstag 9. August 2018, 11:49
Forum: Wissenschaftliches Rechnen
Thema: "Elbow point" in kmeans
Antworten: 2
Zugriffe: 1068

"Elbow point" in kmeans

Hallo, mein kmeans-Algorithmus funktioniert mittlerweile, nun möchte ich die optimale Anzahl an Clustern automatisch bestimmen. Man muss zunächst sagen, dass die Daten sehr ähnlich sind (Verkaufswerte) und die Silhouettenkoeffizienten sehr niedrig sind. Ich habe hier mal beispielhaft die inertia_-We...
von Seppl2202
Donnerstag 19. Juli 2018, 08:07
Forum: Wissenschaftliches Rechnen
Thema: CSV mit doppelten Index-Werten
Antworten: 2
Zugriffe: 899

Re: CSV mit doppelten Index-Werten

Hallo, ich habe es jetzt erstmal so gelöst: data_extracted = data.groupby(['DATE','ARTICLENO'])['QUANTITY'].sum().unstack(fill_value=0) Dann sieht das ganze ungefähr so aus: ARTICLENO 430270868 43067075 4300678899 450678432 \ DATE 2014-06-30 0 1169 1114 450 2014-07-07 448 1169 806 436 2014-08-11 481...
von Seppl2202
Mittwoch 18. Juli 2018, 13:38
Forum: Wissenschaftliches Rechnen
Thema: CSV mit doppelten Index-Werten
Antworten: 2
Zugriffe: 899

CSV mit doppelten Index-Werten

Hallo zusammen, mein Cluserting ist mittlerweilte ganz ansehnlich geworden, das einzige Problem dass ich noch habe ist das Einlesen der CSV. Dort gibt es für jede Artikelnummer eine gewisse Anzahl Datums zu denen Verkaufswerte vorliegen. Dabei kommt es zu folgenden Sachen: Es gibt mehere Werte zum g...
von Seppl2202
Dienstag 17. Juli 2018, 07:31
Forum: Wissenschaftliches Rechnen
Thema: Pandas Dataframe 'falsch herum'
Antworten: 3
Zugriffe: 3568

Re: Pandas Dataframe 'falsch herum'

Hallo, ein kleines Problem hätte ich noch: Die prozentuale Änderung wird jetzt wie gewünscht von oben nach unten berechnet: https://drive.google.com/file/d/1I1nRajU3Sbhw_ECMuv3gV68gqeSbVGUF/view?usp=drivesdk Zahl oben ist die n-te Artikelnummer aus dem Datensatz, die Zahl links ist der n-te Verkaufs...
von Seppl2202
Montag 16. Juli 2018, 11:25
Forum: Wissenschaftliches Rechnen
Thema: Pandas Dataframe 'falsch herum'
Antworten: 3
Zugriffe: 3568

Re: Pandas Dataframe 'falsch herum'

Dankeschön :) weißt du zufällig, wie der kmeans-Algorithmus aus dem sklearn-package arbeitet?
arbeitet der von 'oben nach unten' oder von 'links nach rechts'?
Mein Fehler, das wäre die viel wichtigere Frage : D
von Seppl2202
Montag 16. Juli 2018, 08:21
Forum: Wissenschaftliches Rechnen
Thema: Pandas Dataframe 'falsch herum'
Antworten: 3
Zugriffe: 3568

Pandas Dataframe 'falsch herum'

Hallo zusammen, ich versuche mich immernoch an meinem Clustering. Aktuell lese ich eine CSV-Datei mit Verkaufszahlen ein. Das zugehörige Dataframe sieht dann so aus: 0 1 2 3 4 5 6 7 8 9 ... 40 41 \ 0 348 381 335 347 279 290 250 305 257 285 ... 442 451 1 1149 1169 1136 1148 903 756 745 966 887 811 .....
von Seppl2202
Donnerstag 12. Juli 2018, 17:37
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Das sind die geplotteten Centers des kmeans. Auf der Y-Achse sind die normalisierten Verkaufsmengen, auf der X-Achse noch der Index im Dataframe. Sinn machen tut es nicht, da bei Verkaufsmengen keine Gerade herauskommen sollte (und anhand der CSV weiß ich, dass es auch nicht sein kann). Aktuell habe...
von Seppl2202
Donnerstag 12. Juli 2018, 08:14
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Also ich habe jetzt mal deinen Ansatz von oben weiter verfolgt: import pandas as pd from sklearn import preprocessing from sklearn.cluster import KMeans from matplotlib import pyplot as plp df = pd.read_csv('download.csv', skipinitialspace=True, parse_dates=['DATE'], index_col=['DATE'], nrows=500) m...
von Seppl2202
Mittwoch 11. Juli 2018, 09:21
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Ja, die Einträge in der Liste der vorhersagenden sind unter sich gleich lang, aber sie sind nicht immer gleich lang wie die Einträge im Dataframe, mit denen das Cluster erstellt wurde. Ich muss da dann mit null auffüllen. Der kmeans-Algorithmus verlangt (aufgrund der euklidschen Distanz) gleich lang...
von Seppl2202
Mittwoch 11. Juli 2018, 07:52
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Hallo, es gibt für jeden Tag einen Eintrag, allerdings haben die "Listen" nicht die gleiche Länge (sprich gleiches Enddatum), da die Artikel teilweise nicht am selben Tag "gestartet" wurden. Wie kann ich dann eine Artikelnummer normalisieren, die vorhergesagt werden soll? Die bra...
von Seppl2202
Dienstag 10. Juli 2018, 13:27
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Hallo, ja, aber ich hätte ungern "Nullspalten" im Dataframe, weil das im Clustering blöd wird. Eigentlich hätte ich ganz gerne, dass alle bei Null anfangen und dann der Index das Datum angibt (Da ich für jeden Tag einen Eintrag habe, sollte das gehen). So könnte ich später auch neue Produk...
von Seppl2202
Dienstag 10. Juli 2018, 11:23
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Hallo, danke nochmal : ) deine neue Variante macht es dann so, dass in der ersten Spalte alle Einträge der ersten Artikelnummer stehen, die restlichen Werte haben in diesem Bereich den Wert 0. In der zweiten Spalte beginnen die Werte der zweiten Artikelnummer dann da, wo die erste endete + 1. Kann m...
von Seppl2202
Dienstag 10. Juli 2018, 10:16
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Hallo, wenn ich das .values weglasse, sind die Mengen im kompletten modelling_dataframe 0.0. Es sieht dann so aus: 430070868 430070875 ... QUANTITY 0.0000 0.0000 ... QUANTITY 0.0000 0.0000 ... ... Insgesamt gibt es diese Zeilen zehnmal (es gibt zehn Einträge für Quantity, also sozusagen falscherhum,...
von Seppl2202
Dienstag 10. Juli 2018, 09:19
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Re: Kmeans mit Daten aus CSV

Hallo, vielen Dank für die schnelle Antwort. Ja, die Einrückungen sind leider verloren gegangen. Ich habe dieses Codeschnippsel einfach angefangen und rumgespielt, bis es das getan hat was es soll, verzeih mir bitte : ) Dein Code wirft in Zeile 14 eine Fehlermeldung: AssertionError: 10 columns passe...
von Seppl2202
Dienstag 10. Juli 2018, 07:05
Forum: Wissenschaftliches Rechnen
Thema: Kmeans mit Daten aus CSV
Antworten: 15
Zugriffe: 2465

Kmeans mit Daten aus CSV

Hallo zusammen, ich bin neu hier und auch neu in Python (aber Softwareentwickler in Java, es geht also nur um die Syntax ;) ) und habe ein Problem mit einem privaten Projekt. Ich möchte einen Kmeans-Algorithmus benutzen, um aus einer CSV-Datei mit Verkaufsstatistiken Muster zu erkennen. Hier mal ein...