Die Suche ergab 26 Treffer

von st_baum
Donnerstag 3. November 2022, 13:49
Forum: Wissenschaftliches Rechnen
Thema: Datum Matplotlib
Antworten: 0
Zugriffe: 1441

Datum Matplotlib

Ich möchte das Format der Datumsachse in einem Matplotlib Chart anpassen. Hier der DF period = pd.date_range('2017-01-01', periods=14, freq='m') value = np.random.randint(5, size=14) d = {'period':period,'value':value} df = pd.DataFrame(d) df['period'] = pd.to_datetime(df.period) Chart: fig,ax = plt...
von st_baum
Mittwoch 21. September 2022, 15:02
Forum: Wissenschaftliches Rechnen
Thema: Groupby, Zählen mit Bedingung
Antworten: 0
Zugriffe: 1318

Groupby, Zählen mit Bedingung

Ich habe einen Datensatz, der sieht wie folgt aus: import pandas as pd d = {'id': ['A','A','A','A','B','B'], 'date' : ['20210201', '20210202', '20210210','20210220', '20210303', '20210310']} df = pd.DataFrame(d) df.date = pd.to_datetime(df.date, format = '%Y%m%d') #df['prev_date'] = df.groupby('id')...
von st_baum
Montag 22. August 2022, 14:41
Forum: Wissenschaftliches Rechnen
Thema: Liste von Dataframes
Antworten: 8
Zugriffe: 4235

Re: Liste von Dataframes

Der zweite Vorschlag war genau was ich wollte. Danke
von st_baum
Montag 22. August 2022, 12:13
Forum: Wissenschaftliches Rechnen
Thema: Liste von Dataframes
Antworten: 8
Zugriffe: 4235

Re: Liste von Dataframes

Ich habe das Gefühl, dass mein Vorgehen nicht optimal ist. So erzeuge ich die DFs: liste = [1,2] for elem in liste: var = 'col_' + str(elem) globals()["df_" + str(elem)] = pd.DataFrame(df.groupby('year')[var].mean()) Als Resultat habe ich nun df_1 und df_2. Ist das Vorgehen so überhaupt &q...
von st_baum
Montag 22. August 2022, 09:54
Forum: Wissenschaftliches Rechnen
Thema: Liste von Dataframes
Antworten: 8
Zugriffe: 4235

Liste von Dataframes

Mittels eines for-loops erzeuge ich dataframes, diese Folgen einern Namenkonvention: df_1, df_2 etc. Diese möchte ich nun mit zusammenführen: frames = [df_1,df_2] dfs = pd.concat(frames, axis = 1).reset_index() Funktioniert soweit. Nun möchte ich aber den Inhalt von 'frames' mit Hilfe einer vorhande...
von st_baum
Freitag 20. Mai 2022, 14:59
Forum: Wissenschaftliches Rechnen
Thema: String split in Pandas dataframe
Antworten: 1
Zugriffe: 1580

String split in Pandas dataframe

Ich möchte nur die ersten Zeichen vor bestimmten Zeichen eines Pandas df extrahieren. Die Schwierigkeit besteht darin, dass es eine lange Liste an Zeichen ist, vor denen ich abschneiden möchte. Ich habe das Problem lösen können, allerdings nur mit einem Loop: import pandas as pd d = {'names': ['hans...
von st_baum
Freitag 24. September 2021, 15:45
Forum: Datenbankprogrammierung mit Python
Thema: Anzahl Zeilen Pandas
Antworten: 1
Zugriffe: 1407

Anzahl Zeilen Pandas

Ich möchte mir einen Pandas df in einem Jupyter Notebook ansehen. Dabei möchte ich jedoch die Anzahl der anzuzeigenden Zeilen bestimmen. Jedoch nicht mit

Code: Alles auswählen

pd.set_option('display.max_rows' none)
da ich es nur für ein Output-Fenster brauche.

Geht das überhaupt?
von st_baum
Montag 25. Januar 2021, 13:46
Forum: Wissenschaftliches Rechnen
Thema: Paneldaten
Antworten: 2
Zugriffe: 869

Re: Paneldaten

Falls mein Ansatz zum plotten der XS oder der Manipulation der Werte einzelner XS völlig falsch ist, freue ich mich über entsprechende Hinweise
von st_baum
Sonntag 24. Januar 2021, 13:27
Forum: Wissenschaftliches Rechnen
Thema: Paneldaten
Antworten: 2
Zugriffe: 869

Paneldaten

Ich habe einen Pandas DF, der Paneldaten beinhaltet. import pandas as pd d = {'id': ['A','A','A','B','B','B' ], 'value': [2,1,6,6,3,2], 'time':['2020-12-01T08:00:0','2020-12-01T09:00:0','2020-12-03T08:00:0', '2020-12-02T10:00:0','2020-12-03T12:00:0','2020-12-03T12:00:0']} df = pd.DataFrame(data=d) d...
von st_baum
Freitag 22. Januar 2021, 14:05
Forum: Wissenschaftliches Rechnen
Thema: str.extract
Antworten: 5
Zugriffe: 1151

Re: str.extract

Danke :-)
von st_baum
Freitag 22. Januar 2021, 09:12
Forum: Wissenschaftliches Rechnen
Thema: str.extract
Antworten: 5
Zugriffe: 1151

Re: str.extract

Zunächst bitte ich um Entschuldigung für meine schlampige Beschreibung. Richtig, es handelt sich um 'str.extract()' aus Pandas. Ich glaube es ist erstmal sinnvoll, die richtige regex zu finden und das ganze dann auf den DF zu übertragen: import re m = re.search(r'(?<=user:")\w+-+\w', 'user:&quo...
von st_baum
Donnerstag 21. Januar 2021, 22:12
Forum: Wissenschaftliches Rechnen
Thema: str.extract
Antworten: 5
Zugriffe: 1151

str.extract

Es soll der String vor und nach bestimmten zeichen ausgewählt werden. Exemplarisch steht in einer Spalte: wert: 2, beobachtung: 1, Alles nach der Zeichenkette "wert:" und vor dem ersten "," soll ausgewählt werden, d.h. "2". Ist mir nicht ganz klar, wie ich das mit str. ...
von st_baum
Donnerstag 31. Dezember 2020, 18:17
Forum: Wissenschaftliches Rechnen
Thema: Bedingter Vergleich von numpy arrays
Antworten: 6
Zugriffe: 1206

Re: Bedingter Vergleich von numpy arrays

Sirius3 hat geschrieben: Donnerstag 31. Dezember 2020, 13:59 Du willst ja zwei Bedingungen miteinander verknüpfen, dass sowohl in ar1 als auch in ar2 eine 0 steht:

Code: Alles auswählen

((ar1 == 0) & (ar2 == 0)).sum()
[/quote]

Das passt, danke :-)
von st_baum
Donnerstag 31. Dezember 2020, 12:16
Forum: Wissenschaftliches Rechnen
Thema: Bedingter Vergleich von numpy arrays
Antworten: 6
Zugriffe: 1206

Re: Bedingter Vergleich von numpy arrays

Etwas wie:

Code: Alles auswählen

if ar1 == 1 :
    np.sum(ar1 == ar2)
Funktioniert nicht. Ich vermute, weil nicht durch alle Elemente von ar1 geloopt wird. Hab den Ansatz nicht weiterverfolgt. Bin davon ausgegangen, dass es eine elegantere Lösung gibt.
von st_baum
Donnerstag 31. Dezember 2020, 11:04
Forum: Wissenschaftliches Rechnen
Thema: Bedingter Vergleich von numpy arrays
Antworten: 6
Zugriffe: 1206

Bedingter Vergleich von numpy arrays

Ich möchte zählen, wie oft werte in zwei np arrays übereinstimmen kombiniert mit einer Bedingung. ar1 = np.array([1,0,0,1,0,1]) ar2 = np.array([0,1,0,0,0,1]) np.sum(ar1 == ar2) Hier wird gezählt, wie oft die Werte übereinstimmen. Ich möchte aber, dass unter einer Bedingung gezählt wird. Z.b. das nur...
von st_baum
Samstag 12. September 2020, 15:28
Forum: Wissenschaftliches Rechnen
Thema: groupby mit Bedingung
Antworten: 3
Zugriffe: 798

Re: groupby mit Bedingung

Um sicher zu gehen, hier ein Vorschlag:

Code: Alles auswählen

df_filtered = df[(df['country'] == 'germany')]
df_filtered.groupby('industry')['employment'].mean()
Ist ein sauberes Vorgehen?
von st_baum
Samstag 12. September 2020, 10:22
Forum: Wissenschaftliches Rechnen
Thema: groupby mit Bedingung
Antworten: 3
Zugriffe: 798

groupby mit Bedingung

Mittels df.groupby('industry')['employment'].mean() kann ich mir die durchschnittliche Anzahl der Beschäftigten ('employment') in jeder 'industry' bestimmen lassen. Ich möchte den Befehl so erweitern, dass ich noch eine Bedingungen einführen kann. Es sollen nur die 'industry' in bestimmten 'country'...
von st_baum
Donnerstag 16. Juli 2020, 18:51
Forum: Wissenschaftliches Rechnen
Thema: Zählen unter Bedingungen
Antworten: 4
Zugriffe: 1511

Re: Zählen unter Bedingungen

Prima, danke!
von st_baum
Donnerstag 16. Juli 2020, 17:38
Forum: Wissenschaftliches Rechnen
Thema: Zählen unter Bedingungen
Antworten: 4
Zugriffe: 1511

Re: Zählen unter Bedingungen

Achso, das wäre natürlich hilfreich :-P

ich möchte zählen, wie oft der Wert Null in einer Spalte vorkommt. Gezählt werden soll nur, wenn in der anderen Spalte die genannte Bedingung erfüllt ist. Es reicht, wenn die resultierende Zahl in einer variable gespeichert wird.
von st_baum
Donnerstag 16. Juli 2020, 17:17
Forum: Wissenschaftliches Rechnen
Thema: Zählen unter Bedingungen
Antworten: 4
Zugriffe: 1511

Zählen unter Bedingungen

Ich möchte gerne, ähnlich wie ZÄHLWENN in Excel, Werte (0 oder 1) in einer Spalte zählen, sofern eine Bedingung in einer anderen Spalte erfüllt ist. So sieht der Datensatz aus import pandas as pd d = {'col1': [1, 2, 3, 3], 'col2': [0, 1, 0, 1]} df2 = pd.DataFrame(data=d) Ich hatte mir das wie folgt ...