ich möchte mich nochmal für die schnelle Unterstützung bedanke. (Danke Tobias R.)
Es hat schon bei der Anmeldung gestockt. War mein Fehler, wenn es mal schnell gehen soll.
So, jetzt zu meinem Problem!
Ich habe eine csv Datei. (tmdb-movies.csv)
In dieser Datei sind 21 Spalten mit unterschiedlichen Dateitypen.
(135397 tt0369610 32.985763 150000000 1513528810 Jurassic World Chris Pratt|Bryce Dallas Howard|Irrfan Khan|Vi... )
Ich möchte jetzt gerne eine Spalte gruppieren (genres) und eine andere wird zusammen addiert (popularity).
Die Spalte (popularity) möchte ich anschließend der Größe nach sortieren.
Jetzt hänge ich schon gut eine Woche an dem Problem und komme nicht weiter. Alle mir bekannten Lösungen habe immer eine Fehlermeldung rausgeschickt, statt dem Ergebnis.
Mein Code sieht wie folgt aus:
Code: Alles auswählen
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
movie_df = pd.read_csv('tmdb-movies.csv')
var = movie_df.groupby('genres')['popularity'].sum().reset_index(name='popularity')
varlist = var.sort()
print varlist[-3:]
AttributeError: 'DataFrame' object has no attribute 'sort'
Erläuterung zum Code:
groupby ('genres') - gruppieren der Genre
['popularity'].sum - addiere alle Filme mit dem gleichen Genre
Da nach dem "Groupby" Befehl die Überschrift bei "Popularity" fehlt, setze ich durch einen Reset den Index zurück und definiere ihn neu.
Das funktioniert auch gut, nur das Sortieren der Größe nach nicht mehr.
Was kann ich machen, damit ich die Liste gruppieren und sortieren kann?
Vielen Dank für eure Unterstützung im Voraus!
Gruß Knut