ich probiere schon länger mit Python von Twitter Daten zu ziehen und nützliche Informationen zu gewinnen, jetzt möchte ich dazu 1000 Benutzer zufällig auswählen, dazu habe ich mir gedacht (ich lass mich gerne eines besseren belehren!), dass ich ein StreamListener verwende um einfach sagen wir mal 20.000-50.000 Tweets zu ziehen in Excel zu packen und dann am Ende über eine zufällige Auswahl 1000 davon auswähle.
Das Problem an der Sache ist nur, ich würde mich gerne auf Deutsche Benutzer beschränken, und entsprechend dafür den Stream nur über die Sprache eingrenzen, wenn ich nun folgenden Code und Tweepy verwende:
Code: Alles auswählen
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream
consumer_key= ''
consumer_secret= ''
access_token= ''
access_token_secret= ''
class StdOutListener(StreamListener):
def on_data(self, data):
print data
saveFile = open('twitDB.csv', 'a')
saveFile.write(data)
saveFile.write('\n')
saveFile.close()
return True
def on_error(self, status):
print status
if __name__ == '__main__':
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(languages=['de'])
Hat jemand da eine Lösung für? Oder einen alternativen Ansatz?
Wäre für jede Hilfe sehr dankbar!
Beste Grüße
Moses243