in einem kleinen Projekt von mir beschäftige ich mich mit der Streaming-API von Twitter zu einem Suchterm.
Ich möchte in einer späteren NLTK-Analyse gewisse Schlüsse (die folgen später..) anhand von Tweets ziehen können, auch um diese weiterverarbeitbar zu machen.
Nun besteht meine Frage darin, ob man mit Hilfe eines regulären Ausdrucks o.ä. ein gewisses Textretrieval einbauen und in Python (besser wäre hier sogar eine weitere Überführung in .txt) ausgeben kann?
Dreht sich um Folgendes:

Der Tweet geht noch viel weiter, allerdings möchte ich nur die Text-Sparte herausziehen. Problem hierbei ist: Es ist alles in einer Zelle gespeichert. Und ich habe über tausende Zeilen an weiteren Tweets.
Vielen Dank im Voraus!
