Hallo,
ich bastle gerade an einem kleinen Skript, um die Geo-IP-Daten von hostip.info in eine Oracle-DB zu pumpen.
Dazu benutze ich die csv-Dateien von http://ftp.wayne.edu/hostip.info/csv/
in der hip_ip4_city_lat_lon tauchen allerdings in der "Namens"-Spalte scheinbar hex-escapede Zeichen auf (nennt man das so? Ich meine %20 für ein Leerzeichen etc.);
beispiel:
['50543872', 'Princeton%2C%20NJ', '40.3503', '-74.6594']
Leider fällt mir auf die Schnelle keine Python-Fkt. ein, um diese durch %XY codierten Zeichen in ein bestimmtes Encoding umzuwandeln... in welche Richtung muss ich dafür schauen?
"%20" -> Leerzeichen usw.
-
- Python-Forum Veteran
- Beiträge: 16025
- Registriert: Freitag 20. Juni 2003, 16:30
- Kontaktdaten:
Versuchts mal mit der Richtung ``urllib``. ``urllib.unquote()`` klingt nach genau dem richtigen.tantris hat geschrieben:Leider fällt mir auf die Schnelle keine Python-Fkt. ein, um diese durch %XY codierten Zeichen in ein bestimmtes Encoding umzuwandeln... in welche Richtung muss ich dafür schauen?
My god, it's full of CARs! | Leonidasvoice vs (former) Modvoice
-
- Python-Forum Veteran
- Beiträge: 16025
- Registriert: Freitag 20. Juni 2003, 16:30
- Kontaktdaten:
Ich für meinen Teil frage mich, warum es eigentlich dazu keinen Codec gibt, den man mit ``basestring.emcode()`` und ``basestring.decode()`` verwenden kann. Das fände ich eigentlich recht konsequent.tantris hat geschrieben:Dass urllib.urlencode so einigermaßen das Gegengesetzte zu dem ist, was ich gesucht habe, wusste ich; nur hab ich dann nach sowas wie urldecode() gesucht
My god, it's full of CARs! | Leonidasvoice vs (former) Modvoice
- veers
- User
- Beiträge: 1219
- Registriert: Mittwoch 28. Februar 2007, 20:01
- Wohnort: Zürich (CH)
- Kontaktdaten:
Schau dir mal das CGI Modul an. Das kann Querystrings Parsen.
Code: Alles auswählen
In [2]: cgi.parse_qs('foo.py?action=dosth&name=douglas&alter=42')
Out[2]: {'alter': ['42'], 'foo.py?action': ['dosth'], 'name': ['douglas']