Umlaute in urls...

Kritik und Vorschläge für dieses Board bitte hier rein.
Antworten
mutetella
User
Beiträge: 1695
Registriert: Donnerstag 5. März 2009, 17:10
Kontaktdaten:

Hallo,

ist mir gerade aufgefallen:
Urls mit Umlauten machen wohl Probleme:

Hello World

So funktioniert's:

Hello World
Und dass mich Amazon trotzdem auf die richtige Seite leitet, obwohl ich einen Buchstaben in der url entfernt habe, begeistert mich!

mutetella
Entspanne dich und wisse, dass es Zeit für alles gibt. (YogiTea Teebeutel Weisheit ;-) )
sma
User
Beiträge: 3018
Registriert: Montag 19. November 2007, 19:57
Wohnort: Kiel

Ich würde darauf tippen, dass Amazon nur auf "/dp/3446421440/" achtet, denn es ist völlig egal, was davor (oder danach) steht, man landet immer auf dem besagten Buch.

Stefan
EyDu
User
Beiträge: 4881
Registriert: Donnerstag 20. Juli 2006, 23:06
Wohnort: Berlin

Und ich möchte behaupten, dass man die ganzen Parameter ebenfalls nicht posten möchte, da das doch stark nach Sessioninformationen aussieht.
Das Leben ist wie ein Tennisball.
mutetella
User
Beiträge: 1695
Registriert: Donnerstag 5. März 2009, 17:10
Kontaktdaten:

@EyDu:
Nun ja, ich kopier' halt die url und kümmere mich nicht noch darum, wie diese aufgebaut ist und ob ich sie eventuell noch überarbeiten könnte...
Wäre ja letztlich auch verlorene Liebesmüh', weil ich den von mir geposteten Links immer auch einen Linktext spendiere.
Zudem ändert das auch nichts an der Problematik, dass eben ein url-tag nicht funktioniert, wenn die url Umlaute (Sonderzeichen weiß ich nicht, kann sie aber wahrscheinlich gar nicht...) enthält.

mutetella
Entspanne dich und wisse, dass es Zeit für alles gibt. (YogiTea Teebeutel Weisheit ;-) )
BlackJack

@mutetella: Wenn Du von *Dir* Sessiondaten verfügbar machst, sollte Dir das vielleicht nicht so egal sein. Je nachdem wie die Site programmiert ist, könnte da jemand dann Dein Benutzerkonto verwenden solange die Session gültig ist und wenn die Sessiondaten in der URL das einzige ist, was Dich dort während einer Session ausweist.

Davon abgesehen ist das nur indirekt ein Problem bei dem Board. URLs können letztendlich keine Umlaute enthalten. Die müssen immer als ASCII kodiert sein. Es gibt verschiedene Möglichkeiten Umlaute (und andere Zeichen ausserhalb von ASCII) in verschiedenen Kodierungen in ASCII zu kodieren. Das muss aber der Client machen. Browser probieren da im Ernstfall einfach verschiedene Möglichkeiten durch. Sind dazu aber nicht wirklich verpflichtet. Bei einer URL mit einem Umlaut könnte der Browser auch einfach sagen die ist ungültig, beziehungsweise heutzutage noch Punycode probieren und das war es dann. Normalerweise probiert ein Browser noch mindestens Latin-1 und UTF-8 URL-kodiert aus bevor er aufgibt. Aber sollte dieses herumprobieren jetzt das Board jedes mal machen wenn jemand eine URL angibt, die keine gültige URL ist?
mutetella
User
Beiträge: 1695
Registriert: Donnerstag 5. März 2009, 17:10
Kontaktdaten:

@BlackJack:
Auch wenn ich das was Du schreibst so noch nicht gewusst habe entferne ich bei Linkadressen, die ich aus angemeldeten Sessions kopiere, alles was mir nicht nach dem eigentlich Linkziel ausschaut aus einer gesunden Paranoia heraus... :wink:
In meinem Beispiel-Amazon-Link ist da ja nicht der Fall gewesen.

Aber meine Antwort an EyDu muss ich natürlich insofern relativieren...

Allerdings verstehe ich immer noch nicht den Zusammenhang, weshalb url-tags hier im Board nicht funktionieren, wenn ein Umlaut in der url vorkommt. Natürlich kann und soll das Board nicht jede url auf ihre mögliche Gültigkeit hin prüfen. Beim python-tag wird ja auch nicht überprüft, ob der Codeteil syntaktisch korrekt ist.
Aber weshalb wird dann geprüft, ob Umlaute in einer url enthalten sind? Macht doch keinen Sinn, oder? Wenn die url aus diesem Grund nicht gültig sein sollte ist das doch nicht Sache des Boards, das zu prüfen. Wie Du ja selbst bereits gesagt hast...

Funktioniert nicht
Funktioniert

Es sollte also doch genügen, wenn die Syntax des tags überprüft wird. Sollte die url dann ins Nirwana führen wird das keiner dem Board anlasten... :wink:

mutetella
Entspanne dich und wisse, dass es Zeit für alles gibt. (YogiTea Teebeutel Weisheit ;-) )
Benutzeravatar
jens
Python-Forum Veteran
Beiträge: 8502
Registriert: Dienstag 10. August 2004, 09:40
Wohnort: duisburg
Kontaktdaten:

Das ist ein Problem von phpBB. Macht mehr Sinn bei denen Nach zu fragen ;)

GitHub | Open HUB | Xing | Linked in
Bitcoins to: 1JEgSQepxGjdprNedC9tXQWLpS424AL8cd
Benutzeravatar
snafu
User
Beiträge: 6738
Registriert: Donnerstag 21. Februar 2008, 17:31
Wohnort: Gelsenkirchen

mutetella hat geschrieben:Allerdings verstehe ich immer noch nicht den Zusammenhang, weshalb url-tags hier im Board nicht funktionieren, wenn ein Umlaut in der url vorkommt. Natürlich kann und soll das Board nicht jede url auf ihre mögliche Gültigkeit hin prüfen. Beim python-tag wird ja auch nicht überprüft, ob der Codeteil syntaktisch korrekt ist.
Ich glaube, du vermischt da gerade zwei verschiedene Dinge. Wenn du BJs Beitrag aufmerksam liest, wirst du merken, dass er (zumindest anfangs) lediglich von Kodierung und ASCII spricht. Das Ganze hat also weniger mit der Frage zu tun, ob eine Domain prinzipiell irgendwo registriert sein könnte, als vielmehr mit der Übersetzung von nicht-ASCII Zeichen in ASCII Zeichen. Wie ebenfalls erwähnt, verstecken viele Browser diese Tatsache, indem sie einfach erraten, welche Kodierung zur Umwandlung nötig ist. So wird dir z.B. der Firefox-Browser erwartungsgemäß sagen, dass er die URL `http://www.ähm-warum.de` nicht finden konnte. Gibst du es hingegen in Midori ein, kommt ein `Cannot resolve hostname (http://www.xn--hm-warum-zza.de)`¹.

Ich kenne jetzt die internen Gründe bei Midori nicht, da ein `http://www.bähm.de/` zum Beispiel funktioniert. Ich denke aber, man sieht daran schön, dass ein erwartungsgemäßes Verhalten bei Sonderzeichen keine Selbstverständlichkeit ist. Insbesondere zeigt sich hier auch, dass eben ein vorgelagerter Schritt nötig ist, der diese Umwandlung explizit tätigt und es gibt zu diesem Ablauf AFAIK noch keinen offiziellen Standard. Nebenbei ist http://www.bähm.de/ auch ein prima Beispiel für eine URL, die zu einer Webseite führt (resp. gültig ist), aber trotzdem nicht korrekt vom Forum angezeigt wird. ;)

Im Übrigen sind Sonderzeichen in vielen Domains inzwischen erlaubt, sodass ich denke, spätestens ein phpBB4 sollte diese Dinge durchaus unterstützen.

//edit:
¹ Aaah, die "komische" URL ist ein IDN. Dieses Format kannte ich noch nicht...
Antworten