Böse Sonderzeichen in Webchats

Nur wenigen ist bekannt, dass im HTML 4.0 Standard ein Sonderzeichen definiert ist das es ermöglicht die Textausrichtung auf "arabisch" umzustellen. Das bedeutet, dass alle Zeilen rechts beginnen und nach links geschrieben werden.

Das ist für arabische Schriften notwendig aber in nicht arabischen Webchats eine Qual. In diesem Fall ist es von Vorteil, dass Microsoft es nicht für nötig hält sich an Standards zu halten denn der Internet Explorer ignoriert dieses Sonderzeichen gekonnt. Bei Firefox wird es allerdings unterstützt und führt dazu, dass der Chatstream beinahe unbrauchbar wird.

Die einzige mir bekannte Lösung ist das filtern der entsprechenden Sonderzeichen in der Chatengine und zwar möglichst früh damit es auch nicht in Raumnamen verwendet werden kann. Wenn es möglich ist Kurzbeschreibungen anzuzeigen muss dort ebenfalls sichergestellt werden, dass diese Sonderzeichen keine Probleme verursachen.

Falls jemand glaubt sich aufregen zu müssen kann er das gerne tun. Uns ist dieser Sachverhalt seit dem 27. September 2007 bekannt und es wurden daraufhin sowohl FreeCS als auch Cyberworkers Entwickler über diese Tatsache informiert, haben es aber bisher nicht für notwendig empfunden zu antworten oder einen Patch zu schreiben. Wenn 3 Monate nicht genug dafür sind wird wohl mehr Zeit auch nicht helfen.

Update (22.12.2007 12.00) rene-m hat reagiert und seit FreeCS Version 1.2.20071222 werden nun alle 8 Sonderzeichen gefiltert.

2. Update (22.12.2007 12.30) Vielen Dank für den Hinweis, dass es noch weitere Unicode Zeichen gibt die ebenfalls eine ähnliche Wirkung haben. In einem kurzen Test konnte ich das zwar nur für 2 der 8 Zeichen bestätigen aber zur Sicherheit sollte man alle 8 Zeichen sowie deren Hex Equivalent filtern.

Unicode Nr.Unicode Hex Nr.Beschreibung
Zeilen-Abgrenzung
Absatz-Abgrenzung
Einbettung von links nach rechts
Einbettung von rechts nach links
Pop Directional Formatting (PDF)
Left-to-Right Override (LRO)
Right-to-Left Override (RLO)
Schmaler Leerschritt ohne Zeilenumbruch

Links:

Programming, Club3k : Read more : comments (7) : 19.12.2007 21:56

Comments

reset : Homepage : 20.12.2007 03:26

Ich habe erst jetzt durch deine Mail davon erfahren und werde mir das noch anschauen.

Gruß Rene

LiquidSnakE : Homepage : 20.12.2007 21:57

yac-Chats sind, dank deines Hinweises, nun 'sicher'. :)

BaDkNiGhT : 20.12.2007 22:06

http://unicode.e-workers.de/unicode3.php

hier sind noch weitere dieser Zeichen unter "Formatting Characters"..

FunnyDingo : Homepage : 20.12.2007 22:06

Das ganze sind Unicode-Formating-Characters. Davon gibt es ingesamt 8 Stück. Eine Liste findet sich unter http://unicode.e-workers.de/unicode3.php

reset : 22.12.2007 07:07

FreeCs filtert ab version 1.2.20071222 alle 8 zeichen :)

reset : 22.12.2007 20:55

so FreeCs wurde gerade nocheinmal upgedatet da ich festellen musste das der Codee mit ‮ schon ausgeführt wird, das funktioniert auch bei Club3k @ decke

Egal : 28.12.2007 02:38

Hi, weiß vielleicht jemand warum sich cyberworkers nicht (mehr?) meldet?

Lg

New Comment


(optional)