Wir wissen ja, dass demnächst auch der Firefox das Zeilenumbruch-Entity ­
unterstützen wird. Mit diesem lassen sich »Sollbruchstellen« innerhalb eines Wortes festlegen, an denen der Browser das Wort für einen Zeilenumbruch trennen kann, wenn eine solche Trennung nötig sein sollte. Safari, Internet Explorer und Opera können das schon länger, aber besonders interessiert hat das bisher noch niemanden. Richtig en vogue könnte ­
mit dem kommenden Firefox-Support werden.
Nach einer kleinem IRC-Debatte mit anderen Nerds bin mir nicht mehr sicher, ob ich selbst das wirklich uneingeschränkt gut finden soll. Eine funktionierende Worttrennung für sich betrachtet ist natürlich etwas Großartiges. Wessen Design relativ enge Spalten sportet, der wird so etwas zweifellos zu schätzen wissen. Nur hat die Information für Zeilenumbruch wirklich etwas in HTML zu suchen?
Textverarbeitungsprogramme trennen Wörter, ohne dass der Nutzer ihnen sagen muss, wo sie das dürfen. Das geht durchaus auch ohne riesige Grammatikdatenbanken – freilich nicht perfekt, aber es geht. Selbst mein altes Photoshop kann das einigermaßen. Eine spontan ergooglete PHP-Klasse zur Silbentrennung hat gerade mal um die 100 Zeilen.
Warum kann das kein Browser?
Und hat die Information hier umbrechen
wirklich etwas in semantischem HTML zu suchen? Wäre man konsequent, müsste man ­
gewissermaßen präventiv in jedem Wort nach jeder Silbe einsetzen, was den Quellcode aufblähen und ihn nicht gerade leserlicher machen würde. Klar, man kann die Trennpunkte manuell setzen sich auf die längeren Wörter beschränken. Aber werden es sich nicht die meisten User und Content Management Systeme einfacher machen und etwas wie die oben genannte PHP-Klasse zum Einsatz bringen?
Auf den ersten Blick ist das Entity ­
eigentlich etwas tolles, aber ich bin mir wirklich nach einigem Überlegen nicht mehr so sicher ob ich es uneingeschränkt gut finden darf.
Weitere Informationen: Suchmaschinen und Zeilenumbruch mit soft hyphenation.
Kommentare (9)
soophie ¶
28. November 2007, 09:27 Uhr
Ich schaue auf den User, den Redakteur in einem CMS... keiner würde das einbauen. Außerdem gebe ich dir recht, denn auch ich finde, dass hat nix mit semantischem Web zu tun und auch nicht mit flexiblem Layout. Meine Meinung
Sascha ¶
5. Januar 2008, 21:16 Uhr
Ich sehe es auch so, dass ­ nichts im Quelltext zu suchen hat. Auch ich frage mich, warum die Browser es nicht ohne schaffen.
Mario H. ¶
5. Januar 2008, 21:43 Uhr
Tolle Sache, habe ich aber noch nie von gehört. Der Grund steht oben schon drin. Wenn ich nach jeder Silbe ein Silbentrennzeichen einfügen müsste...
@Sascha: wahrscheinlich, weil Browser deutsche, englische, französische... Inhalte anzeigen müssen aber nicht mit sinnlosen Silbentrennungs-Infos aufgebläht werden sollen.
Peter ¶
5. Januar 2008, 21:50 Uhr
Zitat Mario H.:
Dann könnte man das doch immer noch auf zumindest die Websites anwenden, derern Sprache der Browser identifizieren kann.
Sascha ¶
6. Januar 2008, 01:26 Uhr
Gut, das Problem sind natürlich die vielen unterschiedlichen Sprachem ... das stimmt schon.
*grübel*
Mathias Nater ¶
6. Januar 2008, 20:30 Uhr
Silbentrennung geht auch per Javascript, sofern die Elemente ein Sprachattribut (z.B. lang="de") tragen.
Der Autor braucht sich somit nur bei Sonderfällen um die Silbentrennung zu kümmern, der Rest übernimmt der selbe Algorithmus, der auch in LaTeX verwendet wird.
varzil ¶
19. Februar 2008, 10:40 Uhr
Gegenrede:
"shy" ist einfach praktisch, vielleicht nicht für großmächtige CMS-Systeme, aber für den kleinen HTML-Schreiber:
Beispiel:
Wenn eine Seite für 1200 x 1000 px gut passt, man aber auch mit entsprechenden Prozentangaben beim Seitenlayout die Seite für größere und kleinere Auflösungen möglich machen will, ist oft der Wortumbruch die Stelle, an der der Seitenaufbau "hakt". Und dann kann es sehr hilfreich sein, d.h. den Textfluss verbessern, wenn man ein paar lange Worte (mehr als ca. 10 Buchstaben) in der Mitte mit shy auftrennt. Man muss nicht jede potentielle Trennmöglichkeit aufzeigen.
Wenn IE und Opera shy darstellen können, verstehe ich nicht, warum Firefox sich da so ziert.
Redscreen ¶
26. Januar 2009, 16:48 Uhr
Toller Artikel. War mir auch neu. Danke.
@Varziel
Wird auch endlich Zeit, daß es einen einheitlichen Standard gibt. Das ganze "geht nur auf dem Browser x" nervt schon lange.
Jens ¶
12. September 2010, 09:58 Uhr
Wenn ich shy manuell einfügen sollte, würde ich auch eine Krise bekommen. Aber wenn es automatisch geht, warum nicht.
Das Javascript von Mathias Nater erweitert quasi den Browser um diese funktionalität.
Allerdings hat der Redakteur dann keinen Einfluss (Javascript deaktiviert, Zeilenumbrüche in bestimmten Worten verhindern etc.). Den hat er nur, wenn der Text auf seinem Server automatisch angepasst wird. Und das kann phpHyphenator von mir.
Letztlich gibt es deswegen ja auch PDF, denn ich möchte ja, das ein von mir vorgegebenes Layout beim User ankommt. PDF selbst macht keine Zeilenumbrüche, sondern das Programm, welches das PDF erzeugt. Übertragen auf den Browser, würde das bedeuten, dass der Zeilenumruch eben im Editor erzeugt wird und nicht im Browser.
Die Menge an übertragenen Daten ist nicht wirklich so ein Problem. Vielleicht verdoppelt sich die Menge an Text. Was ist das im Verhältnis zu einem Bild?
Übrigens gibt es noch das chr(173). Hat den gleichen Effekt und der Quelltext bleibt leserlich.
Übrigens habe ich diesen Text mit meinem Tool automatisch formatiert.