Was ist mit "Standardisierung" gemeint?
HTML ist im Gegensatz zu Englisch keine natürliche Sprache, sondern eine künstliche, und man spricht keine Menschen damit an, sondern Computerprogramme. Menschen verstehen Sprache selbst, wenn gramatische Regeln verletzt werden, weil Menschen kreativ und intelligent sind und Lücken füllen können.
Computerprogramme sind darauf angewiesen, sich auf eindeutige Regeln beziehen zu können, da sie ohne Regeln keine Entscheidungen treffen können - es sei denn, der Programmierer würde jede Regelabweichung, die er vorhersieht, implementieren, was Software auf absurde Weise verkomplizieren würde. Die Art von Computerprogramm, mit der wir es in diesem Zusammenhang meistens zu tun haben, nennt man Browser. Ein Browser liest HTML-Quelltext und setzt ihn entsprechend seiner Regeln am Bildschirm um. Damit der Browser weiß, mit welcher HTML-Version er es zu tun hat (denn auch HTML-Standards wachsen mit den Jahren), gibt man einen Dokumenttyp an. Der Browser erkennt z.B., dass es sich um ein XHTML1.0-Dokument handelt, und er sollte die Verarbeitung des Dokuments abbrechen, sobald er über eine Angabe stolpert, die diesem Sprachstandard nicht entspricht.
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
Wozu soll das Ganze denn gut sein?
Lapidar gesagt, damit nicht jeder sein eigenes Süppchen kocht. HTML ist eine offen liegende Sprache; ihre Pflege und Entwicklung obliegt dem W3-Consortium, einem Gremium, in dem Fachleute verschiedenster Herkunft, unter anderem auch Browserhersteller, sich auf Standards einigen und die Marschrichtung neuer Entwicklungen diskutieren.
Und trotzdem kocht jeder sein Süppchen. Microsoft-Browsern wurde irgendwann beigebracht, die Anweisung marquee
zu interpretieren und eine Laufschrift darzustellen, während Netscape-Browser auf die Anweisung blink
hörten und Text artig zum Blinken brachten, wie es ihre Entwickler ihnen einprogrammiert hatten. Das W3-Consortium hatte diese Sprachelemente nie verabschiedet, weil es nie wollte, dass diese optischen Körperverletzungen in den Sprachumfang von HTML eingehen.
Obwohl man sieht, dass nicht nur Microsoft von den Standards abweicht, so sind Sonderwege dieser Art für dieses Unternehmen doch charakteristisch. Wer ein Word-Dokument als HTML-Datei abspeichert und sich den Quelltext anschaut, wird feststellen, dass es dort von exotischen Anweisungen nur so wimmelt (in etwas geringerem Maße gilt dies übrigens auch für Frontpage). Ein Browser, der sich an die Regeln hält, wird nicht in der Lage sein, dieses Sprachgewirr zu interpretieren. Da Microsoft sich diese Geheimsprache selbst ausgedacht hat, wird sie dem Internet Explorer mit Regeln erklärt, und - oh Wunder - dieses Wunderwerk der Programmierkunst ist die einzige Software, die scheinbar in der Lage ist, "jede" Website "richtig" darzustellen.
Und wo ist jetzt das Problem? Ganz einfach: Auf diese Weise lässt sich der Sinn des Internet empfindlich torpedieren. Ein Unternehmen bietet eine Software an, die auf den ersten Blick wunderbare Webseiten erstellt - aber nur, solange sie auch mit Software aus eben diesem Unternehmen betrachtet werden. Das Unternehmen liefert diese Software im Rahmen einer anderen Software, einem nicht wenig verbreiteten Betriebssystem, aus. Andere Software-Hersteller, die sich an die Standards halten, werden vom Markt gedrängt, weil ihre Produkte anscheinend nicht in der Lage sind, Webseiten ordentlich anzuzeigen. Eigentlich sollte HTML jedoch genau dazu dienen, dass Webseiten auf allen Systemen in aller Welt angezeigt werden können, egal ob diese Systeme auf kommerzieller oder freier Software basieren.
- http://www.w3.org/
Homepage des W3-Consortiums - http://www.carsten-protsch.de/zwischennetz/doctype/
Der »DOCTYPE-Switch« und seine Auswirkungen