Voraussetzungen
Damit Unicode-Zeichen korrekt auf dem lokalen PC wiedergegeben werden, sind bestimmte Voraussetzungen nötig:
-
Es muß ein geeignetes Unicode-kompatibles Betriebssystem installiert sein (z.B. Windows 98 oder höher)
-
Der Web-Browser muß ebenfalls Unicode-kompatibel sein (z.B. Netscape und Internet Explorer, jeweils ab Version 4.0)
-
Zusätzlich muß ein Font installiert werden, der die aufgerufenen Unicode-Symbole enthält. Für linguistische Zwecke gut geeignet sind:
- Arial Unicode MS
Der serifenlose Font auf der Basis der Arial-Schriftfamilie ist extrem umfangreich und deckt alle wichtigen Schriftsysteme der Welt ab. Der Font ist frei verfügbar (download, Vorsicht 23.0 MB!)
- Lucida Sans Unicode
Der ebenfalls serifenlose Font deckt alle wichtigeren Schriftsysteme (außer Chinesisch) ab. Er enthält vor allem die für die phonetische Transkription wichtigen IPA-Extensions, Diacritical Combining Marks und Spacing Modifiers. Der Font wurde von Linguisten entwickelt und ist ebenfalls frei verfügbar. Er läßt sich mit nur 316 KB Umfang zudem leicht downladen (download).
- Titus CyberBit
Der Font wurde im Rahmen des Forschungsprojekts TITUS speziell für linguistische Zwecke entwickelt. Damit lassen sich auch seltenere Schriftsysteme mit komplexen diakritischen Zeichen darstellen (download).
-
Wenn Schriftsysteme ausgewählt werden, die nicht die vorinstallierte Schreibrichtung von links nach rechts benutzen, ist zusätzlich zum betreffenden Font das zugehörige MicroSoft Language Pack zu installieren (ab Windows 98 möglich).
Ausführliche Hilfestellung findet sich auf der Website von Unicode.
Falls Unicode-Zeichen aufgrund fehlender Voraussetzungen nicht von Ihrem Browser dargestellt werden, so können Sie - wenn es wichtig sein sollte - wegen der eindeutigen Kodierung immer feststellen, welches Zeichen gemeint ist. Sehen Sie sich im Quellcode die Kodierungsnummer an, und schlagen Sie auf der Website von Unicode nach, welches Zeichen dargestellt werden sollte.
Eingabe von Unicode-Zeichen
Bei Verwendung in HTML-Seiten sind Unicode-Zeichen als hexadezimale oder dezimale Codewerte oder mit Namen (falls vorhanden) einzugeben. Der dezimale Codewert muß zwischen den Steuerzeichen &#__ ; eingeschlossen sein, der hexadezimale zwischen den Steuerzeichen ___; und der Name zwischen &__;. Da der hexadezimale Codewert nur von neueren Web-Browsern (ab IE und Netscape 4.0) interpretiert werden kann, ist die dezimale Darstellung zu bevorzugen. Ein Name ist zwar gut zu merken, steht aber nur für einige wenige Benannte Zeichen zur Verfügung.
Folgende Notationen sind äquivalent und liefern dasselbe Ergebnis:
dec | hex | Name | Darstellung im Browser |
|---|---|---|---|
año | a&00F1;o | año | año |
ça | c&00E7; | ça | ça |
hôte | h&00F4;te | hôte | hôte |
Die Codewerte aller Unicode-Zeichen können über die Website des Unicode-Konsortiums ermittelt werden (s. auch hier UCS zu den wichtigen europäischen Schriftsystemen). Die vom Unicode Konsortium aus technischen Gründen vorgegebenen hexadezimalen Codewerte lassen sich mit dem Windows-Taschenrechner problemlos in dezimale Codewerte umrechnen (s. Startleiste > Programme > Zubehör > Rechner > Ansicht > Wissenschaftlich > Hex - Dec).
Wenn kein Netzzugang besteht und kein HTML-Editor, der Unicode unterstützt, zur Verfügung steht, besteht noch die Möglichkeit, mit Hilfe von MS WORD den Codewert zu ermitteln. Bei Verwendung von WORD 2000 kann der Codewert direkt aus den Symboltabellen des eingestellten Fonts ermittelt werden. Zunächst muß sichergestellt sein, daß der Font, der das gesuchte Zeichen enthält, auch eingestellt ist (cf. Menu Einfügen > Symbol > Schriftart). Dann muß das Zeichen in der Zeichentabelle ausgewählt werden. Bei neueren Releases von WORD 2000 erscheint der Zeichencode nun direkt in der Menuleiste, bei älteren muß man noch auf Tastenkombination drücken, um den Wert angezeigt zu bekommen.
Bei Verwendung von sehr vielen Unicode-Zeichen in einem Text ist es eventuell günstiger, das gesamte Dokument mit WORD in das HTML-Format umzuwandeln (Menü Datei > Als Webseite speichern). Alle im Text enthaltenen Unicode-Zeichen liegen nun als Codewerte vor und können im HTML-Quellcode identifiziert werden. Dazu muß die im HTML-Format abgespeicherte Datei mit einem Browser aufgerufen werden. Über das Browser-Menü Ansicht > Quelltext anzeigen erhält man den Quelltext, aus dem die Codewerte der Unicode-Zeichen hervorgehen. Der Quelltext ist durch den proprietären HTML-Code zunächst recht unübersichtlich. Die gesuchten Zeichen lassen sich jedoch leicht finden, da sie immer vom HTML-Tag ... eingeschlossen sind. Das spanische Wort año würde wie folgt erscheinen (mit Zeichen ɧ = Codewert dezimal 241):
ñ
Vorsicht: Nicht möglich ist bei Verwendung von HTML die Eingabe von Codewerten der Windows-Codepage Western-Latin-1 über die Tastatur, wie es beim Arbeiten mit verschiedenen Windows-Programmen üblich ist. Die Tastatureingabe ALT + 164 wird z.B. in Windows-Programmen als ñ dargestellt; in Unicode ist dagegen der Codewert 164 mit dem Währungszeichen ¤ belegt und wird von Browsern entsprechend dargestellt.
