Michael Neuhold Homepage
Startseite > Altgriechisch und Latein auf dem Computer > Altgriechisch und HTML

Altgriechisch und HTML


Die Kodierung altgriechischer Texte auf Computersystemen ist nach wie vor ein leidiges Problem. Hier sollen ein paar der Möglichkeiten, für Webseiten einer Lösung näherzukommen, soweit sie mir bekannt sind, und meine (durchaus subjektive) Bewertung vorgestellt werden.

  1. Worum es geht
  2. Textbasierte Systeme
    1. Einfache Transliteration
    2. Betacode
  3. Graphische Systeme
    1. Unicode
    2. Tricks mit Fonts
      1. SGreek
      2. GreekKeys
    3. Text als Graphik
    4. Java
  4. Links

Worum es geht

Das Problem der Darstellung altgriechischer Text auf dem Computer hat aus meiner Sicht zwei Aspekte:

  1. Das WWW wurde mit dem Ziel geschaffen, Dokumente plattformunabhängig im Netzwerk verfügbar zu machen. Auf nicht-graphischen, also textbasierten Systemen ist eine Darstellung mit griechischen Schriftzeichen schwer möglich. Für sie kann es nur um eine geeignete Form der Transliteration gehen.
  2. Was graphische Systeme anbelangt, so hat sich neben älteren, proprietären Kodierungen Unicode inzwischen bei modernen Betriebssystemen weitgehend durchgesetzt. Es stellt sich allerdings die Frage nach der Verfügbarkeit der notwendigen Zeichensätze (Fonts) dafür.

Textbasierte Systeme

Einfache Transliteration

Die einfachste, für die allermeisten Systeme darstellbare Form griechischer Texte ist die einfache Transliteration mit lateinischen Buchstaben. So unbefriedigend für den Fachmann vor allem das Fehlen von Spiritus und Akzenten ist, sollte sie für kurze Zitate grundsätzlich in Betracht gezogen werden:

Der Anfang der Ilias, [Griech. Text von Ilias 1,1], würde in Transliteration so aussehen:
mênin aeide thea Pêlêiadeô Achilêos

Damit ê und ô auf allen Systemen korrekt dargestellt werden, muß man im HTML-Quellcode ê (d.h. e mit accent circonflexe) bzw. ô schreiben! Gute HTML-Editoren machen das automatisch. Der Quellcode sieht also so aus:
mênin aeide thea Pêlêiadeô Achilêos

Betacode

Betacode ist ein Standard für die Transliteration griechischer, hebräischer und koptischer Texte für wissenschaftliche Zwecke. Diese Kodierung ermöglicht ebenfalls eine systemunabhängige Darstellung. Längere Passagen sind in dieser Form für den Ungeübten allerdings nur schwer lesbar. Der Anfang der Ilias in Betacode lautet:
mh=nin a)/eide qea\ *phlh+ia/dew *)axilh=os

Graphische Systeme

Unicode

Natürlich gibt es auch die Möglichkeit, einfach eine PDF-Datei zu erzeugen und diese über einen Link einzubinden. Aber das hat nichts mit HTML und dem Web im engeren Sinn zu tun. Bleibt man bei reinem HTML, so ist wohl die Verwendung von Unicode am naheliegendsten.

Hierzu gibt es in HTML zwei Möglichkeiten:

  1. Man erzeugt eine Unicode-Datei und teilt dem Browser im Head-Abschnitt der HTML-Datei durch ein Meta-Tag mit, wie er den Inhalt der Datei interpretieren muß:

    <html>
     <head>
      <meta http-equiv="Content-Type"
            content="text/html; charset=utf-8">
     </head>
     <body>
      <p>menin aeide thea Peleiadeo Achileos</p>
     </body>
    </html>
    
  2. Man erzeugt eine ASCII-Datei, in der man HTML-Entitäten verwendet :
    <!-- menin --> &mu;&#x1FC6;&nu;&iota;&nu;
    <!-- aeide --> &#x1F04;&epsilon;&iota;&delta;&epsilon;
    <!-- thea --> &theta;&epsilon;&#x1F70;
    <!-- Peleiadeo --> &Pi;&eta;&lambda;&eta;&#x03CA;&#x1F71;&delta;&epsilon;&omega;
    <!-- Achileos --> &#x1F08;&chi;&iota;&lambda;&#x1FC6;&omicron;&sigmaf;

In beiden Fällen kommt es darauf an, daß der Browser Unicode verarbeiten kann und daß die zur Darstellung der Zeichen notwendigen Fonts verfügbar sind. So kann etwa die Render-Engine Gecko (Netscape, Mozille, Galeon) auf meiner Mandrake 8 Altgriechisch out-of-the-box darstellen, d.h. ohne daß spezielle Schriftarten installiert werden müßten.

Als Lösung für das Problem nicht vorhandener Fonts führten die beiden großen Browser Netscape Navigator und Microsoft Internet Explorer mit den 4er-Versionen eine neue Technik ein: Downloadable Fonts: So wie die Graphiken werden auch die verwendeten Schriftarten einfach vom Web-Server heruntergeladen. Leider waren die jeweils verwendeten Verfahren natürlich zueinander inkompatibel, weshalb man heute nicht mehr allzuviel davon hört.

Tricks mit Fonts

Als Unicode noch relativ jung war und praktisch von keinem Betriebssystem wirklich unterstützt wurde, verwendete man einen einfachen Trick, um griechische Texte auf den Bildschirm zu bringen: man kreierte einfach einen Font, der die notwendigen Zeichen enthielt. Die Zuordnung der Zeichen war proprietär, das Ganze roch manchmal ein wenig nach WingDings. Die Weiterverarbeitung solcher Texte am eigenen Computer oder das Durchsuchen gestaltet sich ohne spezielle Tools schwierig.

Mit der Entscheidung für einen Zeichensatz speziell für das Altgriechische ging aber meist die Festlegung auf ein bestimmtes Computersystem einher! Daher war es fast unabdingbar, so wie es etwa das Perseus-Project macht, den Benutzer interaktiv den gewünschten Zeichensatz auswählen zu lassen. Das ist freilich keine triviale Lösung und für ein kurzes Dokument zu aufwendig.

SGreek

Für die Windows-Welt ist der Zeichensatz Sgreek Fixed von Silver Mountain Software erwähnenswert. Er wird z.B. auch vom Perseus Project verwendet und kann frei herunterladen werden. Sgreek Fixed benutzt dieselbe Kodierung wie Betacode, mit dem kleinen Unterschied, daß Großbuchstaben nicht mit vorgesetztem *, sondern eben mit Großbuchstaben geschrieben werden und daß für Schlußsigma j zu verwenden ist.

Um den Browser anzuweisen, für den griechischen Text den Zeichensatz Sgreek Fixed zu verwenden, benutzt man das font-Tag oder sein CSS-Gegenstück, die font-family-Eigenschaft. Bei ganz alten Browsern, die dieses Tag nicht verstehen, kann man unter den Browser-Optionen als Schriftart für Text mit fester Schrittweite Sgreek Fixed einstellen (Sgreek Fixed ist eine Schrift mit fester Schrittweite). Der Anfang der Ilias sieht, für Sgreek Fixed kodiert, so aus:

<font face="Sgreek Fixed">
 mh=nin a)/eide qea\ Phlhi+a/dew &nbsp;)Axilh=oj
</font>

Oder mit Stylesheet-Angaben, z.B. im Head-Abschnitt:
<style type="text/css">
 .greek { font-family:"SGreek Fixed"; }
</style>

Und im Body-Abschnitt:
<span class="greek">mh=nin a)/eide qea\ Phlhi+a/dew &nbsp;)Axilh=oj</span>

Das ergibt dann, wenn man Windows benutzt und den Font installiert hat:

[Font-Beispiel Sgreek Fixed]

Das Schriftbild ist durch die "fliegenden Akzente" (d.h. Buchstaben mit Akzenten sind nicht als eigene Zeichen definiert, sondern werden aus Buchstabe + Akzent zusammengesetzt) ästhetisch nicht hunderprozentig befriedigend. Da Akzente und Spiritus immer zum vorigen Zeichen gezogen werden, muß bei groß geschriebenen Vokalen immer ein non-breaking space (&nbsp;) vorgesetzt werden, damit ein sichtbarer Wortzwischenraum entsteht.

Sgreek gibt es bei Silver Mountain Software auch als (ästhetisch ansprechendere) Proportionalschrift. Sgreek unterscheidet sich von Sgreek Fixed darin, daß Iota subscripta nicht unter Verwendung des Längsstriches (Pipe-Symbol) als Tottaste dargestellt werden können. Stattdessen ist nur folgende Kodierung möglich (die auch Sgreek Fixed beherrscht):

[Kodierung Iota subsriptum]

[Font-Beispiel Sgreek]

GreekKeys

Auf Apple-Rechnern hatte sich GreekKeys, für das es mehrere Zeichensätze (z.B. Athenian) gibt, als Quasi-Standard durchgesetzt. Inzwischen ist Athenian auch für Windows erhältlich. Es kommt ohne Kerning aus, d.h. jede mögliche Kombination aus Buchstabe und diakritischen Zeichen ist als eigenes Schriftzeichen definiert, was die Qualität des Schriftbildes erhöht.

Zur leichteren Eingabe gab es auch Tastaturmakros. Ich habe allerdings GreekKeys nie am PC verwendet. Dafür ist es in PalmOS die bevorzugte Methode, um altgriechische Texte auf den PDA zu bringen.

Wie bei Sgreek unter Windows muß der Browser mit dem FONT-Tag angewiesen werden, den Zeichensatz zur Textdarstellung zu verwenden. Da ich keinen Apple-Rechner habe, kann ich kein zuverlässiges Beispiel für die Kodierung mit GreekKeys bieten.

Text als Graphik

Es gibt prinzipiell zwei Möglichkeiten:

  1. Der ganze Text wird mit einer Textverarbeitung, die altgriechische Zeichen darstellen kann, geschrieben und davon dann ein Screenshot angefertigt. Dieser wird als Graphik in die Webseite eingebunden. So wurden alle griechischen Texte auf dieser Seite angefertigt. Diese Vorgangsweise hat mehrere Nachteile:
  2. Jeder Buchstabe liegt als eigene Graphikdatei vor, für jeden Buchstaben des Textes wird die entsprechende Graphik eingebunden. Da jeder Buchstabe nur einmal vom Server geladen werden muß, kann bei längeren Passagen die zu übertragende Datenmenge in Grenzen gehalten gewerden. Auch das hat aber Nachteile:

Java

Das Java-Applet Display Greek von Bruce G. Robertson übersetzt betakodierten griechschen Text in eine Graphik aus griechischen Schriftzeichen. Da das Kompilieren der Javaklassen und die Programmausführung beim ersten Mal spürbar Zeit brauchen, ist diese Lösung eher nur für längere Passagen brauchbar.

Als Wert des Applet-Parameters Text wird der Text in Betacode übergeben. (Achtung: j erzeugt kein Schlußsigma, sondern ein Xi; für Schlußsigma wird s verwendet, das Applet erkennt selbständig, wann ein Schlußsigma gesetzt werden muß.) Als Wert für den Paramter Fontsize sind 12 und 14 möglich (bei 14 Punkt bieten die Schriftzeichen sogar Antialiasing). Hier wieder der Anfang der Ilias:

<applet
codebase="http://www.java.utoronto.ca/~brucerob/DisplayGreek"
code="DisplayGreek"
width="350"
height="25">
<param
name="text"
value="mh=nin a)/eide qea\ *phlhi+a/dew *)axilh=os">
<param
name="fontsize"
value="12">
</applet>

Das sieht dann auf einem javafähigen Browser, wenn man in den Browsereinstellungen "Java akzeptieren" gewählt hat, so aus:

[DisplayGreek in Aktion]

Um auch nicht-javafähigen Browsern eine Chance zu geben, kann man den Text neben dem Applet (z.B. in einer Tabelle) oder im alt-Text des applet-Tags auch in Transliteration angeben.

Die Klasse DisplayGreek benutzt zur Darstellung GraphicFont von Kevin Hughes. Hierbei handelt es sich um Bitmap-Fonts, eine Technologie, die auf dem PC eigentlich schon lange nicht mehr "state of the art" ist, die aber den Vorteil hat, daß für sie leicht eine Fontdatei erstellt werden kann.

Links

Die mit einem Asterisk versehenen Links habe ich nicht mehr wiedergefunden (wahrscheinlich hat sich nur die URL geändert). Eine Google-Suche fördert sie vermutlich wieder zu Tage:


Autor: Michael Neuhold (E-Mail-Kontakt)
Letzte Aktualisierung: 18. Juli 2004