Unicode: Zeichen- und Konvertierungstabellen
Eine Auswahl der vom Unicode-Consortium veröffentlichten Tabellen des Zeichencodes Unicode: Codierung der einzelnen Zeichen, Eigenschaften der Zeichen, Konvertierung zu anderen Zeichencodes, insbesondere der Serie ISO 8859-x
Auf dem FTP-Server des Unicode-Consortiums befinden sich eine große Anzahl von Dokumenten und Code-Tabellen. In der Tabelle sind Links auf eine kleine Auswahl von ihnen zusammengestellt. Wenn Sie etwas vermissen, suchen Sie bitte auch auf dem FTP-Server von Unicode.
Im Gegensatz zu einer früheren Version dieser WWW-Seite enthält die jetzige nur noch Links und keine Daten mehr. Man greift also automatisch immer auf die aktuelle Version beim Unicode-Konsortium zu.
Liste der Dateien
relativer Pfad nach http://www.unicode.org/Public/ | Inhalt | |
---|---|---|
UNIDATA/UCD.html | Beschreibung des Formates der Datei UnicodeData.txt im gleichen Verzeichnis. | |
UNIDATA/UnicodeData.txt | Liste alle Unicode-Zeichen und ihrer Eigenschaften in einem maschinell wie (mit Mühe auch) menschlich lesbaren Format; kann als Eingabe für Code-Konvertierungsprogramme oder mit einem guten Editor als Nachschlagewerk benutzt werden. Die genaue Beschreibung findet sich in der dazugehörigen WWW-Seite. | |
MAPPINGS/ISO8859/8859-1.TXT | westeuropäisch[1] | Abbildung zwischen den Codes ISO 8859-x und Unicode. Der Code ISO 8859-1 ist der typischerweise auf Unix- und Windows-, nicht jedoch MS-DOS-Systemen verwendete Zeichencode. Bei den lateinischen Schriften gibt die Zahl in eckigen Klammern die Nummer der Variante an, z.B. ISO 8859-9 = Latin5. |
MAPPINGS/ISO8859/8859-2.TXT | osteuropäisch[2] | |
MAPPINGS/ISO8859/8859-3.TXT | maltesisch[3] | |
MAPPINGS/ISO8859/8859-4.TXT | nordeuropäisch[4] | |
MAPPINGS/ISO8859/8859-5.TXT | kyrillisch | |
MAPPINGS/ISO8859/8859-6.TXT | arabisch | |
MAPPINGS/ISO8859/8859-7.TXT | griechisch | |
MAPPINGS/ISO8859/8859-8.TXT | hebräisch | |
MAPPINGS/ISO8859/8859-9.TXT | türkisch[5] | |
MAPPINGS/ISO8859/8859-10.TXT | nordeuropäisch[6] | |
MAPPINGS/ISO8859/8859-11.TXT | thailändisch | |
MAPPINGS/ISO8859/8859-13.TXT | baltisch[7] | |
MAPPINGS/ISO8859/8859-14.TXT | keltisch[8] | |
MAPPINGS/ISO8859/8859-15.TXT | westeur. (+ Euro)[9] | |
MAPPINGS/ISO8859/8859-16.TXT | südosteuropäisch[10] | |
MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT | Abbildung zwischen der Microsoft-Codepage 1252 (MS-Windows-Code ähnlich ISO 8859-1) und Unicode. | |
MAPPINGS/VENDORS/MICSFT/PC/CP850.TXT | Abbildung zwischen der Microsoft-Codepage 850 (MS-DOS für Westeuropa) und Unicode. | |
MAPPINGS/VENDORS/MICSFT/MAC/ROMAN.TXT | Abbildung zwischen Macintosh-Code (nur lateinische Schrift) und Unicode. | |
MAPPINGS/VENDORS/MISC/KOI8-R.TXT | Abbildung zwischen dem Code KOI8-R (kyrillische Schrift) gemäß RFC 1489 (Codepage 878) und Unicode. | |
MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1251.TXT | Abbildung zwischen der Microsoft-Codepage 1251 (kyrillische Schrift für MS Windows) und Unicode. | |
MAPPINGS/VENDORS/MISC/SGML.TXT | Eine große Liste von Entity-Namen für SGML und ihre Abbildung auf Unicode. Man beachte dazu, daß diese Namen nicht im eigentlichen Sinne genormt sind, sondern eher Vorschläge darstellen. Die in HTML verwendeten Entity-Namen kommen als kleine Teilmenge darin vor. |