Seitenhistorie
Immer wieder kommt die Frage auch, wie man die verschiedenen japanischen (Um-)Schriften ineineinander ineinander konvertiert.
Es wäre schön, hier mal eine Übersicht zu haben, wo man die nötigen Infos zu den jeweiligen Konvertierungen findet.
Bitte um Ergänzung, wenn man Ideen, zu den jeweiligen Punkten hat.
...
Die Umwandlung ist in Unicode kein Problem.
Hiragana hat den Codepoint-Bereich 0x3040-0x309f und Katakana den Codepoint-Bereich 0x30a0-30ff0x30ff.
Eine Umrechnung kann also durch einfache Addition/Subtraktion, je nach Richtung, mit 0x60 (96) erfolgen.
...
Sollte es schon einige Lösungen im Internet geben, neben unserer eigenender Wadoku eigenen (u.a. von Ulrich und Hans Jörg), welche mittlerweile in Java geschrieben ist (Furigana.java), aber nur für Ulrichs erweiterte Hiragana-Auszeichnung zuverlässige Ergebnisse liefert. Liegt das Original nur im ungetaggten Hiragana vor, dann ist die Konvertierung ohne Wörterbuch allein regelbasiert nicht richtig durchführbar (Fehlerquote 5%?).
Katakana -> Romaji
Ist trivial, wenn man Hiragana -> Romaji kann
...