Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Ankündigung: EDICT-Version zum Testen  RSS feed
Forum Index » wadoku.de
Author Message
Dan


[Avatar]

Joined: 24/05/2006 16:58:45
Messages: 1285
Offline

Das ist einfach ein Mangel am Format selbst. Das ist nämlich genauso eine Krücke aus alten Vor-Unicode-Zeiten, wie das EPWING-Format.
Man kann in Zukunft versuchen, diese Enträge einfach auszulassen. Escapen kann man die Sonderzeichen wohl nicht.

Die eckigen Klammern kommen hier her http://www.wadoku.de/wadoku/entry/view/3704367

無知の知
gvd



Joined: 15/04/2010 12:56:18
Messages: 3
Offline

Klar ist das eine Beschränkung des Formats. Jim Breen verzichtet da komplett auf ASCII in den Suchworten. Das wäre auch eine Möglichkeit. Bei so Einträge wie http://www.wadoku.de/wadoku/entry/view/9866897 ist ja auch fraglich, wie viel die Englisch-Übersetzungen bringen.

Da es nur so wenige Einträge mit den Leerzeichen sind, denke ich wäre es schon gut, wenn in Wadoku eine Lösung dafür gefunden wird bzw. ggfs. die Einträge ausgelassen werden. Damit wäre zumindest vom Rahmen im edict File eine konsistente Syntax erreicht. Bei den rein japanischen Texten, wie z.B. Zeile 1 kann man das Leerzeichen ja entweder komplett weglassen oder aber durch ein Full-Width Leerzeichen ersetzen.

Sämtliche Klammern sollte man meines Erachtens in Wadoku korrigieren. Macht ja wenig Sinn, die eine Klammer in Full-Width zu benutzen und die andere in ASCII... Ist zwar für alle drei Klammern konsistent gemacht, aber ich finde eben falsch.

Die fehlerhaften Einträge in 6, 15, 17 für プロット,手前 und 員数 sind hoffentlich auch aufgefallen, auch wenn ich diese nicht explizit erwähnt hatte.
Dan


[Avatar]

Joined: 24/05/2006 16:58:45
Messages: 1285
Offline

Das mit den Klammern ist so schon richtig, eine "Übersetzung" der Fullwidth- in ihre Halfwidth=ASCII-Version ist ja nach Sichtweise korrekt.

Das Problem der Leerzeichen ist eines von EDICT, da muss wohl umgewandelt werden.

Die anderen Einträge sind andere Sonderfälle, die noch nicht zuverlässig verarbeitet werden und sollten deshalb noch aussortiert werden.

無知の知
 
Forum Index » wadoku.de
Go to: