Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Falscher Pitch-Pattern/Accent-Index bei diversen Wörtern im XML export?  RSS feed
Forum Index » WadokuTeam
Author Message
Oromit



Joined: 08/08/2023 00:09:41
Messages: 1
Offline

Hallo,

Ich arbeite aktuell mit dem XML dump von https://www.wadoku.de/downloads/xml-export/wadoku-xml-20230702.tar.xz

<entry id="8069659" version="1.6" HE="true" xmlns="http://www.wadoku.de/xml/entry"><form><orth midashigo="true">広げる</orth><orth midashigo="true">△拡げる</orth><orth>広げる</orth><orth>ひろげる</orth><orth type="irreg">拡げる</orth><reading><hira>ひろげる</hira><hatsuon>ひろ~げる</hatsuon><accent>4</accent></reading></form>[.......] </entry>


Das Wort wird dort mit accent pattern 4 gelistet, was nicht korrekt ist.
Auf der Website steht es aber korrekt als Accent Pattern 0: https://www.wadoku.de/entry/view/8069659

Das selbe Problem ist mir auch bei mehreren anderen Wörtern aufgefallen, z.B. das Partner-Wort 広がる.

Übersehe ich hier einen Trick, wie man anderweitig auf Pattern 0 schließen kann/muss, wenn der Wert als etwas >= der Anzahl an Mora ist?
Oder mappt die Webseite einfach generell auf Pattern 0 im Fall dass die zahl >= der Länge ist?

Auf jeden Fall wäre es schön, wenn die Daten im XML korrigiert werden könnten


Edit:
Ich wollte gerade auch mal die Gegenprobe machen, und ein Wort suchen was tatsächlich Pattern 4 ist: おとうと/弟
https://www.wadoku.de/entry/view/7626154
Hier ist das Pattern sowohl im XML als auch auf der Seite als 1 angegeben, was meines Wissens nach falsch ist (und auch recht komisch klingt).

Falsches Wort!
https://www.wadoku.de/entry/view/9034898 passt
Dan


[Avatar]

Joined: 24/05/2006 16:58:45
Messages: 1280
Offline

Vielen Dank für deinen Hinweis!

Ich denke, hier ist ein systematischer Fehler insbes. bei Verben gemacht worden.
Wenn ich mich nicht irre, ist die Aussprache mit 平板型(0) und 尾高型(im Beispiel 4) gleich. Erst in einer Phrase macht sich der (nicht) folgende Tonabfall nach der letzten More (z.B. mit einem Joshi) bemerkbar. Das könnte erklären, wie sich der Fehler eingeschlichen hat.

Dem Fehler wurde bereits soweit möglich nachgegangen. Deshalb findest du auf der Webseite nun andere Werte als im XML-Dump.
Diese sowie alle anderen Änderungen werden natürlich im nächsten XML-Dump enthalten sein werden.

Wenn dir weitere Fehler auffallen, lass es uns wissen, damit wir sie beheben können.

無知の知
 
Forum Index » WadokuTeam
Go to: