Wadoku

Wadoku Wörterbuchsuche
Forum

Inhaltsverzeichnis

Zuletzt aktualisiert

Untergeordnete Seiten
  • XML
Zum Ende der Metadaten springen
Zum Anfang der Metadaten

Hier ein paar Hinweise, wie wir uns die neue intern XML-Struktur orientiert am TEI-Standard vorstellen.

<orth midashigo="true">
<kanji attr="NonToyo">宛</kanji>先
</orth>
derzeit im Midashigo-Feld: ×宛名

<orth midashigo="true">
<kanji attr="irregRead">活</kanji>き
</orth>
derzeit im Midashigo-Feld: △活き

<pron type="furigana">だいが</pron>
<pron type="hatsuon">だい・がく</pron>

<orth>あて名</orth>
<orth>宛て名</orth>
<orth>宛名</orth>
<pron type="hatsuon" orth="2">あ|て|な</pron>
<pron type="hatsuon" orth="3">あて|な</pron>

derzeit Feld für Romaji-Umrechnung: あて・な

gruppierung von sense: durch usage als klammer?

<sense>
<reference id="345" type="hint">
<trans>
<tr><nomen genus="f">Adresse</nomen></tr>
</trans>
<trans>
<tr><nomen genus="f">Anschrift</nomen></tr>
</trans>
</sense>

referenzen

  • syn (Synonym)
  • anto (Antonym)
  • altread (alternative Lesung)
  • abv (abkuerzung)
  • bsp (beispielsatz)
  • sub (untereintrag)

grammatische beschreibung ueber grammGrp mit pos. A, B und C
unterschiedliche Senses: 1, 2 und 3
// als Usage am trans

usage attribute

  • geo: geographic area
  • time: temporal, historical era ('archaic', 'old', etc.)
  • dom: domain
  • reg: register
  • style: style (figurative, literal, etc.)
  • plev: preference level ('chiefly', 'usually', etc.)
  • acc: acceptability
  • lang: language for foreign words, spellings pronunciations, etc.
  • gram: grammatical usage
  • syn: synonym given to show use
  • hyper: hypernym given to show usage
  • colloc: collocation given to show usage
  • comp: typical complement
  • obj: typical object
  • subj: typical subject
  • verb: typical verb
  • hint: unclassifiable piece of information to guide sense choice

ich denke wir bräuchten noch:

  • scientifc: für wissentschaftliche Ausdrücke z.B. <usg type="scientific">Luna</usg>
  • seasonword
  • familyname

usage auch innerhalb von TR fuer einzelne woerter (ironisch...)

dom = {}
reg = register = Sprachniv.
time = altertüml.; arch.; hist.; ursprüngl.; klass. Japan.
geo. = (evtl.) dial.

court (neu)= besch.-höfl.; ehrerb.-höfl.

Escape als specialChar

Umschrift als transcription (häufig innerhalb von usage)
z.B.: verursachen. (<zusErkl. Eintr.: höflicher als „<Umschr.>suru">).

DicLevel als Attribut auf sense, trans, entry

  • Keine Stichwörter

Kommentar

  1. Yoshtec sagt:

    Was mir an dem TEI nicht so gefällt bis jetzt ist, dass man nicht ein orth / pron Paar hat sondern nur verschiedene orth und dann verschiedene pron felder. Auch mit einer Nummerierung hat man nicht wirklich Eindeutigkeit hergestellt, wenn man zb. noch welche orth hinzufügt müssen u.U. alle nummern angepasst werden.

    Ich würde schon vorschlagen, das XML Format zwar schon als export bzw. import Funktion zu nutzen, aber die wahre Struktur in der DB festzulegen. Man kann sich gerne im DB-Schema von dem TEI inspirieren lassen, aber man muss nicht einfach alles so übernehmen.

    Weiterhin besteht natürlich die Gefahr, dass wenn man weiteres markup ( wie z.B. <kanji> ) oder Atrribute einführt, dass die Dateien nicht mehr dem Standard entsprechen. Dann muss man sich xslt transformationen schreiben und anbieten, die es wieder zurückführen oder so.

Kommentar schreiben