Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Messages posted by: Ulrich Apel
Forum Index » Profile for Ulrich Apel » Messages posted by Ulrich Apel
Message
Liebe Mitglieder des WaDoku-Vereins,
(Mail geht an Vereinsmitglieder, die nicht dem Vorstand angehören, als Blindkopie)

nach der gestrigen Einladung zur Mitgliederversammlung von WaDoku e.V. am 9. April 2010 um 18:00 Uhr in Tübingen in den Räumlichkeiten des Asien-Orient-Instituts der Universität Tübingen, Abteilung Japanologie, Köstlinstraße 6, Raum 2.10 möchte ich hiermit die Tagesordnung nachreichen.

* * * * * * * * * * * * * * *
Tagesordnung der Mitgliederversammlung von WaDoku e.V.
09.04.2010; 18:00; AOI, Abtlg. Japanologie, Köstlinstraße 6, Raum 2.10

1. Begrüßung, Feststellung der Beschlussfähigkeit, Protokollführung
2. Festlegung der Tagesordnung
3. Bericht des Vorstandes, Kassenbericht

4. Kassenprüfung
5. Entlastung des Vorstandes
6. Neuwahl des Vorstandes

7. Änderung der Vereinssatzung in Bezug auf die Modalitäten für die Einladung zu zukünftigen Mitgliederversammlungen

Vorschlag des Vorstandes zur Änderung:

-- Alt: "Die Berufung [zur Mitgliederversammlung] erfolgt durch Publikation auf der Vereinshomepage www.wadoku.de; sollte dies aufgrund technischer Schwierigkeiten nicht möglich sein, durch postalischen Brief."

-- Neu: "Die Berufung [zur Mitgliederversammlung] erfolgt per E-Mail. Sollte dies nicht möglich sein, durch postalischen Brief. (Adressänderungen sind dem Vereinsvorstand bekannt zu geben!)"

8. Lizenz zu den Daten des WaDokuJT-Projekts und Fragen des Urheberrechts

9. Vereinswebseite
10. Vereinsbeiträge
11. Diskussion zur Zukunft des Vereins

12. Diskussion zur Zukunft des WaDokuJT-Projekts und zur Zusammenarbeit mit dem Verein
-- Mögliche Einsetzung eines wissenschaftlichen Beirats
-- Tagungsplanung
-- Tagungspublikation

13. Verschiedenes

* * * * * * * * * * * * * * *

Die Ankündigung der Mitgliederversammlung finden Sie übrigens auch unter <http://wadoku.de/verein/> bzw. unter <http://wadoku.de/forum/posts/list/0/1162.page#8089>.

Die Einladung für den zu diesem Anlass stattfindenden Workshop erfolgt voraussichtlich Anfang kommender Woche.

Wir würden uns weiterhin sehr freuen, viele von Ihnen bei der Versammlung wieder zu sehen.

Mit freundlichen Grüßen

Ulrich Apel (im Namen des Vorstandes)
Liebe Mitglieder des WaDoku-Vereins,

der am 29. September 2009 neugewählte Vereinsvorstand von "Wadoku e.V. -- Förderverein für freie japanisch-deutsche Wörterbücher, Zeichenlexika und Lernmaterialien" bestehend aus Ulrich Apel (1. Vorsitzender), Robert Horres (2. Vorsitzender), Iris Vogel (Schriftführerin) und Ulrike Schmidt (Kassenwartin) hat sich am 18. Februar 2010 getroffen und besprochen, für den

9. April 2010 um 18:00 Uhr in Tübingen in den Räumlichkeiten des Asien-Orient-Instituts der Universität Tübingen, Abteilung Japanologie, Köstlinstraße 6, Raum 2.10

eine Mitgliederversammlung des WaDoku-Vereins einzuberufen. Dazu möchten wir Sie ganz herzlich einladen.


Wir möchten die Mitgliederversammlung wieder mit einem zweitägigen Workshop verbinden -- diesmal unter dem Titel "Perspektiven und Nutzung des elektronischen Lexikons WaDokuJT" vom 9. bis 10. Apri. Eine Einladung zum Workshop erfolgt auch noch einmal extra in den nächsten Tagen.


Ein wichtiger Tagesordnungspunkt für die Mitgliederversammlung wird ein Vorschlag des Vorstandes zur Änderung der Satzung bei den Modalitäten für die Einladung zu zukünftigen Mitgliederversammlungen sein.

Alt: "Die Berufung [zur Mitgliederversammlung] erfolgt durch Publikation auf der Vereinshomepage www.wadoku.de; sollte dies aufgrund technischer Schwierigkeiten nicht möglich sein, durch postalischen Brief."

Neu: "Die Berufung [zur Mitgliederversammlung] erfolgt per E-Mail. Sollte dies nicht möglich sein, durch postalischen Brief. (Adressänderungen sind dem Vereinsvorstand bekannt zu geben!)"


Wir würden uns sehr freuen, viele von Ihnen bei der Versammlung wieder zu sehen.

Mit freundlichen Grüße

Ulrich Apel (im Namen des Vorstandes)
Nachdem die Vereinsmitglieder bereits per Mail zur Mitgliederversammlung eingeladen wurden, hier auch noch einmal die Einladung auf WaDoku.de im Forum zur Information auch aller weiteren Interessierten.

* * * * * * * * * * * * * * * * * * *

Liebe Vereinsmitglieder, liebe Mitglieder des Vereinsvorstandes,

vom 29. September bis zum 2. Oktober 2009 findet an der Martin-Luther-Universität Halle-Wittenberg der 14. Deutschsprachige Japanologentag statt. Viele Mitglieder des WaDoku-Vereins werden aus diesem Anlass nach Halle kommen -- die Sektion "Informations- und Ressourcenwissenschaften" wird sehr stark von Vereinsmitgliedern bestritten. Wenn wir diesen Umstand nicht nutzen würden, um auch eine Mitgliederversammlung durchzuführen, wäre das sicher ein Versäumnis.

Daher lade ich Sie hiermit im Namen des Vereinsvorstandes ein zur
Mitgliederversammlung von
Wadoku e.V. -- Förderverein für freie japanisch-deutsche Wörterbücher, Zeichenlexika und Lernmaterialien
am Dienstag, 29.9.2009, 17:30 Uhr,
im Hörsaal G (Untergeschoss) im Melanchthonianum, Universitätsring 8/9, 06108 Halle (Saale).

Die Mitgliederversammlung findet sozusagen im Anschluss an die Sitzung der Sektion Informations- und Ressourcenwissenschaften: "Japanologie 2.0? Perspektiven der internetbasierten und internetbezogenen Japanforschung" (14:30-17:20; Hörsaal XIX) statt. Wir wechseln nur in einen anderen Hörsaal.

Es tut mir sehr leid, dass die Einladung so spät erfolgt. In Zukunft werden wir das sicherlich wieder besser hinbekommen.


Tagesordnung:
1. Begrüßung, Feststellung der Beschlussfähigkeit
2. Protokollführung
3. Festlegung der Tagesordnung
4. Bericht des Vorstandes
* Geschäftsbericht; unter anderem:
- Bericht von der Verleihung des JaDe-Preises an WaDoku e.V.
- Kooperation mit Language Grid: http://langrid.nict.go.jp/en/index.html
* Kassenbericht
5. Kassenprüfung
6. Entlastung des Vorstandes
7. Neuwahl des Vorstandes
8. Verschiedenes
* Zusammenarbeit mit HanDeDict und Unterstützung des Projektes
* Wörterbuchlizenz
* mittelfristige Anpassung der Vereinssatzung an die Vereinswirklichkeit
* weitere Themen


Ich freue mich sehr darauf recht viele von Ihnen in Halle wiederzusehen.

Mit herzlichen Grüßen

Ulrich Apel
2. Vorsitzender von WaDoku e.V.
@mkill

Vielen Dank für die Hinweise!

Dass man für ein deutsch-japanisches Wörterbuch eine eigene Datenbank braucht, habe ich als klar vorausgesetzt. Tut mir leid, dass das offenbar zu Missverständnissen geführt hat.

Eine leere Datenbank hilft nicht furchtbar viel, und es wird schwierig freiwillige Mitarbeiter für ein Projekt zu finden, das zunächst wenig praktischen Nutzen für diese hat.

Also würde ich das deutsch-japanische Wörterbuch zunächst gerne mit vorläufigen automatisch generierten Daten füllen. Für diese Generierung haben wir bereits wichtige Vorarbeiten geleistet. Die deutsch-japanischen Daten sollten jedoch z.B. über die ID mit den entsprechenden japanisch-deutschen Daten verknüpft bleiben. Weiter sollten die Daten am besten z.B. auch mit dem deutschen und dem japanischen WordNet verknüpft sein. Bei Verknüpfung mit dem deutschen WordNet bekäme man Flexion, Synonyme, Antonyme, Definitionen etc. gleich mit dazu.

Ich habe bereits früher für den Handy-Sprachkurs des Tokyoter Goethe-Instituts ein relativ einfaches deutsch-japanisches Wörterbuch aus den WaDoku-Daten erstellt. Jetzt geht es darum, etwas Besseres auf die Beine zu stellen.
Bei deutsch-japanischen Wörterbüchern war die Lage nie so dramatisch wie bei japanisch-deutschen vor unserem WaDoku-Projekt.

Es gibt das bereits erwähnte Sanshusha-Wörterbuch und auch das Crown-Wörterbuch von Sanseido in elektronischer Form zur Installation auf dem Computer. Das "Große Deutsch-Japanische Wörterbuch" von Shogakukan gibt es in einer Version des Casio Ex-Word (XD-GF7150). Bei gedruckten Wörterbüchern ist die Auswahl noch größer.

Weiter haben wir prinzipiell einiges getan, dass eine bessere Deutsch-Suche bereits möglich ist. Oft kann man für einen japanischen Begriff keine Übersetzung sondern nur eine Definition angeben. Solche Definitionen sind markiert und sind hoffentlich auch in der Online-Version des Wörterbuches nicht für den Suchindex aufgenommen.

Eventuell wäre es auch jetzt schon möglich, dass Einträge, die genau dem deutschen Suchbegriff entsprechen, in der Online-Version an erster Stelle aufgeführt werden und nicht erst irgendwo, wie es jetzt der Fall ist. Das WaDoku-Wörterbuch wird aber auch dadurch kein deutsch-japanisches Wörterbuch. Insofern gibt es vielleicht andere Prioritäten.

Ich hoffe, dass ich eine erste rohe deutsch-japanische Wörterbuch-Version noch diesen Sommer erstellen kann (Das Problem ist weniger die Erstellung, sondern dafür zu sorgen, dass die Daten auch bei Korrekturen der japanisch-deutschen Daten ihren Bezug nicht verlieren).

Ich würde hoffen, dass es dann relativ schnell geht, bis diese Daten online sind. Die maschinell erstellten Daten müssten natürlich von Menschen, also Lexikographen, überarbeitet werden. Bei Einträgen mit mehreren Bedeutungen müssten beispielsweise die Übersetzungen den jeweiligen Bedeutungen zugeordnet werden; veraltetes Japanisch müsste aussortiert werden etc..

Wahrscheinlich wird eine geplante Zusammenarbeit mit dem japanischen WordNet und ggf. auch mit dem deutschen WordNet GermaNet solch eine Zuordnung erleichtern.
Hallo Yoshi,

vielen Dank für den Vorschlag!

Ein Praktikum habe ich schon vom Ergebnis her sehr erfolgreich betreut. Das war die EPWING-Version des Wörterbuches, die in der Darstellung nach wie vor am ehesten dem entspricht, wie das Wörterbuch eigentlich konzipiert ist.

Ich arbeite zwar bislang am Nationalen Institut für Informatik in Tokyo, bin aber kein Informatiker. Ich bin gerne bereit, im Rahmen meiner Möglichkeiten Unterstützung zu geben. Ich bin davon überzeugt, dass die Möglichkeiten der WaDoku-Daten auch für Informatiker noch lange nicht ausgereizt sind. Leider werde ich nur herzlich wenig technische Unterstützung geben können; und ich kann auch nicht einschätzen, wie lange ein bestimmtes Projekt dauern könnte.

An aktuelle Themen im Zusammenhang mit den Daten fallen mir gerade ein:


  • Automatische Generierung von Latein-Umschrift nach DIN-Norm (Anwendung linguistischer Regeln auf die von einem morphologischen Parser gelieferten Rohdaten oder Maschinenlernen anhand vorhandener Beispieldaten)

    Datenpflege und Konsistenzkontrolle: Umgang mit Homonymen bzw. Homographen, automatische Generierung einer Beschreibung der unterschiedlichen Schreibweisen eines Eintrages

    Automatische Generierung eines rohen deutsch-japanischen Wörterbuches aus den japanisch-deutschen WaDoku-Daten

    Automatischer Versionsabgleich von Wörterbuchdaten auf verschiedenen Servern und in verschiedenen Bearbeitungszuständen


  • Bei Interesse an meiner Mitwirkung bei der Betreuung der Diplomarbeit besprechen wir das Weitere vielleicht lieber per Mail (apel [atmark] wadoku.de) und nicht übers Forum.

    Herzliche Grüße und auf jeden Fall: viel Erfolg!

    Ulrich Apel

    Vielen Dank für die Hinweise auf die Fehler bei den Nummern für Strichfolge.

    Es gab vor einer Weile die Frage, ob man sich wegen Korrekturen direkt an mich hätte wenden sollen. Das wäre eine Möglichkeit gewesen, weil ich aus Arbeitsüberlastung das Forum nicht verfolgt habe. Thomas Latka hat mich dankenswerterweise darauf aufmerksam gemacht, dass ich mich darum kümmern muss.

    Ich habe die Fehler in den Originaldaten korrigiert. Ich hoffe, dass ich es in den nächsten Tagen schaffe, korrigierte Bilddateien zu erstellen.

    Die Hinweise waren alle korrekt. Bei 黒 gibt es eine Strichfolgenvariation, bei der der senkrechte Strich nach den waagrechten geschrieben wird; aber das ist nicht die Version, die in Japan an Schulen gelehrt wird.

    Ich kann mich für die Fehler nur sehr entschuldigen. 申し訳ありません。Die Sache ist eben doch mit der heißen Nadel gestrickt. Ich werde mich voraussichtlich im März wieder ein wenig ausführlicher den Kanji-Daten widmen können.
    Dan wrote:Gibt es eigentlich schon weitere Ueberlegungen, wie man Henkan-Misses usw. markiert?

    Ja, gibt es. Allerdings ist das auch noch nicht endgültig.

    Eigentlich müsste es so sein, dass die falsche Schreibung im Index steht und gefunden wird, aber normalerweise nicht angezeigt wird. In der neuen Datenversion gibt es ein eigenes Feld für eine kompakte Anzeige der japanischen Schreibung. Da kommt dann die "falsche" Version natürlich nicht vor.

    Dann habe ich in meinen Daten eigentlich auch noch ein Feld für Kommentare. Dort steht z.B. als Kommentar, dass お酒落 eine häufige falsche Schreibung ist.

    Optimal wäre natürlich eine eigene direkte Markierung der falschen Schreibung. Dabei gäbe es noch mehr, was man bei den indizierten Schreibungen markieren könnte bzw. markieren sollte, etwa Ateji, Schreibung, bei der Nicht-Toyo-Kanji durch Kana ersetzt ist, Kana-Schreibung, bei der es um einen biologischen Terminus geht, Okurigana-Variante etc. Wahrscheinlich kann man da einiges automatisch markieren, trotzdem macht das Arbeit und kostet Zeit. Außerdem muss man das erst einmal gründlich durchdenken.

    Es gibt jetzt bereits eine Markierung für viele Ateji im Japanisch-Feld -- nämlich "{ir.}" hinter der entsprechenden Schreibung -- z.B. 田舎 {ir.}; いなか. Mein pragmatischer Vorschlag wäre jetzt, bis wir eine bessere Lösung haben, bei häufigen falschen Schreibungen entsprechend zu verfahren und in geschweiften Klammern "{häufiger Fehler}" zu schreiben.
    Wie man die Fehlermeldung vermeidet, weiß ich leider auch nicht. Wahrscheinlich muss z.B. Thomas einen Parameter in der Programmierung ändern.

    Der Eintrag ist an sich auch bereits vorhanden als:

    …後 [2] ご [8] nach; später; seit. 尾

    Ich denke, es ist auch nicht das erste Mal im Gespräch, dass die Ellipse (die drei Punkte) nicht indiziert werden sollten. Das wäre wichtiger als den Parameter zu ändern.

    Ich vermute, dass kaum noch einsilbige Einträge fehlen dürften.
    Angaben zur Wortarten werde ich wie angekündigt ins Übersetzungfeld packen und nur noch für Haupteinträge pflegen. Diese Information würden im Datensatz von 観念的な fehlen bzw. nicht gebraucht.

    Der Inhalt des Übersetzungsfeldes von 観念的 wird weiter zu einem späteren Zeitpunkt Tags enthalten, wie der Inhalt dargestellt werden soll, wenn der Eintrag mit seinem Untereintrag dargestellt wird oder wie der Eintrag dargestellt werden soll, wenn der Eintrag z.B. für ein Zeichenlexikon verwendet wird – ein Zeichenlexikon braucht möglichst konzise Einträge.

    Auch insofern würde ich das nicht für identisch halten, weil es diese Tags im Datensatz für 観念的な nicht geben wird. Dieser Datensatz könnte jedoch – weil er speziell für ein allgemeines Sprachwörterbuch gedacht ist – ausführlicher sein.

    Bei allen Überschneidungen halte ich die formalen und inhaltlichen Unterschiede für wichtig genug, um zwei Datensätze zu pflegen.
    Danke fürs geduldige Nachfragen! Offenbar konnte ich mich aber immer noch nicht ganz verständlich machen.

    Derzeit sollte das folgendermaßen aussehen:

    - Haupteintrag 観念的 (_mit_ Übersetzung)
    - Untereintrag 観念的な (auch mit Übersetzung)
    Der Untereintrag enthält eine Referenz auf den Haupteintrag

    Wir wissen nicht, mit welcher Suche ein Nutzer auf einen Datensatz kommt. Möglicherweise hat er nur diesen einen Datensatz auf dem Bildschirm. Deshalb sollte jeder Datensatz aus sich selbst heraus verständlich sein. In anderen Worten: Auf Datensatzeebene sollte das Wörterbuch "zellulär" aufgebaut sein.

    Wenn man Haupteintrag und Untereintrag gemeinsam anzeigt, hat man einen "anlogen" Aufbau. Redundanzen sind dann für den Nutzer tatsächlich störend, und wir müssen uns wirklich überlegen, wie wir damit verfahren. Dafür müssen wir wohl grundsätzlichere Regeln aufstellen.

    Bei den Einträgen mit 的 kann man reltav leicht eine Regel aufzustellen. Etwas ähnliches gibt es aber z.B. auch, wenn der Haupteintrag gleichzeitig Abkürzung für den Untereintrag ist: 沢庵 takuan ist z.B. auch Abkürzung für 沢庵漬け (eingelegter getrockneter Rettich). Die Erklärung, was das ist, und warum das so heißt, genügt den Nutzern dann einmal.

    Es gibt etwa 200 Haupteinträge mit 的 — also weniger als ein Promille der Einträge, und das dürfte auch nicht weiter zunehmen. Wenn man Regeln für die Ableitung mit na einführt, müsste man eigentlich gleichzeitig auch Regeln für die Ableitungen mit ni und evtl. auch da einführen. Wir sollten 的 als Kandidaten für eine Regel im Auge behalten und uns dem evtl. später wieder widmen.

    Es läuft jedoch darauf hinaus, zu markieren oder unmarkiert zu lassen, welche Informationen für analoge Anzeige wichtig sind und welche für zelluläre Anzeige. Um das zu entscheiden, hätten wir am besten auch schon eine analoge Anzeige der Einträge.

    Es ist tatsächlich so gemeint, dass man meiner Meinung nach derzeit sowohl 観念的 als auch 観念的な in der Datei haben sollte, weil das formal verschiedene Dinge sind.

    Das Kenkyusha Wörterbuch verfährt beispielsweise so, dass es 観念的 als Stichwort aufführt, aber keine Übersetzung dafür angibt. Die kommt dann bei dem Untereintrag 観念的な, und dieser wird als Ableitung des Haupteintrages als ~な dargestellt.

    So etwas nur mittels Berechnung zu erstellen, scheint mir recht aufwendig. Es ist ja schließlich nicht der einzige Spezialfall, der uns begegnen wird. Man müsste denselben Eintrag sowohl als Haupt- als auch als Untereintrag behandeln, und das wo wir bei einer besseren Darstellung ohnehin noch nicht recht wissen, wie wir verfahren wollen.

    Es wird noch eine ganze Reihe andere Fälle gebe, wo es bei Haupt- und Untereinträgen Redundanzen geben wird. Wir werden Regeln entwickeln müssen, wie damit verfahren wird, wenn Haupt- und Untereinträge gemeinsam dargestellt werden.

    Ich bin dafür, zunächst zusammeln, was uns an Einträgen "in die Hände kommt". Wir müssen uns dabei merken, wo es Probleme und Redundanzen geben könnte. Wir versuchen in einem nächsten Schritt eine bessere Darstellung von Haupt- und Untereinträgen hinzubekommen und uns auf die wichtigsten/nützlichsten Beispiel zu beschränken. Bei diesem Schritt fallen für die Nutzeransicht Redundanzen heraus. In einem nächsten Schritt können wir uns dann überlegen, ob wir echte oder vermeintliche Redundanzen auch physisch in der Datei löschhen.
    Ganz so einfach wird es wohl doch nicht werden, alles was mit ダナ gebildet wird, nur an einer Stelle zu pflegen.

    "Wortart" ダナ weist auf ein Nominal-Adjektiv hin. Das sind ursprünglich Nomen, und sie werden in der Grundform, wenn möglich, als Nomen übersetzt. Mit ダ wird das prädikativ verwendet und mit ナ endlich als Adjektiv.

    Mit der Endung …的 kann man normale Nomen in Nominal-Adjektive verwandeln. Diese Verwendung ist in der Übersetzungsliteratur nach der Landesöffnung aufgekommen. Weil ein Nomen in ein Adjektiv verwandelt wurde, kann man schlecht wie sonst als Nomen übersetzten. Das ist aber eine Ausnahme. Wenn man versucht, alle Ausnahmen abzufangen, ist man ziemlich beschäftigt und hat möglicherweise in der Zwischenzeit schon einiges gelöscht, was man eigentlich behalten sollte.

    Ich bin wie gesagt, sehr dafür — wenigstens vorläufig — beide Versionen in der Datei zu behalten. Das hat auch Vorteile für Datenbank-Abgleich.

    Wir müssen uns zur Anzeige von Haupt- und Untereinträgen grundsätzlicher Gedanken machen, wann und wie die angezeigt werden. Bei dieser Gelegenheit sollten wir uns dann auch diesem Problem widmen.
    Auswahl, was in das Wörterbuch aufgenommen wird, ist eine wichtige Frage. Da geht es um ganz Grundsätzliches. Nicht zuletzt dreht es sich darum, welche Philosophie man mit dem Projekt allgemein verfolgen will. Ich gebe weiter unten aber auch noch ein paar pragmatischere Antworten.

    Es gibt bei elektronischen Wörterbüchern einmal die Philosophie: möglichst große "Wörter-bzw. Ausdrückeliste". Alles was existieren könnte, darf in die Wörterliste. Die Suche muss dann so intelligent sein, dass die User tatsächlich finden, was sie suchen. Das halb-kommerzielle englisch-japanisches Projekt namens Eijiro verfährt etwa so. Eijiro hat, glaube ich, 1,5 Mio. Datensätze.

    So eine Datensammlung kann insbesondere für Maschinenübersetzungen sehr sinnvoll sein. Bei Eijiro ist beeindruckend, für was man alles eine Übersetzung findet. Problematisch ist jedoch, dass die Qualität und die Form der Einträge stark variieren, und dass man weiter, wenn man weniger Ausgefallenes sucht, mit Einträgen so zugeschüttet wird, dass man mit dem Suchergebnis kaum noch etwas anfangen kann.

    Das Datenmodell von WaDoku.de verfolgt übrigens eine ähnliche Strategie. Es ist nur eine flache Datei, deren Einträge man durchsuchen kann. Datenseitig gibt es z.B. eigentlich Markierung, was als Schlagwort betrachtet werden sollte und deshalb wichtiger wäre als andere Einträge.

    Ein anderer Ansatz ist der eines "Wörterbuches", der versucht, ein Wort in seinen verschiedenen Bedeutungen zu erfassen. Diese Bedeutungen werden dann durch sinnvolle ausgewählte Wendungen und Beispiele ergänzt.

    Das ist der Ansatz, den die meisten allgemeinen Wörterbücher verfolgen, die man so kaufen kann. Bei 食べる taberu gibt es da also z.B. einmal die Übersetzung "essen" mit einem Beispiel wie etwa das erwähnte 朝食を食べる chōshoku o taberu = "frühstücken" etc. und dann die Übersetzung "von etwas leben" mit Beispielen wie "蓄えで食べていく" takuwae de tabete iku, = "von Ersparnissen leben". Den letzten Beispieleintrag findet man bei der Suche nach "食べる" übrigens nicht, weil es ja in einer konjugierten Form erscheint.

    Man kann einen solchen Ansatz auch bei einem elektronischen Wörterbuch und mit einer Datenbank verfolgen. Es stellt allerdings sehr viel höhere Anforderungen an die Artikelautoren aber auch an die Programmierung.

    Bei meiner FileMaker-Datei sind Haupteinträge bzw. Schlagwörter oder Lemmata mit entsprechenden Ableitungen, Zusammensetzungen, Verwendungsbeispielen und Beispielsätzen über eine Datenbankrelation miteinander verknüpft. Auch die EPWING-Version stellt die Daten entsprechend dar. Man könnte die Sortierung und die Darstellung sicher noch verbessern.

    Bei WaDoku.de hat eine entsprechende Darstellung eines Schlagwortes mit seinen entsprechenden Untereinträgen bisher noch nicht geklappt.

    Das WaDoku-Wörterbuch wird sich also irgendwo zwischen den Extremen "Wörterliste" und "Wörterbuch" befinden. Es liegt an uns, die entsprechenden Schwerpunkte zu setzen.

    Bei einer Wörterliste findet man recht leicht Mitarbeiter; jeder der es schafft, japanischen Text in die Eingabemaske von WaDoku.de einzufügen, kann mitmachen und hat das Gefühl einen wichtigen Beitrag zu leisten. Wir bekommen schnell viele Einträge, es gibt eine prima Userbindung etc.

    Wenn sich die Sache in Richtung "richtiges" Wörterbuch bewegen soll, wird es wesentlich schwieriger. Zunächst müsste die Programmierung darauf ausgelegt werden. Dann erhöhen sich die Anforderungen an die Artikelautoren recht dramatisch. Die Autoren müssten einen Überblick über die unterschiedlichen Bedeutungen eines Wortes haben, müssen sich darüber Gedanken machen, was ein sinnvolles Beispiel ist und müssen technisch in der Lage sein, eine Verknüpfung zwischen ihrem Untereintrag und dem Haupteintrag zu erstellen.

    Ich persönlich wünsche mir, dass das Projekt mehr in Richtung Wörterbuch geht und würde mich vor allem über entsprechende Neuenträge freuen.

    Das war jetzt die grundsätzliche Version. Jetzt einige pragmatische Hinweise:

    Einträge am besten nur löschen, wenn sie offensichtlich falsch sind und wenn es unwahrscheinlich ist, dass jemand denselben Fehler wiederholt, sonst muss man das jedesmal wieder erneut korrigieren.

    Ein Beispiel, wo ein Fehler bewusst in der Datei verblieben ist, ist etwa お酒落 für お洒落 o-share (mit 酒 sake statt 洒), weil man davon ausgehen kann, dass das in absehbarer Zeit wieder jemand fälschlich sucht und einen neuen Eintrag dazu anlegt.

    Also: Lieber Einträge vorläufig z.B. als "[wenig nützlich]" oder "[falsch für wahrscheinlich . . . ]" markieren. Damit sie herausgefiltert werden können. Wir könnten uns dazu noch ein besseres Tagsystem ausdenken. Das kommt bestimmt noch.

    Bei 観念的 und 観念的な ist das erste die "Wörterbuchform", das zweite die Form mit Partikel. Dass die Wörterbuchform nicht gelöscht werden sollte, versteht sich von selbst. Nach der Version mit Partikel werden User sicher auch suchen, also sollte auch diese nicht gelöscht werden. Am geschicktesten wäre es, wenn man der Datenbank beibringen könnte, jeweils nur eine Version anzuzeigen.

    Bei den Einträgen zu 朝食 etc.: Das wären alles Untereinträge zu 朝食 und/oder 食べる. Bei 朝食を食べる gibt es eine besonders schöne deutsche Übersetzung "frühstücken", die man nicht unbedingt erschließen kann, wenn man weiß, dass 朝食 "Frühstück" ist und 食べる "essen". Das ist also ein Grund, warum das auf jeden Fall in die Datei gehört.

    Die Version mit dem たくさん kann man problemlos übersetzen, wenn man die einzelnen Teile übersetzen kann. Das kann man also getrost als "[wenig nützlich]" markieren oder gar löschen.
    Hallo zusammen,

    das ist ein interessantes Beispiel – deshalb noch eine „offiziellere“ Version dazu.

    両 (りょう) kann im Japanischen als Suffix oder als Nomen vorkommen. In der bisherigen Version gibt es nur eine nicht vollständige Erklärung für das Suffix. Eigentlich gehören Übersetzungen für Suffix und Nomen in einen Eintrag.

    Wenn man also wie vorgeschlagen, einen neuen Eintrag erstellt, funktioniert zwar die Eingabe, aber irgendwann muss das dann wieder zu einem Eintrag zusammengefasst werden -- was Mehrarbeit bedeutet bzw. nicht oder sehr zeitverzögert geschieht.

    Es gibt ja jetzt die Möglichkeit für Editoren, Datensätze direkt selbst zu bearbeiten.

    Nach der neuen Syntax für Einträge (http://www.umwelt24.de/wiki/display/WAD/Syntax) sollte der Deutsch-Eintrag zu 両 (りょう) also etwa folgendermaßen aussehen:

    [A] (<Beschr.: als Nomen> [1] Paar<Gen.: n>; zwei Stück<Gen.: n>. [2] Ryō<Gen.: n> (<Def.: historische> Gewichteinheit für Medizin bzw. Silber und Gold>. [3] Ryō<Gen.: n> (<Def.: Münzeinheit der Edo-Zeit>; <zusErkl.: während der Meiji-Zeit im Volksmund gleichbedeutend für Yen verwendet>. [B] (<Beschr.: als Suffix> [1] <Def.: Zählwort für Züge, Wagen etc.>. [2] <Def.: Zählwort für Paare> (<zusErkl.: ursprüngl. <Jap.: 輛> geschrieben>. [3] <Def.: Zählwort für Rüstungen> (<Herk.: ursprüngl. Ateji für <Jap.: 領>>.

    Es wird jetzt unterschieden zwischen „richtigen“ Übersetzungsvorschlägen, die man also so einfach für einen Übersetzungstext übernehmen kann und Definitionen für Erklärungen oder Sachen, die es im Deutschen so nicht gibt und wo man den Nutzern keine direkte Übersetzung vorschlagen kann. Zählwörter etwa gibt es im Deutschen ja nicht so richtig. Man könnte mit „Stück“ übersetzen, aber das passt ja meistens auch nur bedingt.

    Diese Unterscheidung von Übersetzungsvorschlägen und Definitionen ist wichtig, wenn man z.B. Einträge von Japanisch-Deutsch nach Deutsch-Japanisch „umdrehen“ will -- denn da sind die Definitionen wahrscheinlich nicht so recht nützlich.

    Ulrich Apel
     
    Forum Index » Profile for Ulrich Apel » Messages posted by Ulrich Apel
    Go to: