Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Messages posted by: Ulrike Schmidt
Forum Index » Profile for Ulrike Schmidt » Messages posted by Ulrike Schmidt
Message
Ulrike Schmidt wrote:Die Kanji ABC Webseite ist zur Zeit unter den Adressen http://kanjiabc.de und http://kanji-web.com erreichbar, hoffentlich bald auch wieder unter http://kanjiabc.net.


Seit heute funktioniert es auch wieder mit http://kanjiabc.net
Die Kanji ABC Webseite ist zur Zeit unter den Adressen http://kanjiabc.de und http://kanji-web.com erreichbar, hoffentlich bald auch wieder unter http://kanjiabc.net.
Samukun wrote:Musst du die Sachen alle manuell eintragen, oder läuft da was halbwegs automatisiert ab? Theoretisch lässt sich so eine Kanjisuche auf bereits bestehende Wörtebücher anwenden..


Ich habe bestehende Wörterbücher verwendet und automatisch zusammengeführt, die Lücken sind das, was dabei übrig geblieben ist. Ich muss sie mir als nächstes genauer anschauen und sehen, was ich voll-/halbautomatisch bzw. händisch einfügen/korrigieren muss. Alles, was regelmäßig formatiert ist (csv, Edict-Format etc.), kann ich automatisch einlesen. Auf meiner TODO Liste steht, dass ich die Daten mit dem neuen Wadoku Export in Edict-Format abgleiche und ergänze. Bei Präfixen und Suffixen muss ich unterschiedliche Formate berücksichtigen, evtl. muss ich ein paar Einträge per Hand ergänzen.

Wenn Interesse besteht, kann ich ein Anki-Deck aus den kompletten Daten machen. Korrekturen und Ergänzungen darin kann ich dann automatisch einlesen. Ich kann auch ein Webinterface oder ein Anki Plugin schreiben, das beim Nachschlagen auf Wadoku oder Edict hilft. Aber vielleicht sollte ich vorher noch das bereinigen, was ich automatisch bereinigen kann. Ich habe schon damit angefangen ...

Samukun wrote:Dass bei manchen Sachen nichts dahinter steht, ist komisch. Das kann man sich mit den umgebenen Einträgen herleiten, aber dennoch komisch.

Das liegt daran, dass ich die JLPT Informationen aus einer Datenquelle habe (Thierry Bézecourt http://www.thbz.org) und die Bedeutungen aus anderen (alter Wadoku Export, Edict) und sie matchen nicht komplett. Ich wollte das eigentlich schon lange ergänzen bzw. korrigieren ... mal schauen, wann ich dazu komme. Also ich kann keine Garantie geben, dass alles 100%ig stimmt. Ergänzungen und Korrekturen sind jederzeit willkommen.

Ich freu mich.

Freut mich
Ich habe es vor ein paar Jahren mit dieser Anleitung geschafft: http://www.japanisch-netzwerk.de/Thread-PDA-Palm-Zaurus-Zusammenfassung
Samukun wrote:Hey Danke!
Sieht ja recht übersichtlich aus. Zwar immernoch nicht ganz, was ich suche, aber auf jeden Fall nützlich.
Hier http://kanjiabc.net/index.cgi?rm=vocabulary&=DE kann man Kanjis eingeben und diese bzw. Kanjikomposita nach JLPT-Level ordnen lassen. Auch nicht schlecht.


Und wenn du bei der Kanji ABC Vokabel-Funktion den Haken setzt vor "auf Vokabeln beschränken, die ausschließlich mit den angegebenen Kanji (und Kana) geschrieben werden können", dann hast du die Funktion, die du gesucht hast, allerdings beschränkt auf JLPT Vokabeln. Du kannst dann noch auswählen, ob du nur Vokabeln eines bestimmten Levels sehen möchtest oder alle Levels.
mkill wrote:Gäbe es den Thread nicht hätte ich die Links eh nicht bemerkt. Alles halb so wild.


Also du meinst, diese Art von Werbung stört nicht so sehr, oder Werbung allgemein würde dich nicht stören?
Es gab mal Google Werbung auf Wadoku, die hatte ziemlich wenig mit den Inhalten der Seite zu tun und hat nicht furchtbar viel Geld gebracht. Ich habe mich dann um Sponsoren bemüht, die mehr mit unsrem Thema, also Japan und Japanisch- bzw. Deutschlernen, Anime und Manga etc. zu tun haben. Außerdem habe ich ein sehr interessantes Angebot bekommen von einer Firma, die uns Sponsoren beschaffen wollte, was eine ordentliche Summe eingebracht hätte. Allerdings war die Voraussetzung, dass die Sponsoren auch ein wenig sichtbar sind, also nicht auf einer extra Seite, die sich sowieso niemand anschaut. Aber es sollte auch keine aufdringliche Werbung sein.

Thomas und einige andere meinten jedoch, sie wollten gar keine Werbung auf der Seite haben, höchstens eben eine extra Seite, wo die Sponsoren genannt werden. Das Vorbild sei eher Wikipedia als Leo. Um so mehr habe ich mich gewundert, als ich die Links zur Pokerzentrale und zu Woxikon gesehen habe. Ich habe von Thomas noch keine befriedigende Antwort auf diesen Widerspruch bekommen. Ihm gehört die Seite.
Die Konvertierung der Wörterbuch-Daten ins EPWING-Format wurde freundlicherweise von Herrn Thomas König im Rahmen eines Praktikums erledigt.


Auf der Basis seines Codes sollte man doch sehr einfach auch eine edict-Version erzeugen können. Ist das schon geplant? Sonst würde ich das gerne übernehmen. An wen muß ich mich wenden?
Der csv Export enthält html bei der deutschen Bedeutung. Wenn man das weg bekommen könnte, könnte man die Template vermutlich sehr leicht für edict Einträge umwandeln.
Ich hätte prinzipiell nichts dagegen, den Konverter zu schreiben, habe zwar schon mit dtds, aber noch nie mit xsd gearbeitet.

Als ich mich per Hand durch die xsd gehangelt habe, habe ich mich gefragt, ob es da schon Tools gibt, die das ganze menschenfreundlicher machen, die ihr mir empfehlen könnt?

Aber eigentlich würde mir schon das XSL für die Standard-Wadoku-Seite reichen, das ich für edict anpassen könnte.
Den Befehl findet man auch auf der Seite, die bereits zitiert habe: http://dev.mysql.com/doc/refman/5.0/en/charset-connection.html

Ich würde gerne Unterstützung für das Projekt einwerben und hätte da auch schon Interessenten, die sicher weiter helfen könnten und denen es gefallen hat, dass ich mit JWPce das Wadoku auf dem Handy mit mir dabei hatte.

Als ich eben für eine Installationsanleitung auf die Suche nach einer aktuellen Version von Wadoku im Edict-Format gegangen bin, habe ich nur die von 2003 gefunden. Ich bin zwar in der Lage, aus dem SQL-Dump von 2006 eine edict-Version zu bauen, aber für meine potentiellen Förderer des Wadoku Projektes ist das nichts. Ich kann sie zwar einmalig beliefern, aber das wirkt nicht wirklich gut auf Dauer.

Wie weit sind die Pläne gediehen zur Bereitstellung von Downloads?
Ich vermute mal, es liegt an der Verbindung, vielleicht hilft das hier: http://dev.mysql.com/doc/refman/5.0/en/charset-connection.html
 
Forum Index » Profile for Ulrike Schmidt » Messages posted by Ulrike Schmidt
Go to: