so ich hab mal meine "ultradollen" java converter auf github gepusht.
Der Hauptvorteil daran ist, das man sich nicht selbst um das xsl kümmern muss, es sei denn man will das es ganz anders ausgegeben werden soll und sich nicht per einfachen java replaceAll und regex zu realisieren ist.
Auserdem wird das xml geladen und dann jeder entry einzeln geparsed so das man nicht über 1GB RAM braucht um die wadoku.xml Datei zu parsen.
Das ganze ist dann noch OOP orientiert sodas man einfach neue Exporter und Importer schreiben kann.
Ein weiterer Vorteil ist das man direkt aus dem Java Code auch z.b. statt die Daten zu konvertierne sie auch direkt in eine Datenbank oder ähnliches stecken kann.
Es ist wirklich nichts besonderes und noch was hässlich da momentan eher alles hart kodiert ist, die main Methode ist noch nicht fertig und der IndexedSQLiteExporter auch nicht, nur ein pseudo TabfileExporter zum testen.
der JMdictImporter scheint recht gut zu laufen, beim WadokuImporter bin ich mir noch nicht sicher ob er bei der Deutschen Übersetzung alles richtig macht in dem wadoku_entry_german.xsl Script.
Auserdem musste ich komische Hacks im xsl Skript machen, da beim bearbeiten von den einzelnen entrys die Funktionen position() und last() Werte nicht immer stimmen und ich entweder eine Konstante abziehen musste:
<xsl:if test="count(../wd:sense)>1">
<xsl:text>[</xsl:text>
<xsl:value-of select="position()-2"/>
<xsl:text>]</xsl:text>
oder mit count() es manuell machen berechnen musste..
warum auch immer .... also die Ergebnisse sollten noch erstmal Überprüft und das xsl verschönert werden.
Der code soltle ein eclipse projekt ordner sein (hoffe alle eclipse file sind dabei die man braucht)
https://github.com/boscowitch/WajitenxsltConverter
Momentan kann man ein Import/Export so machen indem man einfach
sich den gewünschten Importer und Exporter erzeugt durch:
WadokuImporter in = new WadokuImporter("HIER/PFAD/ZUR/WADOKU/XML/DATEI");
TabfileExporter ex = new TabfileExporter();
(alternativ kann man hier auch eine export Datei angeben durch:
TabfileExporter ex = new TabfileExporter("PFAD/exported_tabfile.txt");
(wenn nicht gibt erst einfach in der Shell aus)
ex.export(in);
als nächstes wollte ich jetzt meine SQLexporter machen und noch ein Mulieplen exporter der in mehrere Formate auf einmal exportiert.
Natürlich fehlt noch eine schönere Main Methode damit man alles per Parameter übergeben kann.
EDIT:
Entschuldigung wegen dem zusammen kopierten Text,
habe ihn einmal grob verbessert hoffe das alle "nen" und "en" weg sind

.
@Dan mit dem Projekt Dateien hast du recht, ich finde das auch nicht so gut,
Ich habe nur noch nie ein Java Projekt veröffentlicht oder gar ein ant script selbst erstellt. Das mit dem Maven klinkt interessant.