Message |
|
Ok, ich habe basierend auf der EDICT-Datei ein CSV gemacht. War recht viel Handarbeit nötig, hoffentlich sind keine Fehler passiert. Das File ist so optimiert, dass es mit
create table wadoku (pattern varchar(1000) not null,
reading varchar(100) not null,
translation varchar(1000) not null)
character set utf8 collate utf8_general_ci;
load data infile 'C:\\dein_verzeichnis\\wadoku.csv' into table wadoku character set utf8 fields terminated by ',';
in eine MySql Datenbank geladen werden kann. Falls es mehrere Ausdrücke oder Übersetzungen gibt, sind diese mit dem Zeichen "|" voneinander getrennt (man kann dieses Trennzeichen aber auch gerne durch ein anderes ersetzten). Ein echtes Komma ist mit "\" escaped.
Ich habe leider keinen Web Space: wenn jemand die Datei (10 MB) möchte, kann ich sie gerne irgendwohin hochladen.
Viele Grüsse,
Chris
|
 |
|
Danke für die Hinweise, ich würde gerne eine CSV Datei machen und sie dann zur Verfügung stellen, aber:
- Wo befindet sich denn die aktuelle EDICT-Datei? Im Bereich "Links" finde ich (noch?) nichts.
- Ein neuer Dump wäre super, wenn das aber nicht geht/gewünscht ist, würde ich den von 2006 nehmen. Ist aber irgendwie doch schade, oder? Ein konsistenter Stand aus EPWING, EDICT, DUMP und CSV wäre schön.
PS: Auf dem Web findet man irgeandwo PDICCONV, ein "EPWING nach EDICT"-Konversionsscript in Perl, hab' ich aber nicht zum laufen gebracht.
Gruss,
Chris
|
 |
|
Kennt jemand einen einfachen Weg, EPWING in einer CSV-Datei umzuwandeln. Oder habe ich eine triviale Methode verpasst irgendwie anders an eine solche "flache" Datei zu kommen? Im Web gibt es eine alte, aus dem Jahr 2003 stammende Datei, aber da hat sich ja viel getan...
Danke und Gruss,
Chris
|
 |
|
|
|