Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Messages posted by: raizen
Forum Index » Profile for raizen » Messages posted by raizen
Message
Ok, ich habe basierend auf der EDICT-Datei ein CSV gemacht. War recht viel Handarbeit nötig, hoffentlich sind keine Fehler passiert. Das File ist so optimiert, dass es mit

create table wadoku (pattern varchar(1000) not null,
reading varchar(100) not null,
translation varchar(1000) not null)
character set utf8 collate utf8_general_ci;

load data infile 'C:\\dein_verzeichnis\\wadoku.csv' into table wadoku character set utf8 fields terminated by ',';

in eine MySql Datenbank geladen werden kann. Falls es mehrere Ausdrücke oder Übersetzungen gibt, sind diese mit dem Zeichen "|" voneinander getrennt (man kann dieses Trennzeichen aber auch gerne durch ein anderes ersetzten). Ein echtes Komma ist mit "\" escaped.

Ich habe leider keinen Web Space: wenn jemand die Datei (10 MB) möchte, kann ich sie gerne irgendwohin hochladen.

Viele Grüsse,
Chris
Danke für die Hinweise, ich würde gerne eine CSV Datei machen und sie dann zur Verfügung stellen, aber:
- Wo befindet sich denn die aktuelle EDICT-Datei? Im Bereich "Links" finde ich (noch?) nichts.
- Ein neuer Dump wäre super, wenn das aber nicht geht/gewünscht ist, würde ich den von 2006 nehmen. Ist aber irgendwie doch schade, oder? Ein konsistenter Stand aus EPWING, EDICT, DUMP und CSV wäre schön.

PS: Auf dem Web findet man irgeandwo PDICCONV, ein "EPWING nach EDICT"-Konversionsscript in Perl, hab' ich aber nicht zum laufen gebracht.

Gruss,
Chris
Kennt jemand einen einfachen Weg, EPWING in einer CSV-Datei umzuwandeln. Oder habe ich eine triviale Methode verpasst irgendwie anders an eine solche "flache" Datei zu kommen? Im Web gibt es eine alte, aus dem Jahr 2003 stammende Datei, aber da hat sich ja viel getan...

Danke und Gruss,
Chris
 
Forum Index » Profile for raizen » Messages posted by raizen
Go to: