Wadoku.de Forum
  [Search] Search   [Recent Topics] Recent Topics   [Hottest Topics] Hottest Topics  
[Register] Register /  [Login] Login 
Messages posted by: boscowitch
Forum Index » Profile for boscowitch » Messages posted by boscowitch
Message
Hallo,

Entschuldigt das ich diesen alten Thread nochmal weiterführe, ich habe letztens mal ein bisschen nach dem besten Japanischen OCR (auf Japanisch) gegoogelt und noch ein weiteres gefunden.

Panasonic 読取革命

Gibt es schon Erfahrungsberichte ? Ich werden es mal testen, es gibt wohl eine 10 Tage Testversion:
"読取革命Ver.14 体験版ファイルのダウンロード ....「読取革命Ver.14」を10日間無料"

http://panasonic.co.jp/sn/psn/pstc/products/yomikaku/


Sonst noch einmal Dank für die anderen Namen wie 読んde!!ココ werde es auch mal testen.


EDIT: "体験版は、64ビットOSでは動作しません"
leider scheint die Testversion nicht mit 64bit Windows zu funktionieren!

Habe es aber mit wine unter Linux zum laufen gebracht, einfach vorm starten noch LANG=ja_JP.UTF-8 damit man den Text lesen kann.
Meine vorschläge wären:

A: vielleicht 国語辞典 statt 日本語の辞書 benutzen

B: うん、だけど一冊しかありません demo und dakedo is irgendwie doppelt gemoppelt und issatu ist ok heißt aber wörtlich: ich habe nur eine Ausgabe und nicht nur 1 Buch, aber von der Bedeutung her ist das ja gewollt.

A: あ、ならいい、ほかの人頼むから。 (habe es was geändert in: ah dann ist gut, werden eine andere Person bitten/fragen)


der Rest wirkt auf den ersten Blick ok.
leider kenne ich jetzt kein Shop,

aber ich könnte dir das Ex-word XD-GF7150 empfehlen.
Das ist zwar schon 2 jahre alt aber dafür sollte es jetzt billiger sein und es tut nach ca 2-3Jahren immer noch seinen job.
Es ist sehr robust dank dem Metallschutz des Displays. Die Batterien halten auch recht lange (in Deutschland Jahre, wenn ich in Japan war immer so gute 1-2 Monate bei täglicher intensiver Nutzung auch mit Hintergrundbeleuchtung)

(damals vor 2 jahren ~50.000yen also damals ca 300€ da war der Wechselkurs super 1€ = 170)
letztes jahr habe ich das Runtergesetzt auf so 30.000-40.000 in Akihabara gesehen (also auch leider wieder ca 300€).

Der Nachfolger kostet leider fast 60.000 - 70.000, weil der ein Farbdisplay hat für Bilder und Lexikons,
Wenns dir nur um Wörterbücher geht und um einen guten Preis bietet sich aber die Vorgänger eher an falls man den noch bekommt, wenn ja sollte er vielleicht nochmal billiger sein da sie jetzt schon ca 3 Jahre alt sind)

Hier gibts mehr Infos auf Japanisch http://casio.jp/exword/

Wenn dir das Ex-word XD-GF7150 zu groß ist gibt es auch noch eine kleinere Version, ich glaube das alle mit XD-GF am Anfang das Deutsche Wörterbuch Set haben bin mir aber nicht mehr 100%ig sicher.

EDIT:
Ich hab es in einem Onlineshop gesehen der auserhalb Japans liefert für 28$ mehr.
http://www.whiterabbitpress.com/catalog/Casio-EX-word-XD-GF7150-Japanese-German-English-Electronic-Dicti-p-16670.html
Leider ist da doch nicht niedriger mit Lieferung ins Ausland 474 US-Dollar = 331,16747 Euro (nach google)
Da wäre ich auch Interessiert was es da alles gibt.

Das einzige was mir einfällt ist Stardict, aber das finde icih nicht ideal weil man nur in eine Richtung schnell suchen kann mit wadoku (Japanisch -> Deutsch).
oha da habe ich wohl noch ein < vergessen zu entfernen oder ein >. welches Wort/Kanji hattest du den zuletzt makiert ? es muss wohl ein Zählwort gewesen sein mit sowas wie "<Def.: .. Zählwort...." das er aus versehen als markup parsen wollte.
Das sollte aber nicht immer passieren.
Niremori wrote:
boscowitch wrote:hehe jo im japanischen Stiel von oben nach unten, Rechts nach Links auf dem Rücken sollte es gehen wenn man nich allzu klein ist.

hat bestimmt was so den Rücken als "schriftrolle",
falls es irgendwann bilder davon gibt wäre ich interresiert wie das ausschaut und wirkt.


Das wirkt etwa so, wie dein Deutsch.

niremori


so hab ich mir das auch gedacht...
scheinbar wird es aber doch gemacht

Jemand der sich in japanischer Kalligraphie auskennt kenne ich leider nicht.

Aber wenn es nur groß sein sollte ist es kein Problem den Satz zu kopieren und in z.b. Word einzufügen und die Schriftgröße zu erhöhen und noch eine Handschriftliche Schriftart mit Japanischen Zeichen auszuwählen.

PS: zu meinem Deutsch, es tut mir leid das es immer wieder falsch ist, ich gebe mir Mühe.
leider habe ich es nie wirklich gelernt (ohne Witz) obwohl ich viel lese und auch auf höheren Schulen war / bin hab ich immer eine gravierendes Rechtschreibe und Zeichensetzung Problem das in der Grundschule nicht korrigiert wurde.
hehe jo im japanischen Stiel von oben nach unten, Rechts nach Links auf dem Rücken sollte es gehen wenn man nich allzu klein ist.

hat bestimmt was so den Rücken als "schriftrolle",
falls es irgendwann bilder davon gibt wäre ich interresiert wie das ausschaut und wirkt.
Falls man noch höflicher sein will gibts doch noch statt ii zu nutzen das yoroshi:

xxxさんにとっては、何時にどこで会うのがよろしいですか。


Und nöch höfflicher wäre wenn man vielleicht noch ご都合 benutzt, wobei ich da nicht genau sicher bin wie man das richtig verknüpfen würde:

どこで何時にご都合がよろしいですか
oha das heißt also das es Einträge gibt die ca 1 Jahr alt sind und trotzdem noch nicht geprüft sind, das heißt also noch viel zu tun.

kann man denn dabei helfen ? durch z.b. suchen von belegen zum Gebrauch des Wortes oder kann das nur ein Moderator/Admin ?
Und könnte man sich diese noch nicht Exportierten Einträge irgendwie auflisten lassen ?
Ich habe mal die Anzahl der Einträge von der XML Datei und meinem älteren von der Website direkt erstellte Gjiten Version mal verglichen und so ca um die 10.000 weniger hat.

erst dachte ich das es vielleicht viele Löschungen gab oder Fehler bei der Interpretation der Daten von der Website.

nun habe ich aber 2 Einträge gefunden die immer noch in der neuen Website vorhanden sind aber nicht in den XML Daten:



昏眠

und

困民党

ist das Absicht ? und wenn ja warum ?
mal von der Anfrage abgesehen, sind japanische Beleidigungen nicht so sprachlich stark, Das heist nicht das sie in japan nicht beleidigend sind aber wörtlich übersetzt habe ich noch keine wirklich "krasse" Beleidigung auf japanisch gehört.

ich würd mir für sowas eher Latein oder was anderes totes nehmen, das toter ist als japanisch. Dann trifft es keine spezielle Volksgruppe (auser vielleicht den Vatikan).

Natürlich könnten dann vielleicht auch Mediziner das verstehen, die dich vielleicht mal aus dem Auto retten müssen .
so ich hab mal meine "ultradollen" java converter auf github gepusht.
Der Hauptvorteil daran ist, das man sich nicht selbst um das xsl kümmern muss, es sei denn man will das es ganz anders ausgegeben werden soll und sich nicht per einfachen java replaceAll und regex zu realisieren ist.

Auserdem wird das xml geladen und dann jeder entry einzeln geparsed so das man nicht über 1GB RAM braucht um die wadoku.xml Datei zu parsen.
Das ganze ist dann noch OOP orientiert sodas man einfach neue Exporter und Importer schreiben kann.

Ein weiterer Vorteil ist das man direkt aus dem Java Code auch z.b. statt die Daten zu konvertierne sie auch direkt in eine Datenbank oder ähnliches stecken kann.

Es ist wirklich nichts besonderes und noch was hässlich da momentan eher alles hart kodiert ist, die main Methode ist noch nicht fertig und der IndexedSQLiteExporter auch nicht, nur ein pseudo TabfileExporter zum testen.

der JMdictImporter scheint recht gut zu laufen, beim WadokuImporter bin ich mir noch nicht sicher ob er bei der Deutschen Übersetzung alles richtig macht in dem wadoku_entry_german.xsl Script.


Auserdem musste ich komische Hacks im xsl Skript machen, da beim bearbeiten von den einzelnen entrys die Funktionen position() und last() Werte nicht immer stimmen und ich entweder eine Konstante abziehen musste:
<xsl:if test="count(../wd:sense)>1">
<xsl:text>[</xsl:text>
<xsl:value-of select="position()-2"/>
<xsl:text>]</xsl:text>

oder mit count() es manuell machen berechnen musste..

warum auch immer .... also die Ergebnisse sollten noch erstmal Überprüft und das xsl verschönert werden.

Der code soltle ein eclipse projekt ordner sein (hoffe alle eclipse file sind dabei die man braucht)

https://github.com/boscowitch/WajitenxsltConverter

Momentan kann man ein Import/Export so machen indem man einfach
sich den gewünschten Importer und Exporter erzeugt durch:

WadokuImporter in = new WadokuImporter("HIER/PFAD/ZUR/WADOKU/XML/DATEI");

TabfileExporter ex = new TabfileExporter();

(alternativ kann man hier auch eine export Datei angeben durch:
TabfileExporter ex = new TabfileExporter("PFAD/exported_tabfile.txt");

(wenn nicht gibt erst einfach in der Shell aus)

ex.export(in);


als nächstes wollte ich jetzt meine SQLexporter machen und noch ein Mulieplen exporter der in mehrere Formate auf einmal exportiert.

Natürlich fehlt noch eine schönere Main Methode damit man alles per Parameter übergeben kann.

EDIT:
Entschuldigung wegen dem zusammen kopierten Text,
habe ihn einmal grob verbessert hoffe das alle "nen" und "en" weg sind .

@Dan mit dem Projekt Dateien hast du recht, ich finde das auch nicht so gut,
Ich habe nur noch nie ein Java Projekt veröffentlicht oder gar ein ant script selbst erstellt. Das mit dem Maven klinkt interessant.
also sowas mach ich imemr über wikipedia.

ich erinnerte mich düster an schule und einen sogenanten Wahrenkorb durch den man durch verschiedene sachen, nahrungsmittel ect bestimmen kann wie viel man fürs geld gerade bekommt also den "wert" (manchmal auch idiotisch wie fraunhüte, das sind dann tricks der bürokraten um uns zu veräppeln das die preise nich steigen

dann gabs leider kein link zum jap verion aber zum österreichischen und englishen, dort gabs dann direkt am anfang den sogennanten CPI Consumer price index, und der hat auch nen jap artikel

dort heist das ganz lang:
消費者物価指数(しょうひしゃぶっかしすう、英: Consumer Price Index)

http://ja.wikipedia.org/wiki/%E6%B6%88%E8%B2%BB%E8%80%85%E7%89%A9%E4%BE%A1%E6%8C%87%E6%95%B0

da ist auch nen diagramm aber das sag nich viel aus und geht nur bis 1989 zurück aber kannst bestimmt mit googlen längere und bessere finden.

es gibt noch andere interresante begriffe in dem bezug den z.b.:
http://ja.wikipedia.org/wiki/%E7%89%A9%E4%BE%A1%E6%8C%87%E6%95%B0
物価(ぶっか:price, price of commodity) (Preisindex) was ne Haushalt so im jahr an ausgaben hat

aber wie gesagt ich bin auch kein VWL oder BWL genau kann ichs nicht erklären

edit:
hier hat jemand was ähnliches 2007 gefragt
http://oshiete.goo.ne.jp/qa/3394528.html leider gibts keine einfache antwort oder tolles diagramm

edit:

das hier ist aber schonmal recht gut als überblick, da hat jemand gefragt nach dem jahres durchschnitts einkommen auch von 1970 also ca vor 40 jahre gefragt:
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1134882611

1970年(=30歳代) 484万円 also 4840000 yen
hi, also ich schreibe mir gerade einen simplen converter in java,
der nutzt xslt um sich die informationen zu extrahieren die er will und geht entry per entry durch.

sich eine cvs oder db zu machen ist auch ziel davon als erstes eine simple sqlite file, ein tab-file für stardict conversion und ein gjiten file.

das ganze kann man auch per xsl selbst machen, xslt ist eine xml technik und eine sehr minimale "sprache" zum umwandeln der daten.

die ausgabe auf der website aus der datenbank entsteht auch per xslt aus xml daten die blos in einer db spalte sind also wird ein db dump nicht sehr hilfreich sein auser man will gecached output mti html durchsetzt.

also das schnellste ist sich die xsl files anzugucken das anzupassen und die wadoku xml datei + xsl file durch einen xslt parser zu schicken (das benötigt viel ram daher mach ich einen java converter der das xsl script nru immer auf 1. entry ausführt)

für alle die das mit dem xsl zu compliziert finden versuch ich eben meinensimplen javan converter zu machen, der intern xslt benutzt aber dann einfach eine Entry struktur mit den feldern

japanese, reading und translation
Das hab ich auch nich so ganz verstanden, beim googeln fand ich 2 erklärungsversuche aber na ja sie wiedersprechen sich ein bischen

子の云う事を八九きくな (相手の話も聞け。でも子は信じろ)

「子の云うこと八九きくな」は、子の言うことばかり聞かないで相手の話も聞け

was bei beiden jedoch gleich ist ist: 相手の話も聞け


also das 1. sagt höhr auch auf dein partner/gegenüber aber glaube kinder.
und das 2. höhr nich nur auf kinder sonder auch auf dein parter/....
 
Forum Index » Profile for boscowitch » Messages posted by boscowitch
Go to: