Author |
Message |
|
Moo
Joined: 01/03/2007 18:55:56
Messages: 74
Offline
|
Hallo,
gibt's eigentlich für PDFs auch so was Praktisches wie rikaichan? Das fehlt mir noch zu meinem Glück.
|
|
 |
|
viokochan
Joined: 05/09/2007 22:19:49
Messages: 6
Offline
|
ich habe open office japanisch herunter geladen... die Texte kann man als lesbare PDF Dateien exportieren. das tut word nicht
|
|
 |
|
Moo
Joined: 01/03/2007 18:55:56
Messages: 74
Offline
|
Das geht auch mit Open Office Deutsch.
Mir geht es um etwas anderes: Ich habe japanische PDFs, bei denen ich unbekannte Vokabeln möglichst bequem nachschlagen will. Die einfache Lösung wäre, den Text zu kopieren, bei Firefox oder Thunderbird in ein Textfeld einzufügen und dann ganz normal mit Rikaichan zu arbeiten. Ein Teil dieser PDFs ist aber geschützt, d.h. ich kann keinen Text entnehmen.
Nun gibt es Programme, die PDFs in Text umwandeln können, beispielsweise PDF2TXT, das ich gerade ausprobiere. Das kommt aber mit japanischen PDFs nicht zurecht, auch nicht mit ungeschützten.
Kennt jemand ein Programm, das funktioniert?
|
|
 |
|
viokochan
Joined: 05/09/2007 22:19:49
Messages: 6
Offline
|
wie wäre es z.B. mit einem japanischen Texterkennungssoftware?
ich benutze Yonde! koko
eine andere kostenlose Möglichkeit:
die kostenlose japanischen Software OCR SmartOCR Lite Edition downzuloaden.
für Windows-
http://ocr.rossa.cc/index.html
die PDF-Datei als bild-datei zu transformieren ... z.B. JPEG und dann mit dem OCR erkennen lassen ....
schöne Grüße
|
|
 |
|
Moo
Joined: 01/03/2007 18:55:56
Messages: 74
Offline
|
Da muß ich die PDFs alle ausdrucken und dann einscannen, oder? Na ja, wenn's nicht anders geht ...
|
|
 |
|
viokochan
Joined: 05/09/2007 22:19:49
Messages: 6
Offline
|
nicht unbedingt. man kann die PDF unter speichern als in anderes Format transformieren. das habe ich eben geprüft
|
|
 |
|
Moo
Joined: 01/03/2007 18:55:56
Messages: 74
Offline
|
Also, nehmen wir an, ich habe als Ausgangsmaterial ein geschütztes japanisches PDF.
Zum Beispiel von dieser Seite: http://www.nhk.or.jp/pr/keiei/hensei/hensei02.htm
Wie kann ich das jetzt in ein anderes Format umwandeln?
|
|
 |
|
viokochan
Joined: 05/09/2007 22:19:49
Messages: 6
Offline
|
endlich kann ich antworten...
Du hast Recht, es ist eine Nicht-lesbare PDF-Datei
um daraus eine Bilddatei zu machen ohne auszudrucken und scannen, kann man Seite für Seite mit Printscreen photographieren und als JPG-Datei speichern.
als Hilfsprogramm kann man z.B. diese kostenlose Software herunterladen und installieren.
Gadwin PrintScreen
Aber ehrlich gesagt, wäre mir das ausdrucken mit einscannen einfacher. soviele Seiten sind es nicht
http://www.gadwin.com/download/index.htm#PrintScreen
dann kann man die Sofware "erkennen", mit der japanischen OCR-Software . eventuell Seite für Seite, weil die Software kostenlos ist.
SmartOCRLite
http://www.4shared.com/dir/1006463/575b200b/public.html
Hoffentlich findest du eine gute Lösung
|
|
 |
|
Dan
![[Avatar]](/forum/images/avatar/45c48cce2e2d7fbdea1afc51c7c6ad26.png)
Joined: 24/05/2006 16:58:45
Messages: 1287
Offline
|
Hmm, schon mal einen anderen PDF-Viewer als den von Adobe probiert?
Zumindest Evince (Linux) scheint keine Probleme mit dem Kopieren von Text aus deinem PDF zu haben.
|
無知の知 |
|
 |
|
Moo
Joined: 01/03/2007 18:55:56
Messages: 74
Offline
|
Dan wrote:Hmm, schon mal einen anderen PDF-Viewer als den von Adobe probiert?
Zumindest Evince (Linux) scheint keine Probleme mit dem Kopieren von Text aus deinem PDF zu haben.
Ach ja, das gute Linux ... Irgendwann wird mein Leidensdruck hoch genug sein für den Wechsel.
Mein Standard-PDF-Viewer ist Foxit Reader, weil der viel schneller startet als Adobe und nicht ständig nach Hause telefoniert. Foxit hält sich aber auch streng an den Entnahmeschutz. In der Praxis kann ich damit nicht mal ungeschützten japanischen Text kopieren, weil in der Zwischenablage nur unleserlicher Quatsch ankommt. Zum Lesen ist er aber okay.
Ich hab jetzt doch ein Programm gefunden, das tut, was es soll: A-PDF Restrictions Remover.
An Screenshots habe ich auch schon gedacht, aber die Auflösung der Bilddatei dürfte viel zu gering sein, als daß ein OCR was damit anfangen könnte.
|
|
 |
|
Dan
![[Avatar]](/forum/images/avatar/45c48cce2e2d7fbdea1afc51c7c6ad26.png)
Joined: 24/05/2006 16:58:45
Messages: 1287
Offline
|
Achja, da fällt mir noch ein, dass es unter Linux auch ein Tool namens "pdftotext" gibt, das genau das macht, was der Name sagt, das hatte mit dem obigen PDF auch keine Probleme  Da gibts bestimmt auch ne Windows-Version von.
|
無知の知 |
|
 |
|