Antworten auf deine Fragen:
Neues Thema erstellen

[CS5] - Gescannte Buchseite optimieren

O

Ostfriesland_User

Guest

Ich habe eine Dissertation, die nicht publiziert wurde, abfotografiert. Zwar mit Stativ, aber aufgrund der miserablen Bindung des Buches naturgemäß schief und mit großem Rand. Da es fast 700 JPG Dateien sind, wollte ich fragen, ob man die Optimierung automatisieren kann. Ich habe mal eine Textseite angehängt. Die Qualität ist schon recht gut, wenn man bedenkt, dass die Dissertation einst kopiert wurde, dann auf Mikrofilm gebannt wurde, um dann wieder ausgedruckt zu werden, damit ich sie abfotografieren konnte. Wichtig ist mir zunächst die gerade Ausrichtung der Seiten. Die Ränder kann man, wenn der Text gerade ist, recht zuverlässig mit dem ScanTailor ausrichten. Leider funktioniert dort die Ausrichtung gar nicht. http://www.abload.de/image.php?img=p1040766okuep.jpg
 

Photoshop

O

Ostfriesland_User

Guest

AW: Gescannte Buchseite optimieren

Versuch es mit einem OCR Programm, das müsste den Text sauber nimkriegen und das Ausrichten sollte automatisch geschehen.

Hi, danke für den Hinweis. Das habe ich aber schon versucht, der Text ist aber insgesamt qualitativ zu schlecht, als dass eine OCR-Software sinnvoll wäre...
 

fegfan

Aktives Mitglied

AW: Gescannte Buchseite optimieren

Hab bei mir die Seite mal auf verschiedenen Wegen einzulesen versucht. Die Qualität ist grottenschlecht. Der Zeitaufwand, das neu zu fotografieren (scannen/Kopieren) und ein gutes Licht zu verwenden, ist wohl weit weniger Arbeit. Programme wie Omnipage Pro 18 können dann direkt von der Camera einlesen und den Text erfassen. Ich wäre der Meinung, dass das weniger Arbeit bedeutet. Ich stelle bei Text immer wieder fest, dass die Aufnahmequalität die beste Vorbereitung für das OCR ist. Alles andere kostet Zeit, Zeit, Zeit.

Wenn es aber einen Weg gibt, mit dieser schlechten Qualität ein gelungenes OCR zu erstellen (immerhin sind es 700 Seiten), dann würde ich diesen Weg gerne kennen lernen.

Gutes Gelingen!
 

buerzel

Versuch macht kluch!

Teammitglied
AW: Gescannte Buchseite optimieren

Das mit der OCR wird nicht funzen. Habe die Probeseite mal durch den Acrobat gejagt - der erkennt NICHTS. Die Ausrichtungskorrektur der OCR Progrmme ist halt auf Scanner optimiert. Was den Fall hier kompliziert, ist das die Seiten perspektivisch verzerrt sind. Da ist mir bislang kein Programm bekannt, das die Seiten automatisch plan bzw. zu Rechtecken macht.
 
Zuletzt bearbeitet:

K7Didi

Aktives Mitglied

AW: Gescannte Buchseite optimieren

Hi,
leider hast du keine Angabe gemacht welche Programme du zur Verfügung hast. Einfach ins Profil schreiben.
In Photoschop (cs6) geht das gut mit Perspektivisches Freistellenwerkzeug, dies in eine Aktion aufnehmen , vorrausgesetzt sie sind alle gleich fotografiert. Soweit das ausrichten. Das Bild selbst ist nicht gut ausgeleuchtet,die Nachbearbeitung ist aufwendig wenn die Schrift Schwarz und das Papier weis werden soll. Über ein ORC fände ich auch die beste Lösung, aber ob das bei der Bildqualität geht ?
Gruß K7didi
Seite ausgerichtet: http://www.psd-tutorials.de/forum/[...mage.php?img=psd_geraderichten2bpkre.jpg]BildBild "psd_geraderichten2bpkre.jpg" anzeigen.
Ps: Abschreiben wäre ja auch noch eine Möglichkeit:hmpf:
 
Zuletzt bearbeitet:
L

Lycanos

Guest

AW: Gescannte Buchseite optimieren

Habe mir mal den Spaß gemacht und das Foto über automatische Tonwertkorrektur aufgehellt und dann durch Omnipage 18 laufen lassen. Das Ergebnis habe ich dann als PDF und Doc als reinen Text gespeichert. Das Problem wird hierbei aber die Rechtschreibkorrektur sein. Macht verdammt viel Arbeit. Vielleicht wäre neues Einscannen schon mal ein Anfang. Grundsätzlich ist die OCR-Schiene aber umsetzbar.
 

Preach

schon 'ne Weile dabei

AW: Gescannte Buchseite optimieren

Wenn es extra für dich ausgedruckt wurde, dann würde ich die Bindung abschneiden. In Druckerrei oder Buchbinderei gibt es solche Scheren.
Dann jagst du die Seiten über einen Scanner mit Einzelblatteinzug.
das dürfte allemal schneller sein und mit dem richtigen OCR zu 99-100% funktionieren
 

berniecook

Photo-Fan

AW: Gescannte Buchseite optimieren

Hallo,
ich würde an Deiner Stelle die JPGS erstmal alle in Bezug auf Erhöhung des Kontrastes bearbeiten. Anschließend das ganze gerade richten und dann erst OCR Software drüberlaufen lassen.
Deine Bilder wurden offensichtlich als Graustufenbilder abfotografiert. Ich hätte hier auf jeden Fall RAW Bilder gemacht und mit einem Reprostativ gearbeitet, bei den ich den Abstand genau auf die Makrofunktion des verwendeten Objektivs eingestellt hätte. Schon beim Fotografieren hätte ich auf einen möglichst hohen Kontrast der Buchstaben zum Hintegrund geachtet. Damit wäre eine spätere OCR Erkennung um einiges einfacher gewesen.

Grüße

Grüße
 

Rata

AW: Gescannte Buchseite optimieren

Wichtig ist mir zunächst die gerade Ausrichtung der Seiten.


Also, Vorschlag, gerade ein wenig mit rumgespielt, bei 700 Seiten wird das aber eine Fleißarbeit :lol:
Am Mac® mit Photoshop™ Deiner Wahl – es reicht schon Version 6 ;) – und z.B. ABBYY FineReader Express™ (v.8) als OCR-Programm ...



1)

a) Bild in PS öffnen, Brightness +20 und Contrast +100 einstellen
b) Mit Befehl L die Levels noch ein wenig anpassen
c) Auswahl-Rahmen um den Textteil ziehen, Transform ---> Distort und bei gutem Augenmaß ohne Hilfslinien, sonst mit die linken Ecken der Auswahl senkrecht nach oben und unten ziehen, ... solange bis es passt.
d) In höchster Qualität wieder als JPG abspeichern (TIF wäre natürlich noch besser, nähme aber zu viel Speicherplatz für 700 Seiten)

Ergebnis:

test-fuer-reproduktion-1.png



2) wir sind gierig auf den Text :hmpf:

a) das JPG dem ABBYY FineReader Express™ vor die Füße werfen, ...
b) Ergebnis durchaus ansehbar, 21 Korrekturen sind ganz ok bei diesem Schriftbild,
c) fettsch

Vorgang und Ergebnis:

test-fuer-reproduktion-2.png



Zufrieden?

Automatisieren würde ich so etwas mit dem GraficConverter, wobei sicher bei einigen Reproduktionen händisch eingegriffen werden müsste.





Lieber Gruß
Rata

8)
 
F

fotoflop

Guest

AW: Gescannte Buchseite optimieren

Was erwartest Du? Du hast Vorlagen die sich sicher nicht fehlerfrei mit einer Software einlesen lassen. Du leuchtest die Vorlage nicht richtig aus. Aber der Knackpunkt sind die schlechten Vorlagen die nur mit großen manuellem Aufwand zu rekonstruieren sind.

Mein Vorschlag und der einfachste Weg, lass Dir den Text neu abschreiben. Hier kannst Du die Kosten pro Seite genau festlegen. Bei Deinem eingeschlagenen Weg lässt sich der Zeitaufwand nicht festlegen.

Bei guten Vorlagen ist der hier schon beschriebene Weg, Buch zerschneiden, und die Seiten mit automatischen Einzug mit OCR Software scannen der richtige.

Gruß
 
Bilder bitte hier hochladen und danach über das Bild-Icon (Direktlink vorher kopieren) platzieren.
Antworten auf deine Fragen:
Neues Thema erstellen

Willkommen auf PSD-Tutorials.de

In unseren Foren vernetzt du dich mit anderen Personen, um dich rund um die Themen Fotografie, Grafik, Gestaltung, Bildbearbeitung und 3D auszutauschen. Außerdem schalten wir für dich regelmäßig kostenlose Inhalte frei. Liebe Grüße senden dir die PSD-Gründer Stefan und Matthias Petri aus Waren an der Müritz. Hier erfährst du mehr über uns.

Stefan und Matthias Petri von PSD-Tutorials.de

Nächster neuer Gratisinhalt

03
Stunden
:
:
25
Minuten
:
:
19
Sekunden

Flatrate für Tutorials, Assets, Vorlagen

Zurzeit aktive Besucher

Statistik des Forums

Themen
118.581
Beiträge
1.538.166
Mitglieder
67.500
Neuestes Mitglied
alexseens
Oben