Hallo Leute,
ich bin schon seit einer ganzen weile auf der Suche nach einer Möglichkeit durchsuchbare PDF-Dateien mittels PHP einzulesen. Mir geht es hauptsächlich darum, nach einem bestimmten Text zu suchen, um diese PDFs leichter zuordnen zu können.
Nach einer ganzen Weile der Suche habe ich folgende Klasse entdeckt, welche auch an sich funktioniert:
Leider jedoch nur bis PDF 1.3
Sobald man z. B. mit gewissen Tools eine OCR über den Text laufen lässt, und diese dann in PDF 1.4 gespeichert wird, funktioniert das ganze schon wieder nicht wirklich, jedoch habe ich noch keinerlei Ahnung warum das so ist... vielleicht hat ja noch irgend Jemand von euch eine Idee dazu....
Grüße
Micha
ich bin schon seit einer ganzen weile auf der Suche nach einer Möglichkeit durchsuchbare PDF-Dateien mittels PHP einzulesen. Mir geht es hauptsächlich darum, nach einem bestimmten Text zu suchen, um diese PDFs leichter zuordnen zu können.
Nach einer ganzen Weile der Suche habe ich folgende Klasse entdeckt, welche auch an sich funktioniert:
Leider jedoch nur bis PDF 1.3
Sobald man z. B. mit gewissen Tools eine OCR über den Text laufen lässt, und diese dann in PDF 1.4 gespeichert wird, funktioniert das ganze schon wieder nicht wirklich, jedoch habe ich noch keinerlei Ahnung warum das so ist... vielleicht hat ja noch irgend Jemand von euch eine Idee dazu....
Grüße
Micha