INFO zur Technik
Im Bereich PDF-Suche werden die im PDF Format gesammelten Quellen nach Worten durchsucht.
Verwendet wird eine angepasste Variante des Programmes pdftotext.ACHTUNG: Das Programm läuft am Sichersten unter Firefox, getestet und Windows und Android.
Da es sich um eine reine Wortsuche handelt, ist die Suche bei eingescanntenund per OCR lesbar gemachten Quelldateien nicht 100% zuverlässig. In der Ergebnisliste tragen diese Datei den Zusatz „-ocr“ im Dateinamen.
pdftotext durchsucht bei jedem Aufruf sämtlich Dokumente im gewählten Bereich. Da bei jeden Aufruf sämtliche Dokumente im gewählten Bereich neu durchsucht werden, muss man mit ca. 1 Sekunde Suchzeit pro Ausgabe rechnen.
Die Ausgabe der Ergebnisse:
Die zuerst genannte Anzahl der Treffer weist aus, in wieviel Dateien der Suchbegriff gefunden wurde. Darunter steht die Liste dieser Treffer mit Link zur Quelldatei.
Zusätzlich wir noch angegeben, wie oft der Suchtext Vorkommen innerhalb einer Quelldatei vorkommt. Die entsprechende Liste kann aufgeklappt werden, und zeigt dann eine Liste von Links direkt auf die Seiten im PDF.
In den Listen werden die Funde im Textzusammenhang, in der Regel in Zeilenfragmenen, dargestellt. Das Programm kann Umbrüche nicht interpretieren und fügt Worttrennungen nicht zusammen.
Per KLICK gelangt man jedoch auf die entsprechenden Seiten der Originaldatei, und dort werden sind die Fundstellen markiert.
Stand 27.12.2025