User können in hochgeladenen Dateien suchen?

Fragen zur Implementierung und/oder Anpassung von ConPresso 4 werden in diesem Forum diskutiert.
Antworten
René Märtin
ConPresso-Newbie
Beiträge: 20
Registriert: 22.04.2007 11:48
Hat sich bedankt: 3 Mal

User können in hochgeladenen Dateien suchen?

Beitrag von René Märtin »

Hallo,

ich habe gerade gesucht, ob es hier schon einen Eintrag dazu gibt. Scheint nicht der Fall zu sein, deshalb meine Frage:

Hat jemand eine Lösung oder Idee, wie ich die Suche in den Artikeln um eine Suche in den Dateien ergänzen kann? Und hier nur in PDF?

Als Minimallösung möchte ich die Titel der PDF ausgeben (und einen Link auf die Datei); als Maximallösung suche ich nach einer Möglichkeit, IM PDF zu suchen. Für Hinweise bin ich dankbar! Gruß, René
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7362
Registriert: 01.01.1970 01:00
Hat sich bedankt: 111 Mal
Danksagung erhalten: 934 Mal
Kontaktdaten:

Beitrag von MarkusR »

Ist auf Deinem Server pdftotext oder searchpdf installiert?
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
René Märtin
ConPresso-Newbie
Beiträge: 20
Registriert: 22.04.2007 11:48
Hat sich bedankt: 3 Mal

Beitrag von René Märtin »

Danke für die Tipps. Beide Programme sind nicht installiert. Die Website liegt bei HostEurope. Wenn ich das richtig sehe, müsste für searchpdf Ghostscript installiert sein, und das erlaubt der Provider nicht. Bei pdftotext ist es wohl ähnlich kompliziert. Aber vielleicht finde ich ja noch irgendwo ein Script, welches ich ausführen kann. /R.
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7362
Registriert: 01.01.1970 01:00
Hat sich bedankt: 111 Mal
Danksagung erhalten: 934 Mal
Kontaktdaten:

Beitrag von MarkusR »

Das Einfachste wäre der Einsatz von Gehirnschmalz.

Insofern zu jeder Datei auch ein Artikel gehört würde ich einfach den Text des PDF in ein Textfeld kopieren, das dann ja durch die Suche ausgewertet wird. Es wird wohl kaum ein Redakteur ein PDF hochladen was er sich vorher nicht angeschaut hat. Bei der Gelegenheit kopiert er den Text.
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
René Märtin
ConPresso-Newbie
Beiträge: 20
Registriert: 22.04.2007 11:48
Hat sich bedankt: 3 Mal

Beitrag von René Märtin »

Hmja, so machen wir das seit drei Jahren. Jetzt wollen wir aber den Bereich, der die PDF anbietet, eben nur auf die PDF 'verschlanken' ... was den Nachteil hat, dass man die Inhalte zu den PDF nicht mehr über die Conpresso-Suche findet ... aber vielen Dank für beiden Tipps, ich verfolge die Spur weiter, vielleicht gibt es noch eine Alternative. / R.
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7362
Registriert: 01.01.1970 01:00
Hat sich bedankt: 111 Mal
Danksagung erhalten: 934 Mal
Kontaktdaten:

Beitrag von MarkusR »

Wie wäre es mit pdf2ps und anschließend ps2ascii ???

Ach nee, auch das benötigt Ghostscript ...
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
Benutzeravatar
MarkusR
Handbuchversteher
Beiträge: 7362
Registriert: 01.01.1970 01:00
Hat sich bedankt: 111 Mal
Danksagung erhalten: 934 Mal
Kontaktdaten:

Beitrag von MarkusR »

Hier hat jemand den Code für die Textextraktion gepostet:

http://sk.php.net/manual/en/ref.pdf.php#56492
und noch eine Version
http://sk.php.net/manual/en/ref.pdf.php#74186
Ciao Markus
ConPresso-Module

Kein Support per PN!!! Für Fragen und Diskussionen ist das Forum da!

Succi recentis officinalis
Hochwertige Kräutersäfte und -Öle
Benutzeravatar
balu
ConPresso-Entwickler
Beiträge: 1748
Registriert: 01.01.1970 01:00
Hat sich bedankt: 81 Mal
Danksagung erhalten: 133 Mal

Beitrag von balu »

Ich habe mir die zwei Links noch nicht angeschaut, aber ich habe mit der Extraktion von PDF-Texten bisher keine guten Erfahrungen gemacht (die letzten Experimente sind aber auch schon etwas her).

Vielleicht eigneten die sich dann zum Durchsuchen, aber zum Anzeigen waren die Texte unbrauchbar. Bei fettgedruckten Wörtern kamen die Buchstaben doppelt vor, je nach Aufbau der Datei in Spalten, waren die Texte durcheinander gewürfelt, usw.

Balu
Bartels.Schöne
ConPresso Support & Development
René Märtin
ConPresso-Newbie
Beiträge: 20
Registriert: 22.04.2007 11:48
Hat sich bedankt: 3 Mal

Beitrag von René Märtin »

Meine Tests bestätigen das. Was ich bisher gefunden habe, funktioniert nicht so richtig elegant. Bin also immer noch auf der Suche ... falls ich was finde und anpassen kann, melde ich mich hier wieder.
Antworten