[Plone-IT] Indicizzazione files PDF in Plone
Giovanni Toffoli
toffoli a uni.net
Gio 6 Mar 2008 11:32:40 UTC
In passato avevo cercato delle librerie python per l'estrazione di testo da
pdf.
Lo scopo era di ricavare non solo il testo (per questo xpdf va abbastanza
bene), ma anche informazioni di formattazione (titoli, enfasi, tabelle,
ecc.), imitando quel che aveva fatto un mio amico in java.
Avevo cominciato a usare un package molto interessante, anche se incompleto,
pdftools:
http://www.boddie.org.uk/david/Projects/Python/pdftools/
Mi sembrava pių promettente di pyPdf; ma non ho avuto tempo di proseguire il
lavoro.
Avevo usato la versione 0.33; ora vedo che č arrivato alla 0.35.
Giovanni Toffoli
----- Original Message -----
From: "luigi scarso" <luigi.scarso a gmail.com>
To: "La lista degli italiani appassionati di Plone."
<plone-it a lists.plone.org>
Sent: Thursday, March 06, 2008 10:59 AM
Subject: Re: [Plone-IT] Indicizzazione files PDF in Plone
> Scusate se mi intrometto,
> ma presso
> http://pybrary.net/pyPdf/
>
> c'e' qualcosa di buono.
> Forse a qualche sviluppatore......
>
>
>
> luigi
>
> _______________________________________________
> Plone-IT mailing list
> Plone-IT a lists.plone.org
> http://lists.plone.org/mailman/listinfo/plone-it
> http://www.nabble.com/Plone---Italy-f21728.html
>
Maggiori informazioni sulla lista
Plone-IT