[Plone-IT] Indicizzazione files PDF in Plone

Giovanni Toffoli toffoli a uni.net
Gio 6 Mar 2008 11:32:40 UTC


In passato avevo cercato delle librerie python per l'estrazione di testo da 
pdf.
Lo scopo era di ricavare non solo il testo (per questo xpdf va abbastanza 
bene), ma anche informazioni di formattazione (titoli, enfasi, tabelle, 
ecc.), imitando quel che aveva fatto un mio amico in java.
Avevo cominciato a usare un package molto interessante, anche se incompleto, 
pdftools:
  http://www.boddie.org.uk/david/Projects/Python/pdftools/
Mi sembrava pių promettente di pyPdf; ma non ho avuto tempo di proseguire il 
lavoro.
Avevo usato la versione 0.33; ora vedo che č arrivato alla 0.35.

Giovanni Toffoli

----- Original Message ----- 
From: "luigi scarso" <luigi.scarso a gmail.com>
To: "La lista degli italiani appassionati di Plone." 
<plone-it a lists.plone.org>
Sent: Thursday, March 06, 2008 10:59 AM
Subject: Re: [Plone-IT] Indicizzazione files PDF in Plone


> Scusate se mi intrometto,
> ma presso
> http://pybrary.net/pyPdf/
>
> c'e' qualcosa di buono.
> Forse a qualche sviluppatore......
>
>
>
> luigi
>
> _______________________________________________
> Plone-IT mailing list
> Plone-IT a lists.plone.org
> http://lists.plone.org/mailman/listinfo/plone-it
> http://www.nabble.com/Plone---Italy-f21728.html
> 






Maggiori informazioni sulla lista Plone-IT