[Plone-IT] beautifulsoup

Simone Orsi simahawk a gmail.com
Ven 2 Apr 2010 09:33:25 UTC


On 04/02/2010 11:25 AM, Fabrizio Rota wrote:
> Con il codice da te suggerito ottengo una lista che contiene il codice
> HTML dei dati meteo. Quindi devo "solo" trovare il modo di fargli
> trasformare HTML in testo.
>
> Il giorno 02 aprile 2010 11.22, Fabrizio Rota <fabrizio.rota a gmail.com
> <mailto:fabrizio.rota a gmail.com>> ha scritto:
>
>     Inizio a ottenere qualcosa se nel metodo che estrae dal sito meteo
>     i dati intabellati faccio, ovvero se metto 'str' prima del findAll
>
>     def prendi_url_meteo(self):
>        import urllib2
>        from BeautifulSoup import BeautifulSoup
>        response = urllib2.urlopen('http://it.aprs.fi/weather/IW2OII-3')
>        soup = BeautifulSoup(response)
>        td = str(soup.findAll('td'))
>        return td
>
>     solo che in questo modo ottengo un carattere per volta tutto il
>     codice html della tabella.
>     Credo di dovermi studiare meglio questa zuppa bellissima......
>
La risposta potrebbe essere "RTFM".... :P

Con "findAll" ottieni una lista di oggetti XML dai quali devi estrarre
il dato che vuoi: item.string (il testo dell'oggetto, se ne ha),
item.name .id .class e via dicendo per i parametri...

Ti suggerisco, specialmente quando stai usando librerie del genere, di
mettere sempre un pdb prima del "return" e ispezionare gli elementi con
"dir(item)" per vedere cosa puoi ottenere da quell'elemento. Un "pdb" e
un "dir" spesso ti fanno risparmiare ore di lavoro ;)
-------------- parte successiva --------------
Un allegato HTML  stato rimosso...
URL: <http://lists.plone.org/pipermail/plone-plone-it/attachments/20100402/e91ebea9/attachment.html>


Maggiori informazioni sulla lista Plone-IT