sábado, 25 de mayo de 2019

80 Python. WebScraping

Iniciacion a webscraping, obteniendo datos de una web usando Python.
Puedes acceder a la web de pruebas en este enlace.
Es aconsejable tener una base de html, puedes consultar una introduccion aqui




El codigo python disponible en github.


from urllib.request import urlopen
from urllib.error import HTTPError
from urllib.error import URLError
from bs4 import BeautifulSoup

try: 
    html = urlopen("http://ticoticotaa.es/ejemplowebscraping.php")
except HTTPError as e:
    print(e)
except URLError:
    print("Servidor caido o dominio incorrecto")
else:
    resultado = BeautifulSoup(html.read(),"html5lib")
    #print(resultado.title)
    articulo = resultado.findAll("div",{"class":["articulo"]})
    #print(articulo)
    descripcion=resultado.findAll("div",{"class":["descripcion"]})
    precio=resultado.findAll("div",{"class":["precio"]})
    descripcionLista=[]
    precioLista=[]
    for desc in descripcion:
        descripcionLista.append(desc.getText().strip())
    print(descripcionLista)
    for prec in precio:
        precioLista.append(prec.getText().strip())
    print(precioLista)
    for i in range(len(descripcionLista)):
        if int(precioLista[i])<150:
            print(descripcionLista[i]+' : '+precioLista[i]+' €')
            print(' *** esta por debajo de 150 € *** ')
        else:
            print(descripcionLista[i]+' : '+precioLista[i]+' €')  


   

No hay comentarios:

Publicar un comentario

Se procedera a revision para su pronta publicacion en caso de que no incumpla las normas de blogger.