Fecha y hora actual: Lunes 23 Oct 2017 03:44
Índice del Foro

Foros de programación informática, diseño gráfico y Web

En esta comunidad intentaremos dar soporte de programación a todos los niveles, desde principiantes a profesionales de la informática, desarrollo de programas, programación web y mucho más.

Problema para extracción de datos utilizando python y beautifulsoup

Responder al Tema

Índice del Foro > Python > Problema para extracción de datos utilizando python y beautifulsoup

Autor Mensaje
liz



Registrado: 06 Oct 2017
Mensajes: 1

Mensaje Publicado: Viernes 06 Oct 2017 10:05

Título del mensaje: Problema para extracción de datos utilizando python y beautifulsoup

Responder citando

Hola comunidad, estoy atorada en una extracción de datos de una página web utilizando python y beautifulsoup. Agradecería mucho cualquier idea, ya que no he logrado avanzar mucho. Estoy extrayendo los datos de una página utilizando Beautifulsoup y python.

He aquí mi pequeño código

Código:
import requests

from urllib.request import urlopen

from bs4 import BeautifulSoup

dir = " aquí mi url"

req = requests.get(dir)
pagina = urlopen(dir)

soup = BeautifulSoup(pagina.read(),'html.parser')

informacion = soup.find_all(True,{'class':'sr-hotel__name'})

precio = soup.find_all(True,{'class':' price availprice no_rack_rate'})

print(precio) #imprimo para ver si hay datos, pero devuelve nada

print(informacion) #devuelve datos pero datos que no están en la página

y he aquí los datos que quiero extraer
Para los datos de hotel

Código:
<span class="sr-hotel__name" data-et-click="customGoal:YPNdKNKNKZJUESUPTOdJDUFYQC:1  ">
Hostal Gala Madrid
</span>


y para los datos de precio

Código:
<strong class=" price availprice no_rack_rate
  " data-et-click="customGoal:YPNdKNKNKZJUESUPTOdJDUFYQC:1  " data-et-view="OTfdASFOLCEBJFUC:1">
<b>
MXN&nbsp;2,570
</b>
</strong>


En el aspecto del nombre del hotel me devuelve datos que no están en la página 1, ya que son 30 páginas, pero los hoteles que devuelve no se encuentran en la 1 que es la de la url a la que me estoy conectando

En el aspecto del precio,no sé si tenga que ver que para que aparezca el precio en la pagina yo primero tengo que seleccionar los días de hospedaje de un calendario.

Volver arriba
Ver perfil del usuario Enviar mensaje privado
Pedrolo
Usuario Iniciado


Registrado: 07 May 2017
Mensajes: 44
Ubicación: Posiblemente lejos de ti

Mensaje Publicado: Sábado 07 Oct 2017 18:11

Título del mensaje: Problema para extracción de datos utilizando python y beautifulsoup

Responder citando

Haz un print a la variable pagina para comprobar si se está cargando.

Si pagina contiene el html a que hace referencia en el uri (usando el protocolo http://), deberías probar usar:

Código:
informaciones =soup.find_all("span",class_="sr-hotel__name") # en teoria te dara una LISTA de elementos que coincida con ese criterio


o sino

Código:
informaciones =soup.find_all("span","sr-hotel__name") # en teoria te dara una LISTA de elementos que coincida con ese criterio


https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all

Volver arriba
Ver perfil del usuario Enviar mensaje privado Visitar sitio web del autor
Responder al Tema
Mostrar mensajes anteriores:   
Ir a:  
Todas las horas están en GMT + 1 Hora

Temas relacionados

Tema Autor Foros Respuestas Publicado
El foro no contiene ningún mensaje nuevo

Duda codigo en Python - Red Neuronal con numpy ...

Daniel_wUNTG Python 0 Sábado 21 Oct 2017 21:27 Ver último mensaje
El foro no contiene ningún mensaje nuevo

Problema al mostrar una variable en un jlabel

Jensel S.G Java 2 Lunes 16 Oct 2017 01:48 Ver último mensaje
El foro no contiene ningún mensaje nuevo

Se requiere programador para Proyecto de Juego,...

Otilio Programación de juegos o videojuegos 5 Lunes 02 Oct 2017 23:04 Ver último mensaje
El foro no contiene ningún mensaje nuevo

Paralelizacion en python

ssy31 Python 1 Miércoles 13 Sep 2017 22:50 Ver último mensaje
El foro no contiene ningún mensaje nuevo

Busco Programador C++ para Base de Datos y/o di...

RmBeer Bolsa de trabajo 0 Lunes 12 Jun 2017 23:24 Ver último mensaje
Panel de Control
No puede crear mensajes, No puede responder temas, No puede editar sus mensajes, No puede borrar sus mensajes, No puede votar en encuestas,