Fecha y hora actual: Domingo 23 Sep 2018 18:42
Índice del Foro

Foros de programación informática, diseño gráfico y Web

En esta comunidad intentaremos dar soporte de programación a todos los niveles, desde principiantes a profesionales de la informática, desarrollo de programas, programación web y mucho más.

Problema para extracción de datos utilizando python y beautifulsoup

Responder al Tema

Índice del Foro > Python > Problema para extracción de datos utilizando python y beautifulsoup

Autor Mensaje
liz



Registrado: 06 Oct 2017
Mensajes: 1

Mensaje Publicado: Viernes 06 Oct 2017 11:05

Título del mensaje: Problema para extracción de datos utilizando python y beautifulsoup

Responder citando

Hola comunidad, estoy atorada en una extracción de datos de una página web utilizando python y beautifulsoup. Agradecería mucho cualquier idea, ya que no he logrado avanzar mucho. Estoy extrayendo los datos de una página utilizando Beautifulsoup y python.

He aquí mi pequeño código

Código:
import requests

from urllib.request import urlopen

from bs4 import BeautifulSoup

dir = " aquí mi url"

req = requests.get(dir)
pagina = urlopen(dir)

soup = BeautifulSoup(pagina.read(),'html.parser')

informacion = soup.find_all(True,{'class':'sr-hotel__name'})

precio = soup.find_all(True,{'class':' price availprice no_rack_rate'})

print(precio) #imprimo para ver si hay datos, pero devuelve nada

print(informacion) #devuelve datos pero datos que no están en la página

y he aquí los datos que quiero extraer
Para los datos de hotel

Código:
<span class="sr-hotel__name" data-et-click="customGoal:YPNdKNKNKZJUESUPTOdJDUFYQC:1  ">
Hostal Gala Madrid
</span>


y para los datos de precio

Código:
<strong class=" price availprice no_rack_rate
  " data-et-click="customGoal:YPNdKNKNKZJUESUPTOdJDUFYQC:1  " data-et-view="OTfdASFOLCEBJFUC:1">
<b>
MXN&nbsp;2,570
</b>
</strong>


En el aspecto del nombre del hotel me devuelve datos que no están en la página 1, ya que son 30 páginas, pero los hoteles que devuelve no se encuentran en la 1 que es la de la url a la que me estoy conectando

En el aspecto del precio,no sé si tenga que ver que para que aparezca el precio en la pagina yo primero tengo que seleccionar los días de hospedaje de un calendario.

Volver arriba
Ver perfil del usuario Enviar mensaje privado
Pedrolo
Usuario Inquieto


Registrado: 07 May 2017
Mensajes: 50
Ubicación: Posiblemente lejos de ti

Mensaje Publicado: Sábado 07 Oct 2017 19:11

Título del mensaje: Problema para extracción de datos utilizando python y beautifulsoup

Responder citando

Haz un print a la variable pagina para comprobar si se está cargando.

Si pagina contiene el html a que hace referencia en el uri (usando el protocolo http://), deberías probar usar:

Código:
informaciones =soup.find_all("span",class_="sr-hotel__name") # en teoria te dara una LISTA de elementos que coincida con ese criterio


o sino

Código:
informaciones =soup.find_all("span","sr-hotel__name") # en teoria te dara una LISTA de elementos que coincida con ese criterio


https://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all

Volver arriba
Ver perfil del usuario Enviar mensaje privado Visitar sitio web del autor
Responder al Tema
Mostrar mensajes anteriores:   
Ir a:  
Todas las horas están en GMT + 2 Horas

Temas relacionados

Tema Autor Foros Respuestas Publicado
El foro no contiene ningún mensaje nuevo

Tutorial Python Rápido para Principiantes

Errodringer Python 0 Viernes 14 Sep 2018 19:38 Ver último mensaje
El foro no contiene ningún mensaje nuevo

Consulta sobre un tipo de PLUGIN para insertar ...

Federico Jose Temas generales 1 Sábado 08 Sep 2018 18:57 Ver último mensaje
El foro no contiene ningún mensaje nuevo

ayuda ayuda para este codigo que me sale error ...

DiegoBV C, C#, Visual C++ 0 Jueves 02 Ago 2018 23:52 Ver último mensaje
El foro no contiene ningún mensaje nuevo

Buscamos Ingeniero de Software para Barcelona

AndresCG Bolsa de trabajo 0 Miércoles 18 Jul 2018 10:14 Ver último mensaje
El foro no contiene ningún mensaje nuevo

Cursos de programacion y base de datos

Alexweb ASP, ASP.NET 1 Jueves 31 May 2018 16:59 Ver último mensaje
Panel de Control
No puede crear mensajes, No puede responder temas, No puede editar sus mensajes, No puede borrar sus mensajes, No puede votar en encuestas,