Hola comunidad, estoy atorada en una extracción de datos de una página web utilizando python y beautifulsoup. Agradecería mucho cualquier idea, ya que no he logrado avanzar mucho. Estoy extrayendo los datos de una página utilizando Beautifulsoup y python.
He aquí mi pequeño código
Código: | import requests
from urllib.request import urlopen
from bs4 import BeautifulSoup
dir = " aquí mi url"
req = requests.get(dir)
pagina = urlopen(dir)
soup = BeautifulSoup(pagina.read(),'html.parser')
informacion = soup.find_all(True,{'class':'sr-hotel__name'})
precio = soup.find_all(True,{'class':' price availprice no_rack_rate'})
print(precio) #imprimo para ver si hay datos, pero devuelve nada
print(informacion) #devuelve datos pero datos que no están en la página
|
y he aquí los datos que quiero extraer
Para los datos de hotel
Código: | <span class="sr-hotel__name" data-et-click="customGoal:YPNdKNKNKZJUESUPTOdJDUFYQC:1 ">
Hostal Gala Madrid
</span>
|
y para los datos de precio
Código: | <strong class=" price availprice no_rack_rate
" data-et-click="customGoal:YPNdKNKNKZJUESUPTOdJDUFYQC:1 " data-et-view="OTfdASFOLCEBJFUC:1">
<b>
MXN 2,570
</b>
</strong> |
En el aspecto del nombre del hotel me devuelve datos que no están en la página 1, ya que son 30 páginas, pero los hoteles que devuelve no se encuentran en la 1 que es la de la url a la que me estoy conectando
En el aspecto del precio,no sé si tenga que ver que para que aparezca el precio en la pagina yo primero tengo que seleccionar los días de hospedaje de un calendario. |