jueves, 25 de mayo de 2023

Python: Web Scraping

 En esta nueva entrada realizaremos un "web scraping",  que esto no es otra cosa  que copiar información de un sitio web de forma automática accediendo mediante los elementos y etiquetas disponibles en el sitio web.

Araña observando a su próxima victima.

Usos:

Entre sus principales aplicativos podemos mencionar la actualización de información en tiempo real, por ejemplo el clima, la bolsa de valores, divisas, productos disponibles en una tienda, y por que no, saber si tu crush está "soltera" en facebook.

Etiqueta de situación sentimental en facebook.

"Antes que nada, y primero que todo.......", vamos a instalar las librerias necesarias, "os enseñareis como", así que vamos a la consola de Python. 

pip install requests

pip install BeautifulSoup

Primer paso: Obtener la dirección url de la que vamos copiar el contenido, para este ejercicio nos tomamos la libertada de consultar un sitio web de noticias ya que su url muestra las consultas, permitiendo modificar el contenido de la búsqueda en texto plano, solo añadiendo el signo de "+" entre palabras. 

Ejemplo: https://pagina24zacatecas.com.mx/?s=archivo+de+zacatecas

Segundo paso: Elegir el contenido o sección que deseamos consultar, en mi caso solo necesito saber que notas o publicaciones existen sobre el tema "archivo de zacatecas", por lo que al ingresar la búsqueda en la url me genera todo el contenido que contenga las palabras "archivo de zacatecas".

Resultado de la búsqueda.

Tercer paso: Clic secundario en la sección que deseamos consultar y a continuación elegimos "Inspeccionar", se visualizara una ventana como la siguiente.

Ventada de inspección.
Cuarto paso: "Ahora si viene lo chido.....", entre las etiquetas del codito HTML debemos seleccionar las que nos interesan para acceder a ellas, por ejemplo "todas las etiquetas <p>", donde "<p>"  en HTML se refiere a un párrafo. 
Código utilizado y comentado.

Resultados: Una vez ejecutado el código se puede acceder a la información para ser procesada.


Resumen: La aplicación del "web scraping" permite automatizar procesos mediante la lectura de sitios web para después ser analizada mediante algoritmos de toma de decisiones, tal fue el caso mas mencionado el de la "compra masiva de tarjetas graficas para minar bitcoins".


0 comentarios:

Publicar un comentario