5 excelentes herramientas de Data Science

1. Pandas

Sé que esto es obvio, pero Pandas es un paquete realmente sorprendente para Data Science corriente, pero también hace algunas cosas bastante complejas que muchas personas no conocen.

Por ejemplo, en Pandas puedes hacer web-scraping con la función read_html:

pd.read_html("url")

2. Mito

Mito es una hoja de cálculo que genera Python. Tienes la sensación de estar trabajando en Excel o Google Sheets y cada edición que haces genera el Python equivalente.

En Mito, puedes:

  • Unir
  • Filtrar
  • Pivote
  • Gráfico
  • Usar fórmulas ¡y mucho más!

Aquí están las instrucciones de instalación de Mito

3. Tensorflow

Tensorflow es un paquete ML que permite a los usuarios crear modelos muy rápidamente. Originalmente fue desarrollado en Google. Tensorflow se ha convertido en un primer paquete popular para aquellos que comienzan a involucrarse con el Machine Learning.

Dentro del paquete, puede hacer cosas como:

  • Construir redes neuronales
  • Diseño de sistemas de recomendación
  • Crear redes antagónicas

También tienen una gran cantidad de socios de servidor que ayudan a alojar estos modelos. Estos representantes pueden ayudar a configurar los entornos de nube/locales, así como brindar consultoría sobre cómo estructurarlos.

4. Beautiful Soup

Beautiful Soup es un paquete de Python que permite una fácil extracción de datos de los formatos html y xml; esto esencialmente significa web-scraping.

Aquí está la documentación completa.

5. Matplotlib

Matplotlib es uno de los mejores paquetes de gráficos de Python. Puede hacer representaciones visuales simples, así como gráficos interactivos más avanzados.

También hay muchas otras opciones de visualización más avanzadas.

Gráfico de barras apiladas:

Polígono relleno:

Aquí está la documentación completa.

Esperamos que estas herramientas les sean útiles!

SobreMaría Alexandra Lizardo