Sergio #1: Faker - Un paquete de Python para crear datos falsos.
- "Faker es un paquete de Python que genera datos falsos para usted. Ya sea que necesite arrancar su base de datos, crear documentos XML atractivos, completar su persistencia para hacer una prueba de esfuerzo o anonimizar los datos tomados de un servicio de producción, Faker es para usted."
- Nombres, códigos de barras, puntos geográficos (lat/long), tarjetas de crédito, nombres de puestos de trabajo, curps, hasta CSVs
Rodo #2: mPyPl - Biblioteca de tuberías monádicas para Python
- mPyPl es una biblioteca que simplifica todas las tareas de procesamiento de datos en Python, al introducir un concepto de canalización funcional. Utiliza la sintaxis de tubería proporcionada por el paquete Pipe.
- Se basa en tres ideas principales:
- Usa técnicas de programación funcional y tuberías "flojas" basadas en el paquete Pipe
- Utiliza generadores que producen flujos de diccionarios mdict, que "fluyen" a través de la tubería
- Utiliza una pequeña cantidad de operaciones básicas que operan en esos campos, ocultando la complejidad de la implementación interna
Sergio #3: Bulwark - Un paquete para hacer tests basados en propiedades para dataframes de pandas
import bulwark.decorators as dc
@dc.IsShape((-1, 10))
@dc.IsMonotonic(strict=True)
@dc.HasNoNans()
def compute(df):
# complex operations to determine result
...
return result_df
Rodo #4: Una guía práctica para la ingeniería de características en Python
- Una guía práctica que te dice:
- ¿Qué es la ingeniería de características?
- Cómo manejar los valores perdidos.
- Cómo manejar características categóricas.
- y mucho mas
Sergio #5: DeOldify para colorizar fotos en blanco y negro
- Usa GANs y NoGANs para colorizar fotos en blanco y negro Y VIDEO TAMBIEN
Rodo #6: py-roughviz - La implementación en Python de la biblioteca de JavaScript RoughViz para crear gráficos interactivos.
- Es un wrapper en Python de la biblioteca de JavaScript RoughViz que se puede usar para visualizar gráficos estilo de dibujo a mano.
- Los gráficos soportados
- Barras, pastel, línea, dispersión, dona, barras apiladas.
- Entre lo más cool: ¡Acepta DataFrames de Pandas como input!
Extras: Rodo:
- JobFunnel - Herramienta automatizada para "escrapear" publicaciones de trabajo en un archivo .csv.
- Pregunta de la semana: data o data?
Sergio: