Optimizando el procesamiento de cadenas de ADN con Pandas y Multiprocessing

YouTube

Description

Demostrar como en uBiome bajamos los tiempos de procesamiento para cadenas de ADN usando Pandas + Multiprocessing

El objetivo de la charla es presentar cómo se optimizo el tiempo de procesamiento del viejo pipeline usando la dupla de Pandas con Multiprocessing. A su vez, relatar también como herramientas de big data no siempre calzan con volúmenes medios de datos, como Dask.

PyVideo

Optimizando el procesamiento de cadenas de ADN con Pandas y Multiprocessing

Description

Details