Contribute Media
Viewing PR #272
A thank you to everyone who makes this possible: Read More

Optimizando el procesamiento de cadenas de ADN con Pandas y Multiprocessing

Description

Demostrar como en uBiome bajamos los tiempos de procesamiento para cadenas de ADN usando Pandas + Multiprocessing

El objetivo de la charla es presentar cómo se optimizo el tiempo de procesamiento del viejo pipeline usando la dupla de Pandas con Multiprocessing. A su vez, relatar también como herramientas de big data no siempre calzan con volúmenes medios de datos, como Dask.

Details

Improve this page