Entradas

Comparativa entre muestras de datos y herramientas (TV shows)

Imagen
Hola, mi nombre es Alexander Morales, autor de este blog y analista de datos. El objetivo de este blog es doble.  Por una parte es comprobar hasta que punto una muestra pequeña de datos es representativa enfrente una muestra masiva de datos del mismo tipo. ¿Los patrones y relaciones que podemos sacar de analizar datasets muy grandes se pueden vislumbrar de forma burda en una muestra pequeña scrapeada manualmente? ¿Puedes sacar conclusiones sobre información contando con una muestra de datos pequeña? ¿Que tan grande es el sesgo resultante de analizar pocos datos en contrapunte de analizar decenas de miles de estos? El segundo objetivo es el de comparar el tratamiento y obtención de datos entre diferentes herramientas. Por una parte la obtención de datos mediante Parsehub y su posterior tratamiento con Excel, y por otra parte la obtención de un dataset masivo mediante Github y su tratamiento con PowerBI . Analizando estas herramientas desde diferentes prismas, tales como la facilid...