Este repositorio contiene todos los materiales de clase para la clase CSE 6040 Spring 2020 CSE 6040 de Georgia Tech, calculada para la clase de análisis de datos con el Dr. Richard Vuduc . (Como nota al margen, esta fue la mejor clase que he tomado). Todo el contenido está en la carpeta project_files y está secuenciada para una navegación más fácil. Dentro de project_files , encontrará la carpeta Getting Started . Entonces, comienza allí.
Esta clase se basa en los cuadernos Python 3.7 y Jupyter. He incluido el entorno virtual que puede usar con él. Sin embargo, es posible que deba instalar los paquetes necesarios de vez en cuando mientras se encuentra con ellos durante todo el curso. Creé el entorno virtual después del hecho.
Puede ignorar la carpeta Scratch Pad . No tiene que mirarlo, pero es posible que encuentre algún código interesante allí y, por lo tanto, por qué lo mantuve allí porque quiero encontrar ese código si lo buscaré.
Algo más a tener en cuenta: algunos conjuntos de datos son más grandes que 100 MB y deben almacenarse como piezas. Por lo tanto, puede ver que un conjunto de datos se combina en un solo archivo de varios archivos y luego el archivo combinado se elimina nuevamente. Esto es así debido a las limitaciones de Github.