Ce référentiel contient tous les documents de classe pour le Spring 2020 CSE 6040 de Georgia Tech, Computing for Data Analysis Class avec le Dr Richard Vuduc . (En tant que note latérale, c'était la meilleure classe que j'ai jamais suivie.) Tout le contenu est dans le dossier project_files et il est séquencé pour une navigation plus facile. À l'intérieur du project_files , vous trouverez le dossier Getting Started . Alors, commencez là-bas.
Cette classe est basée sur les ordinateurs portables Python 3.7 et Jupyter. J'ai inclus l'environnement virtuel que vous pouvez utiliser avec. Cependant, vous devrez peut-être installer les packages nécessaires de temps en temps lorsque vous les rencontrez tout au long du parcours. J'ai créé l'environnement virtuel après coup.
Vous pouvez ignorer le dossier Scratch Pad . Vous n'avez pas à le regarder, mais vous pourriez y trouver un code intéressant et donc pourquoi je l'ai gardé là-dedans parce que je veux trouver ce code moi-même si je le cherche.
Quelque chose d'autre à noter: certains ensembles de données sont supérieurs à 100 Mo et ils doivent être stockés en pièces. Ainsi, vous pouvez voir qu'un ensemble de données est combiné en un seul fichier à partir de plusieurs fichiers, puis le fichier combiné est à nouveau supprimé. Ceci en est à cause des limites de GitHub.