Dieses Repository enthält alle Klassenmaterialien für das Frühjahr 2020 CSE 6040 von Georgia Tech, Computer für die Datenanalyseklasse mit Dr. Richard Vucuc . (Als Randnotiz war dies die beste Klasse, die ich je genommen habe.) Alle Inhalte befinden sich im Ordner project_files und werden für eine einfachere Navigation sequenziert. Innerhalb des project_files finden Sie den Ordner Getting Started . Also fang dort an.
Diese Klasse basiert auf Python 3.7- und Jupyter -Notizbüchern. Ich habe die virtuelle Umgebung aufgenommen, die Sie damit verwenden können. Möglicherweise müssen Sie jedoch die erforderlichen Pakete von Zeit zu Zeit installieren, wenn Sie sie während des gesamten Kurses begegnen. Ich habe die virtuelle Umgebung nach der Tatsache erstellt.
Sie können den Scratch Pad ignorieren. Sie müssen es sich nicht ansehen, aber vielleicht finden Sie dort einen interessanten Code und daher, warum ich ihn dort behalten habe, weil ich diesen Code selbst finden möchte, wenn ich danach suche.
Etwas anderes zu beachten: Einige Datensätze sind größer als 100 MB und müssen als Teile gespeichert werden. Möglicherweise sehen Sie möglicherweise, dass ein Datensatz zu einer einzelnen Datei aus mehreren Dateien kombiniert wird und die kombinierte Datei erneut gelöscht wird. Dies liegt so wegen der Einschränkungen von Github.