computing_for_data_analysis
1.0.0
該存儲庫包含佐治亞理工學院2020年春季CSE 6040的所有類材料,與Richard Vuduc博士一起計算數據分析類。 (作為旁注,這是我參加過的最好的類。)所有內容都在project_files文件夾中,並且對其進行了測序,以易於導航。在project_files內部,您會發現Getting Started文件夾。所以,從那裡開始。
該課程基於Python 3.7和Jupyter筆記本。我包括了可以與之使用的虛擬環境。但是,在整個課程中,您可能需要經常安裝所需的軟件包。事實之後,我創建了虛擬環境。
您可以忽略Scratch Pad文件夾。您不必查看它,但是您可能會在那裡找到一些有趣的代碼,因此我為什麼將其保存在那裡,因為如果我要尋找它,我想自己找到該代碼。
需要注意的是:有些數據集大於100 MB,必須將其存儲為零件。因此,您可能會看到數據集將數據集合併為來自多個文件的單個文件,然後再次刪除組合文件。這是由於github的局限性。