computing_for_data_analysis
1.0.0
该存储库包含佐治亚理工学院2020年春季CSE 6040的所有类材料,与Richard Vuduc博士一起计算数据分析类。 (作为旁注,这是我参加过的最好的类。)所有内容都在project_files文件夹中,并且对其进行了测序,以易于导航。在project_files内部,您会发现Getting Started文件夹。所以,从那里开始。
该课程基于Python 3.7和Jupyter笔记本。我包括了可以与之使用的虚拟环境。但是,在整个课程中,您可能需要经常安装所需的软件包。事实之后,我创建了虚拟环境。
您可以忽略Scratch Pad文件夹。您不必查看它,但是您可能会在那里找到一些有趣的代码,因此我为什么将其保存在那里,因为如果我要寻找它,我想自己找到该代码。
需要注意的是:有些数据集大于100 MB,必须将其存储为零件。因此,您可能会看到数据集将数据集合并为来自多个文件的单个文件,然后再次删除组合文件。这是由于github的局限性。