Этот репозиторий содержит все материалы класса для Georgia Tech's Spring 2020 CSE 6040, вычисление для анализа данных с доктором Ричардом Вудуком . (Как примечание, это был лучший класс, который я когда -либо принимал.) Все контент находится в папке project_files , и он секвенирован для облегчения навигации. Внутри project_files вы найдете папку Getting Started . Итак, начните там.
Этот класс основан на ноутбуках Python 3.7 и Jupyter. Я включил виртуальную среду, которую вы можете использовать с ней. Тем не менее, вам может потребоваться устанавливать необходимые пакеты так часто, когда вы сталкиваетесь с ними на протяжении всего курса. Я создал виртуальную среду после факта.
Вы можете игнорировать папку Scratch Pad . Вам не нужно смотреть на это, но вы можете найти там какой -то интересный код, и поэтому я сохранил его там, потому что я хочу найти этот код сам, если я буду искать его.
Что -то еще, чтобы отметить: некоторые наборы данных превышают 100 МБ, и их нужно хранить в виде деталей. Таким образом, вы можете увидеть, что набор данных объединяется в один файл из нескольких файлов, а затем комбинированный файл снова удален. Это так из -за ограничений GitHub.