Repositori ini berisi semua bahan kelas untuk musim semi Georgia Tech 2020 CSE 6040, komputasi untuk kelas analisis data dengan Dr. Richard Vuduc . (Sebagai catatan, ini adalah kelas terbaik yang pernah saya ambil.) Semua konten ada di folder project_files dan diurutkan untuk navigasi yang lebih mudah. Di dalam project_files , Anda akan menemukan folder Getting Started . Jadi, mulailah dari sana.
Kelas ini didasarkan pada Python 3.7 dan Jupyter Notebooks. Saya telah memasukkan lingkungan virtual yang dapat Anda gunakan dengannya. Namun, Anda mungkin perlu menginstal paket yang dibutuhkan sesering mungkin saat Anda menabraknya sepanjang kursus. Saya menciptakan lingkungan virtual setelah fakta.
Anda dapat mengabaikan folder Scratch Pad . Anda tidak perlu melihatnya, tetapi Anda mungkin menemukan kode menarik di sana dan karenanya mengapa saya menyimpannya di sana karena saya ingin menemukan kode itu sendiri jika saya akan mencarinya.
Hal lain yang perlu diperhatikan: Beberapa set data lebih besar dari 100 MB dan harus disimpan sebagai bagian. Jadi, Anda dapat melihat bahwa dataset digabungkan menjadi satu file dari beberapa file dan kemudian file gabungan dihapus lagi. Ini karena keterbatasan GitHub.