awesome datascience 다운로드 - awesome datascience 소스 코드 다운로드

멋진 데이터 과학

실제 문제 해결을 위해 배우고 적용하는 오픈 소스 데이터 과학 저장소.

이것은 데이터 과학을 공부하기위한 바로 가기 경로입니다. "데이터 과학이란 무엇이며 데이터 과학을 배우기 위해 무엇을 공부해야합니까?"

스폰서

스폰서	정점
---	첫 번째 후원자가 되십시오! `[email protected]`

데이터 과학이란 무엇입니까?
어디서부터 시작합니까?
훈련 자원
- 튜토리얼
- 무료 코스
- 온라인 과정을 크게 개설하십시오
- 집중 프로그램
- 대학
데이터 과학 도구 상자
- 알고리즘
  - 감독 학습
  - 감독되지 않은 학습
  - 반 감독 학습
  - 강화 학습
  - 데이터 마이닝 알고리즘
  - 딥 러닝 아키텍처
- 일반 기계 학습 패키지
- 딥 러닝 패키지
  - Pytorch 생태계
  - 텐서 플로우 생태계
  - 케라 생태계
- 시각화 도구
- 기타 도구
문학과 미디어
- 서적
  - 책 거래 (계열사)
- 저널, 간행물 및 잡지
- 뉴스 레터
- 블로거
- 프레젠테이션
- 팟 캐스트
- YouTube 비디오 및 채널
사교
- 페이스 북 계정
- 트위터 계정
- 전보 채널
- 슬랙 커뮤니티
- Github 그룹
- 데이터 과학 경쟁
재미있는
- 인포 그래픽
- 데이터 세트
- 지세도
다른 멋진 목록
- 취미

데이터 과학이란 무엇입니까?

^ back to top ^

데이터 과학은 요즘 컴퓨터와 인터넷 농지에서 가장 인기있는 주제 중 하나입니다. 사람들은 오늘날까지 응용 프로그램 및 시스템에서 데이터를 수집했으며 지금은 데이터를 분석 할 때입니다. 다음 단계는 데이터로부터 제안을 제작하고 미래에 대한 예측을 만드는 것입니다. 여기에서 데이터 과학 에 대한 가장 큰 질문과 전문가의 수백 가지 답변을 찾을 수 있습니다.

링크	시사
데이터 과학이란 무엇입니까 @ O'Reilly	데이터 과학자들은 기업가 정신과 인내심, 데이터 제품을 점차적으로 구축하려는 의지, 탐색 능력 및 솔루션을 반복 할 수있는 능력을 결합합니다. 그들은 본질적으로 학제 적입니다. 초기 데이터 수집 및 데이터 조건에서 결론에 이르기까지 문제의 모든 측면을 해결할 수 있습니다. 그들은 상자 밖에서 문제를 보는 새로운 방법을 생각해 내거나 매우 광범위하게 정의 된 문제로 작업 할 것이라고 생각할 수 있습니다.“여기에 많은 데이터가 있습니다. 무엇을 만들 수 있습니까?”
데이터 과학 @ Quora 란 무엇입니까?	데이터 과학은 기술, 알고리즘 개발 및 데이터 간섭과 같은 데이터의 여러 측면을 조합하여 데이터를 연구하고 분석하며 어려운 문제에 대한 혁신적인 솔루션을 찾습니다. 기본적으로 데이터 과학은 창의적인 방법을 찾아 데이터를 분석하고 비즈니스 성장을 추구하는 것입니다.
21 세기의 가장 섹시한 직업	오늘날 데이터 과학자들은 1980 년대와 1990 년대의 월스트리트“Quants”와 유사합니다. 당시 물리학 및 수학 배경을 가진 사람들은 투자 은행 및 헤지 펀드로 스트리밍하여 완전히 새로운 알고리즘과 데이터 전략을 고안 할 수 있습니다. 그런 다음 다양한 대학들이 금융 공학 분야의 마스터 프로그램을 개발하여 주류 회사에 더 접근 할 수있는 2 세대의 인재를 휘젓습니다. 이 패턴은 1990 년대 후반에 검색 엔지니어들과 함께 반복되었으며, 그의 희귀 기술은 곧 컴퓨터 과학 프로그램에서 가르쳤습니다.
위키 백과	데이터 과학은 과학적 방법, 프로세스, 알고리즘 및 시스템을 사용하여 많은 구조적 및 비 구조적 데이터에서 지식과 통찰력을 추출하는 학제 간 분야입니다. 데이터 과학은 데이터 마이닝, 머신 러닝 및 빅 데이터와 관련이 있습니다.
데이터 과학자가되는 방법	데이터 과학자들은 빅 데이터 랭글러이며, 구조화되지 않은 구조화되지 않은 데이터를 수집하고 분석합니다. 데이터 과학자의 역할은 컴퓨터 과학, 통계 및 수학을 결합합니다. 그들은 데이터를 분석, 프로세스 및 모델링 한 다음 결과를 해석하여 회사 및 기타 조직에 대한 실행 가능한 계획을 작성합니다.
#Datascience의 매우 짧은 역사	데이터 과학자들이 어떻게 섹시하게되었는지에 대한 이야기는 대부분 젊은 컴퓨터 과학과의 성숙한 통계 분야의 결합에 대한 이야기입니다. “데이터 과학”이라는 용어는 최근에 빅 데이터의 광대 한 상점을 이해할 것으로 예상되는 새로운 직업을 구체적으로 지정하기 위해 등장했습니다. 그러나 데이터를 이해하는 것은 오랜 역사를 가지고 있으며 과학자, 통계 학자, 사서, 컴퓨터 과학자 및 기타 수년간 논의되었습니다. 다음 타임 라인은“데이터 과학”이라는 용어의 진화와 그 사용, 그것을 정의하려는 시도 및 관련 용어를 추적합니다.
데이터 과학자를위한 소프트웨어 개발 리소스	데이터 과학자들은 탐색 적 분석, 통계 및 모델을 통해 데이터를 이해하는 데 집중합니다. 소프트웨어 개발자는 다양한 도구로 별도의 지식을 적용합니다. 그들의 초점은 관련이없는 것처럼 보이지만 데이터 과학 팀은 소프트웨어 개발 모범 사례를 채택하면 혜택을 볼 수 있습니다. 버전 제어, 자동 테스트 및 기타 개발 기술은 재현 가능한 프로덕션 준비 코드 및 도구를 만드는 데 도움이됩니다.
데이터 과학자 로드맵	데이터 과학은 오늘날의 데이터 중심 세계에서 약 3 억 3,77 만 대의 데이터가 매일 생성되는 우수한 경력 선택입니다. 그리고이 숫자는 매일 증가하고 있으며,이 데이터를 활용하여 비즈니스 성장을 주도 할 수있는 숙련 된 데이터 과학자에 대한 수요가 증가합니다.
데이터 과학자가되는 길을 탐색합니다	_Data Science는 오늘날 가장 수요가 많은 경력 중 하나입니다. 비즈니스가 점점 더 많은 데이터에 의존하여 결정을 내리면서 숙련 된 데이터 과학자들의 필요성이 빠르게 성장했습니다. 기술 회사, 의료 기관 또는 정부 기관이든 데이터 과학자는 원시 데이터를 귀중한 통찰력으로 전환하는 데 중요한 역할을합니다. 그러나 특히 데이터 과학자가되는 방법, 특히 방금 시작한 경우 어떻게합니까? _

어디서부터 시작합니까?

^ back to top ^

엄격하게 필요하지는 않지만 프로그래밍 언어를 갖는 것은 데이터 과학자로서 효과적인 기술입니다. 현재 가장 인기있는 언어는 파이썬 이며 r이 뒤 따릅니다. Python은 다양한 분야에서 응용 프로그램을 보는 일반 목적 스크립팅 언어입니다. R은 통계에 대한 도메인 별 언어로, 많은 공통 통계 도구가 포함되어 있습니다.

Python은 과학에서 가장 인기있는 언어이며, 사용 가능한 용이성과 사용자 생성 패키지의 생생한 생태계에 따라 작은 부분이 아닙니다. 패키지를 설치하려면 PIP ( pip install 로 호출), Python과 함께 제공되는 패키지 관리자 및 Python, R 용 패키지를 설치할 수 있고 GIT와 같은 실행 파일을 다운로드 할 수있는 강력한 패키지 관리자 인 Anaconda ( conda install 로 호출)의 두 가지 주요 방법이 있습니다.

R과 달리 Python은 데이터 과학을 염두에두고 처음부터 구축되지 않았지만이를 보충 할 제 3 자 라이브러리가 많이 있습니다. 이 문서의 뒷부분에서 훨씬 더 철저한 패키지 목록을 찾을 수 있지만,이 네 가지 패키지는 다음과 같이 데이터 과학 여행을 시작하기에 좋은 선택입니다. Scikit-Learn은 가장 인기있는 알고리즘을 구현하는 일반적인 목적 데이터 과학 패키지입니다. 여기에는 풍부한 문서, 자습서 및 모델의 모델의 예제가 포함되어 있습니다. 자신의 구현을 작성하는 것을 선호하더라도 Scikit-Learn은 찾은 많은 일반적인 알고리즘 뒤에있는 너트와 볼트에 대한 귀중한 참조입니다. 팬더를 사용하면 데이터를 편리한 테이블 형식으로 수집하고 분석 할 수 있습니다. Numpy는 벡터 및 매트릭스에 중점을 둔 수학 작업을위한 매우 빠른 도구를 제공합니다. Matplotlib 패키지를 기반으로 한 Seaborn 자체는 데이터의 아름다운 기본값을 사용하여 데이터의 아름다운 시각화를 생성하는 빠른 방법과 데이터의 많은 일반적인 시각화를 생성하는 방법을 보여주는 갤러리를 생성하는 빠른 방법입니다.

데이터 과학자가되기위한 여정을 시작할 때 언어 선택은 특히 중요하지 않으며 Python과 R은 모두 장단점을 가지고 있습니다. 좋아하는 언어를 선택하고 아래에 나열된 무료 코스 중 하나를 확인하십시오!

실제 세계

^ back to top ^

데이터 과학은 복잡한 데이터에서 통찰력과 패턴을 추출하여 실제 문제를 해결하기 위해 다양한 분야에서 활용되는 강력한 도구입니다.

재해

^ back to top ^

Deprem-Ml Aya : Açık Yazılım Ağı (+25K 개발자)는 인공 지능을 사용하여 재난 대응을 돕기 위해 노력하고 있습니다. 모든 것이 오픈 소스 afet.org입니다.

훈련 자원

^ back to top ^

데이터 과학을 어떻게 배우나요? 물론 데이터 과학을 수행함으로써! 좋아요, 좋아요 - 처음 시작할 때 특히 도움이되지 않을 수도 있습니다. 이 섹션에서는 튜토리얼, 튜토리얼, MOOC (Online Online Courses), 집중적 인 프로그램 및 대학을 최소한으로 최소한으로 최대한의 헌신으로 대략적으로 학습 리소스를 나열했습니다.

튜토리얼

^ back to top ^

1000 개의 데이터 과학 프로젝트 Ipython과 함께 브라우저에서 실행할 수 있습니다.
#TIDYTUESDADY R Ecosystem을 대상으로 한 주간 데이터 프로젝트.
데이터 과학의 방식
Pyspark 치트 시트
Python을 통한 기계 학습, 데이터 과학 및 딥 러닝
데이터를 레이블링하는 방법
잠재적 인 Dirichlet 할당에 대한 안내서
Classpert 온라인 검색 엔진에서 1000 개가 넘는 데이터 과학 온라인 과정
Clinton Sheppard의 Python과 함께 유전자 알고리즘의 소스 코드 튜토리얼
머신 러닝을위한 신호 처리에 대한 튜토리얼
Python Time-Series 모델 배포에 대한 실시간 배포 자습서.
데이터 과학을위한 파이썬 : 초보자 안내서
기계 학습 인터뷰를위한 최소 실행 가능한 학습 계획
견고한 프로젝트를 구축하여 머신 러닝 엔지니어링을 이해하고 알고
Python 및 Pandas를 연습하기위한 12 개의 무료 데이터 과학 프로젝트
데이터 과학 신입생을위한 최고의 CV/이력서
Java의 데이터 과학 과정을 이해하십시오
데이터 분석 인터뷰 질문 (초보자부터 고급)
상위 100 개 이상의 데이터 과학 인터뷰 질문 및 답변

무료 코스

^ back to top ^

r의 데이터 과학자
파이썬의 데이터 과학자
유전자 알고리즘 OCW 과정
AI 전문가 로드맵 - 인공 지능 전문가가되는 로드맵
볼록 최적화 - 볼록 최적화 (볼록 분석의 기본 사항; 최소 제곱, 선형 및 2 차 프로그램, 반 피니 나이트 프로그래밍, 최소량, 극한 볼륨 및 기타 문제; 최적 조건, 이중성 이론 ...)
Skillcombo- 데이터 과학 -10000+ 무료 온라인 데이터 과학 과정
데이터로부터의 학습 - 기본 이론, 알고리즘 및 응용 프로그램을 다루는 기계 학습 소개
Kaggle- 데이터 과학, 머신 러닝, 파이썬 등에 대해 배우십시오.
ML 관측 성 기본 사항 - 생산 ML 문제를 모니터링하고 근본 원인으로 인정하는 방법을 배우십시오.
웨이트 및 바이어스 효과적인 MLOPS : 모델 개발-W & B를 사용하여 엔드 투 엔드 머신 구축을위한 무료 코스 및 인증
머신 러닝을위한 파이썬 - 가장 강력한 프로그래밍 언어 중 하나 인 Python을 사용하여 기계 학습 여행을 시작하십시오.
Scaler에 의한 데이터 과학을위한 Python-이 과정은 초보자에게 오늘날의 데이터 중심 세계에서 탁월한 기술을 갖추기 위해 설계되었습니다. 포괄적 인 커리큘럼은 통계, 프로그래밍, 데이터 시각화 및 기계 학습의 탄탄한 토대를 제공합니다.
MLSYS-NYU-2022- 2022 년 NYU Tandon의 금융 과정에서 기계 학습을위한 슬라이드, 스크립트 및 자료.
실습 열차 및 배포 ML- 암호화 가격을 예측하는 서버리스 API를 교육하고 배포하는 실습 코스.
LLMOPS : 대형 언어 모델로 실제 응용 프로그램 구축 - 현장에서 최신 도구와 기술을 사용하여 LLM을 사용하여 최신 소프트웨어를 구축하는 법을 배우십시오.
비전 모델을위한 신속한 엔지니어링 - Deeplearning.ai 의이 무료 코스에서 자연 언어, 좌표 포인트, 경계 박스, 세분화 마스크 및 기타 이미지로 최첨단 컴퓨터 비전 모델을 자극하는 방법을 배우십시오.
IBM의 데이터 과학 과정 - 무료 리소스 및 데이터 과학이 무엇인지, 다른 산업에서 사용되는 방법을 배우십시오.

Mooc 's

^ back to top ^

Coursera 데이터 과학 소개
데이터 과학 - 9 단계 과정, 코스 라의 전문화
데이터 마이닝 -5 단계 코스, Coursera의 전문화
머신 러닝 - 5 단계 코스, Coursera의 전문화
CS 109 데이터 과학
OpenIntro
CS 171 시각화
프로세스 마이닝 : 데이터 과학 행동
옥스포드 딥 러닝
옥스포드 딥 러닝 - 비디오
옥스포드 머신 러닝
UBC 머신 러닝 - 비디오
데이터 과학 전문화
Coursera 빅 데이터 전문화
EDX의 데이터 과학 및 분석에 대한 통계적 사고
IBM의인지 클래스 AI
Udacity- 딥 러닝
keras가 움직입니다
데이터 과학을위한 Microsoft 전문 프로그램
Comp3222/Comp6246- 기계 학습 기술
CS 231- 시각적 인식을위한 Convolutional Neural Network
Coursera Tensorflow
Coursera 딥 러닝 전문화
365 데이터 과학 과정
Coursera Natural Language Processing Specialization
Coursera Gan 전문화
Codecademy의 데이터 과학
선형 대수 - Gilbert Strang의 선형 대수 코스
2020 선형 대수 비전 (G. Strang)
데이터 과학 재단 과정의 파이썬
데이터 과학 : 통계 및 기계 학습
생산을위한 머신 러닝 엔지니어링 (MLOPS)
University of Minnesota의 추천 시스템 전문화는 Coursera 플랫폼의 추천 시스템에 중점을 둔 중간/고급 레벨 전문화입니다.
스탠포드 인공 지능 전문 프로그램
파이썬의 데이터 과학자
Julia와 프로그래밍
스케일러 데이터 과학 및 기계 학습 프로그램
데이터 과학 기술 트리
초보자를위한 데이터 과학 - AI 교사와 함께 배우십시오
초보자를위한 머신 러닝 - AI 교사와 함께 배우십시오

집중 프로그램

^ back to top ^

S2DS

대학

^ back to top ^

데이터 과학 학위를 제공하는 대학 목록.
데이터 과학 학위 @ 버클리
데이터 과학 학위 @ UVA
데이터 과학 학위 @ 위스콘신
데이터 과학 및 응용 프로그램의 BS
컴퓨터 정보 시스템 @ Boston University의 MS
비즈니스 분석 @ ASU 온라인 MS
Applied Data Science @ Syracuse의 MS
MS Management & Data Science @ Leuphana
데이터 과학 석사 @ 멜버른 대학교
Data Science @ Edinburgh 대학교 MSC
관리 석사 분석 @ Queen 's University
데이터 과학 석사 @ 일리노이 기술 연구소
응용 데이터 과학 석사 @ 미시간 대학교
마스터 데이터 과학 및 인공 지능 @ Eindhoven University of Technology
데이터 과학 및 컴퓨터 공학 석사 학위 @ 그라나다 대학교

데이터 과학 도구 상자

^ back to top ^

이 섹션은 데이터 과학 세계의 패키지, 도구, 알고리즘 및 기타 유용한 항목 모음입니다.

알고리즘

^ back to top ^

이들은 기계 학습 및 데이터 마이닝 알고리즘 및 모델로 데이터를 이해하고 의미를 도출하는 데 도움이됩니다.

세 종류의 기계 학습 시스템

인간 감독과의 훈련을 기반으로합니다
즉시 학습을 기반으로합니다
데이터 포인트 비교 및 패턴 감지를 기반으로합니다

비교

DataCompy -DataCompy는 두 개의 팬더 데이터 프레임을 비교하는 패키지입니다.

감독 학습

회귀
선형 회귀
평범한 최소 제곱
로지스틱 회귀
단계적 회귀
다변량 적응 회귀 스플라인
SoftMax 회귀
국부적으로 추정 된 산점도 스무딩
분류
- K-nearest 이웃
- 벡터 머신을 지원합니다
- 의사 결정 트리
- ID3 알고리즘
- C4.5 알고리즘
앙상블 학습
- 부스팅
- 스태킹
- 포장
- 임의의 숲
- Adaboost

감독되지 않은 학습

클러스터링
- 계층 클러스터링
- K- 평균
- 밀도 기반 클러스터링
- 퍼지 클러스터링
- 혼합 모델
치수 감소
- 주요 구성 요소 분석 (PCA)
- t-sne; T- 분산 된 확률 론적 인 이웃 임베딩
- 요인 분석
- 잠재적 인 Dirichlet 할당 (LDA)
신경망
자체 조직지도
적응 형 공명 이론
숨겨진 마르코프 모델 (흠)

반 감독 학습

S3VM
클러스터링
생성 모델
저밀도 분리
라플라시안 정규화
휴리스틱 접근

강화 학습

Q 학습
SARSA (State-Action-Reward-State-Action) 알고리즘
시간적 차이 학습

데이터 마이닝 알고리즘

C4.5
K- 평균
SVM (지원 벡터 머신)
apriori
EM (기대 대비)
PageRank
Adaboost
KNN (K-NAREARSEST 이웃)
순진한 베이
카트 (분류 및 회귀 나무)

딥 러닝 아키텍처

다층 퍼셉트론
컨볼 루션 신경 네트워크 (CNN)
재발 신경 네트워크 (RNN)
볼츠 만 기계
autoencoder
생성 적대적 네트워크 (GAN)
자체 구성지도
변신 로봇
조건부 랜덤 필드 (CRF)
ML 시스템 설계)

일반 기계 학습 패키지

^ back to top ^

Scikit-Learn
Scikit-Multilearn
Sklearn-Expertsys
Scikit-feature
Scikit-rebate
SeqLearn
스키어 베이
Sklearn-crfsuite
스카운 드피아프
SIGOPT_SKLEARN
스카리 평가
Scikit-Image
Scikit-opt
Scikit-Posthocs
양파
쇼군
xlearn
Cuml
인과 관계
mlpack
mlxtend
모달
불꽃 학습
과도
dlib
Imodels
규칙
피그 팜
깊은 점검
Scikit-Survival
해석 가능
xgboost
LightgBM
catboost
Jax

딥 러닝 패키지

Pytorch 생태계

Pytorch
횃불
횃불 텍스트
Torchaudio
점화
Pytorchnet
Pytoune
스코치
Pyvarinf
pytorch_geometric
gpytorch
파이로
촉매
pytorch_tabular
yolov3
yolov5
yolov8

텐서 플로우 생태계

텐서 플로
텐소 레이어
tflearn
소네트
텐소 팩
trfl
폴리 바슨
Neupy
tfdeploy
텐서 플로우 업 스트림
텐서 플로우
Tensorlm
텐서 라이트
메쉬 텐서 플로우
루드비히
TF-Agents
텐서 포스

케라 생태계

케라
Keras-Contrib
hyperas
Elephas
헤라
Spektral
Qkeras
Keras-RL
탈로스

시각화 도구

^ back to top ^

알테르
addepar
암 차트
anychart
보케
혜성
slemma
Cartodb
입방체
d3plus
데이터 중심 문서 (D3JS)
dygraphs
echarts
전시하다
gephi
ggplot2
아교
구글 차트 갤러리
하이 카트
import.io
jqplot
matplotlib
NVD3
넷런
OpenRefine
줄거리
날것의
resseract lite
슈타본
Techanjs
타임 라인
VarianCecharts
비다
비즈
랭글러
R2D3
네트워크
레쉬
C3
TensorWatch
Geomap
대시

기타 도구

^ back to top ^

링크	설명
데이터 과학 수명주기 프로세스	데이터 과학 수명주기 프로세스는 데이터 과학 팀을 아이디어에서 반복적으로 그리고 지속적으로 가치로 끌어들이는 프로세스입니다. 프로세스는이 리포지토리에 문서화되어 있습니다
데이터 과학 수명주기 템플릿 repo	데이터 과학 라이프 사이클 프로젝트를위한 템플릿 저장소
렉스 덱스	공정한 평가를위한 범용 추천자 메트릭 도서관.
화학 물질	약물 쌍 스코어링을위한 Pytorch 기반 딥 러닝 라이브러리.
Pytorch 기하학적 시간	동적 그래프에 대한 표현 학습.
작은 모피 공	API와 같은 Scikit-Learn이있는 NetworkX 용 그래프 샘플링 라이브러리.
가라테 클럽	API와 같은 Scikit-Learn이있는 NetworkX 용 감독되지 않은 머신 러닝 확장 라이브러리.
ML 작업 공간	기계 학습 및 데이터 과학을위한 올인원 웹 기반 IDE. 작업 공간은 Docker 컨테이너로 배포되며 다양한 인기있는 데이터 과학 라이브러리 (예 : Tensorflow, Pytorch) 및 DEV 도구 (예 : Jupyter, vs Code)로 전달됩니다.
Neptune.ai	머신 러닝 모델을 만들고 공유하는 데이터 과학자를 지원하는 커뮤니티 친화적 인 플랫폼. 해왕성은 팀워크, 인프라 관리, 모델 비교 및 재현성을 촉진합니다.
계산서	빠르고 재현 가능한 기계 학습 실험을위한 가벼운 파이썬 라이브러리. 깨끗한 머신 러닝 파이프 라인 설계를 가능하게하는 매우 간단한 인터페이스를 소개합니다.
steppy-toolkit	기계 학습이 더 빠르고 효과적으로 작동하도록하는 신경망, 변압기 및 모델의 선별 된 수집.
Google의 데이터 ab	Python 및 SQL과 같은 친숙한 언어를 사용하여 대화식으로 쉽게 탐색, 시각화, 분석 및 변환하십시오.
Hortonworks 샌드 박스	수십 개의 대화식 Hadoop 튜토리얼과 함께 제공되는 개인적이고 휴대용 Hadoop 환경입니다.
아르 자형	통계 컴퓨팅 및 그래픽을위한 무료 소프트웨어 환경입니다.
Tidyverse	데이터 과학을 위해 설계된 R 패키지의 의견이 많은 컬렉션입니다. 모든 패키지는 기본 디자인 철학, 문법 및 데이터 구조를 공유합니다.
rstudio	IDE - R의 강력한 사용자 인터페이스는 무료 및 오픈 소스이며 Windows, Mac 및 Linux에서 작동합니다.
파이썬 - 팬더 - 아나콘다	대규모 데이터 처리, 예측 분석 및 과학 컴퓨팅을위한 완전 무료 Enterprise-Ready Python Distribution
팬더스 gui	팬더스 gui
Scikit-Learn	파이썬의 기계 학습
Numpy	Numpy는 Python을 사용한 과학 컴퓨팅의 기본입니다. 대형 다차원 배열 및 행렬을 지원하며 이러한 배열에서 작동하기 위해 다양한 수준의 수준의 수학적 기능을 포함합니다.
vaex	VAEX는 큰 데이터 세트를 시각화하고 고속으로 통계를 계산할 수있는 파이썬 라이브러리입니다.
Scipy	Scipy는 Numpy Array와 함께 작동하며 수치 통합 및 최적화를위한 효율적인 루틴을 제공합니다.
데이터 과학 도구 상자	Coursera 코스
데이터 과학 도구 상자	블로그
Wolfram 데이터 과학 플랫폼	수치, 텍스트, 이미지, GIS 또는 기타 데이터를 가져 와서 Wolfram 처리를 제공하여 전체 스펙트럼의 데이터 과학 분석 및 시각화를 수행하고 풍부한 대화 형 보고서를 자동으로 생성합니다.
Datadog	고급 데이터 과학을위한 솔루션, 코드 및 DevOps.
변화	JavaScript를 작성하지 않고 웹에 대한 강력한 데이터 시각화 구축
카이트 개발 키트	Kite Software Development Kit (Apache License, Version 2.0) 또는 Kite for Short는 Hadoop 생태계 위에 시스템을보다 쉽게 구축 할 수 있도록하는 일련의 라이브러리, 도구, 예제 및 문서 세트입니다.
도미노 데이터 실험실	인프라 나 설정없이 모델을 실행, 스케일, 공유 및 배포하십시오.
아파치 플링크	효율적이고 분산 된 일반 목적 데이터 처리를위한 플랫폼.
아파치 하마	Apache Hama는 Apache Top Level Open Source 프로젝트로 MapReduce를 넘어서 고급 분석을 수행 할 수 있습니다.
Weka	Weka는 데이터 마이닝 작업을위한 기계 학습 알고리즘 모음입니다.
옥타브	GNU 옥타브는 주로 수치 계산을위한 고급 해석 언어입니다. (무료 MATLAB)
아파치 스파크	번개 빠른 클러스터 컴퓨팅
수학권 안개	Apache Spark Analytics 작업 및 기계 학습 모델을 실시간, 배치 또는 반응성 웹 서비스로 노출시키는 서비스.
데이터 메커니즘	Apache Spark를보다 개발자에게 친숙하고 비용 효율적으로 만드는 데이터 과학 및 엔지니어링 플랫폼.
카페	딥 러닝 프레임 워크
토치	Luajit의 과학 컴퓨팅 프레임 워크
Nervana의 파이썬 기반 딥 러닝 프레임 워크	Intel® Nervana ™ 참조 딥 러닝 프레임 워크 모든 하드웨어에서 최상의 성능을 발휘합니다.
스케일	NodeJS에서 고성능 분산 데이터 처리
Aerosolve	인간을 위해 제작 된 기계 학습 패키지.
인텔 프레임 워크	Intel® 딥 러닝 프레임 워크
Datawrapper	오픈 소스 데이터 시각화 플랫폼은 모든 사람이 간단하고 정확하며 임베드 가능한 차트를 만들 수 있도록 도와줍니다. 또한 github.com에서
텐서 흐름	Tensorflow는 기계 인텔리전스를위한 오픈 소스 소프트웨어 라이브러리입니다.
자연어 툴킷	자연어 처리 및 분류를위한 소개하면서도 강력한 툴킷
주석 실험실	텍스트 주석 및 DL 모델 교육/튜닝을위한 무료 엔드 투 엔드 노 코드 플랫폼. 명명 된 엔티티 인식, 분류, 관계 추출 및 어설 션 상태에 대한 상자 외 지원 Spark NLP 모델. 사용자, 팀, 프로젝트, 문서에 대한 무제한 지원.
node.js 용 nlp-toolkit	이 모듈은 몇 가지 기본 NLP 원칙 및 구현을 다룹니다. 주요 초점은 성능입니다. NLP의 샘플 또는 훈련 데이터를 처리하면 메모리가 빠르게 떨어집니다. 따라서이 모듈의 모든 구현은 현재 어떤 단계에서나 처리중인 메모리에 해당 데이터 만 보유하기 위해 스트림으로 작성됩니다.
줄리아	기술 컴퓨팅을위한 고급 고성능 동적 프로그래밍 언어
Ijulia	Julia-Language 백엔드는 Jupyter 대화식 환경과 결합되어 있습니다
아파치 제프 펠린	SQL, Scala 등과의 데이터 중심의 대화식 데이터 분석 및 협업 문서를 활성화하는 웹 기반 노트북
FeatureTools	파이썬으로 작성된 자동 기능 엔지니어링을위한 오픈 소스 프레임 워크
옵티머스	클렌징, 사전 처리, 기능 엔지니어링, 탐색 적 데이터 분석 및 Pyspark 백엔드가있는 쉬운 ML.
탈출	다양한 증강 기술 세트를 구현하는 빠르고 프레임 워크 불가지론 이미지 확대 라이브러리. 상자 밖으로 분류, 세분화 및 감지를 지원합니다. Kaggle, Topcoder 및 CVPR 워크샵의 일부인 대회에서 수많은 딥 러닝 대회에서 우승하는 데 사용되었습니다.
DVC	오픈 소스 데이터 과학 버전 제어 시스템. 데이터 과학 프로젝트를 추적, 구성 및 재현 할 수 있도록 도와줍니다. 매우 기본적인 시나리오에서는 버전이 큰 데이터 및 모델 파일을 제어하고 공유하는 데 도움이됩니다.
Lambdo	하나의 분석 파이프 라인 (i) 기능 엔지니어링 및 머신 러닝 (ii) 모델 교육 및 예측 (iii) 테이블 모집단 및 열 평가를 결합하여 데이터 분석을 크게 단순화하는 워크 플로 엔진입니다.
잔치	기계 학습 기능의 관리, 발견 및 액세스를위한 기능 저장소. Feast는 모델 교육 및 모델 서빙 모두에 대한 기능 데이터에 대한 일관된 견해를 제공합니다.
폴리 바슨	재현 가능하고 확장 가능한 기계 학습 및 딥 러닝을위한 플랫폼.
라이트 타그	팀을위한 텍스트 주석 도구
우비아이	대부분의 포괄적 인 자동 공개 기능이있는 팀을위한 사용하기 쉬운 텍스트 주석 도구. 송장 라벨링에 대한 NER, 관계 및 문서 분류 및 OCR 주석을 지원합니다.
기차	AUTO-MAGALIC 실험 관리자, 버전 제어 및 AI 용 DevOps
홉스 워크	기능 저장소가 장착 된 오픈 소스 데이터 집약적 인 기계 학습 플랫폼. 온라인 (MySQL 클러스터) 및 오프라인 (Apache Hive) 액세스에 대한 기능을 수집하고 관리합니다.
MindSDB	MindSDB는 개발자를위한 설명 가능한 자동 프레임 워크입니다. MindSDB를 사용하면 한 줄의 코드만큼 간단하게 Art ML 모델을 구축, 훈련 및 사용할 수 있습니다.
라이트 우드	머신 러닝 문제를 작은 블록으로 나누는 Pytorch 기반 프레임 워크는 한 줄의 코드로 예측 모델을 구축하기위한 목표와 함께 완벽하게 붙일 수있는 작은 블록으로 분류합니다.
AWS 데이터 Wrangler	Pandas 라이브러리의 전력을 AWS 연결 데이터 프레임 및 AWS 데이터 관련 서비스 (Amazon Redshift, AWS Glue, Amazon Athena, Amazon EMR 등)로 확장하는 오픈 소스 파이썬 패키지.
아마존 재 인식	AWS Rekognition은 Amazon Web Services에서 작업하는 개발자가 응용 프로그램에 이미지 분석을 추가 할 수있는 서비스입니다. 미디어 및 애플리케이션에서 자산을 카탈로그, 워크 플로우를 자동화하며 의미를 추출하십시오.
Amazon Textract	인쇄 된 텍스트, 필기 및 모든 문서에서 데이터를 자동으로 추출합니다.
Amazon Lookout Vision	컴퓨터 비전을 사용하여 제품 결함을 발견하여 품질 검사를 자동화합니다. 누락 된 제품 구성 요소, 차량 및 구조 손상 및 포괄적 인 품질 관리를위한 불규칙성을 식별하십시오.
아마존 코드 구루	코드 검토를 자동화하고 ML 기반 권장 사항으로 응용 프로그램 성능을 최적화하십시오.
CML	데이터 과학 프로젝트에서 지속적인 통합을 사용하기위한 오픈 소스 툴킷. GitHub Actions & Gitlab CI를 사용하여 생산과 같은 환경에서 모델을 자동으로 교육 및 테스트하고 Pull/Merge 요청에 대한 자율적 인 시각적 보고서.
다스크	분석 코드를 분산 컴퓨팅 시스템으로 전환하기위한 오픈 소스 파이썬 라이브러리 (빅 데이터)
통계 모들	파이썬 기반 추론 통계, 가설 테스트 및 회귀 프레임 워크
세대	자연어 텍스트의 주제 모델링을위한 오픈 소스 라이브러리
스파이	성능 자연 언어 처리 툴킷
그리드 스튜디오	그리드 스튜디오는 파이썬 프로그래밍 언어를 완전히 통합 한 웹 기반 스프레드 시트 응용 프로그램입니다.
파이썬 데이터 과학 핸드북	Python Data Science Handbook : Jupyter 노트북의 전체 텍스트
Shapley	기계 학습 앙상블에서 분류기의 값을 정량화하기위한 데이터 중심의 프레임 워크.
Dagshub	데이터, 모델 및 파이프 라인 관리를위한 오픈 소스 도구를 기반으로 한 플랫폼.
심해	새로운 종류의 데이터 과학 노트. 실시간 협업 및 클라우드에서 실행되는 Jupyter 호환.
발로 하이	기계 오케스트레이션, 자동 재현성 및 배포를 처리하는 MLOPS 플랫폼.
pymc3	Probabalistic 프로그래밍을위한 파이썬 라이브러리 (베이지안 추론 및 기계 학습)
파이 스탄	스탠에 대한 파이썬 인터페이스 (베이지안 추론 및 모델링)
흠	숨겨진 Markov 모델의 감독되지 않은 학습 및 추론
혼돈 천재	이상/이상 탐지 및 근본 원인 분석을위한 ML 전원 분석 엔진
Nimblebox	전 세계의 데이터 과학자와 기계 학습 실무자들이 웹 브라우저에서 멀티 클라우드 앱을 발견, 생성 및 출시 할 수 있도록 설계된 풀 스택 MLOPS 플랫폼.
TOWHEE	구조화되지 않은 데이터를 임베딩으로 인코딩하는 데 도움이되는 파이썬 라이브러리.
라니 나피	길고 지저분한 목이 노트북을 청소하는 데 좌절 한 적이 있습니까? 오픈 소스 파이썬 라이브러리 인 Lineapy를 사용하면 지저분한 개발 코드를 프로덕션 파이프 라인으로 변환하는 데 두 줄의 코드가 필요합니다.
Envd	데이터 과학 및 AI/ML 엔지니어링 팀을위한 기계 학습 개발 환경
데이터 과학 라이브러리를 탐색하십시오	검색 엔진? 인기 및 신규 라이브러리, 최고 작가, 트렌드 프로젝트 키트, 토론, 튜토리얼 및 학습 리소스의 선별 된 목록을 발견하고 찾는 도구
mlem	? Gitops 원칙에 따라 ML 모델을 버전하고 배포하십시오
mlflow	전체 라이프 사이클에서 ML 모델을 관리하기위한 MLOPS 프레임 워크
청정	데이터 중심 AI 용 Python Library 및 ML 데이터 세트의 다양한 문제를 자동으로 감지
autogluon	Automl은 이미지, 텍스트, 표, 시계열 및 다중 모달 데이터에 대한 정확한 예측을 쉽게 생성합니다.
Arize ai	ARIZE AI Community Tier Observability Observability Tool Tool Tool은 프로덕션에서 기계 학습 모델을 모니터링하고 데이터 품질 및 성능 드리프트와 같은 루트 제기 문제를 모니터링하십시오.
aureo.io	aureo.io는 인공 지능 구축에 중점을 둔로드 코드 플랫폼입니다. 파이프 라인, 자동화 및 인공 지능 모델과 통합 할 수있는 기능을 사용자에게 제공합니다.
ERD 실험실	개발자를위한 무료 클라우드 기반 엔티티 관계 다이어그램 (ERD) 도구.
아르 크리 니 닉스	노트북의 Mlops- 통찰력, 표면 문제, 모니터링 및 모델을 미세 조정합니다.
혜성	실험 추적, 모델 제작 관리, 모델 레지스트리 및 전체 데이터 계보가있는 MLOPS 플랫폼.
오피	개발자 및 생산 라이프 사이클에서 LLM 애플리케이션을 평가, 테스트 및 배송합니다.
합성	연구를위한 AI 기반 협업 환경. 관련 논문을 찾고, 참고 문헌을 관리하기 위해 컬렉션을 만들고, 컨텐츠를 한곳에서 요약하십시오.
티 플롯	데이터 시각화 출력을 자동으로 구성하는 워크 플로 도구
간소	기계 학습 및 데이터 과학 프로젝트를위한 앱 프레임 워크
Gradio	머신 러닝 모델 주변에서 사용자 정의 가능한 UI 구성 요소를 만듭니다
가중치 및 편견	실험 추적, 데이터 세트 버전 작성 및 모델 관리
DVC	기계 학습 프로젝트를위한 오픈 소스 버전 제어 시스템
Optuna	자동 하이퍼 파라미터 최적화 소프트웨어 프레임 워크
레이 튜닝	확장 가능한 하이퍼 파라미터 튜닝 라이브러리
아파치 공기 흐름	프로그래밍 방식으로 저자, 일정 및 모니터링 워크 플로우를위한 플랫폼
지사	최신 데이터 스택을위한 워크 플로 관리 시스템
케드로	재현 가능하고 관리 가능한 데이터 과학 코드 생성을위한 오픈 소스 파이썬 프레임 워크
해밀턴	신뢰할 수있는 데이터 변환을 작성하고 관리하기위한 경량 라이브러리
모양	기계 학습 모델의 출력을 설명하기위한 게임 이론 접근
라임	기계 학습 분류기의 예측을 설명합니다
플라이 트	머신 러닝을위한 워크 플로 자동화 플랫폼
DBT	데이터 구축 도구
모양	기계 학습 모델의 출력을 설명하기위한 게임 이론 접근
라임	기계 학습 분류기의 예측을 설명합니다

문학과 미디어

^ back to top ^

이 섹션에는 몇 가지 추가 독서 자료, 시청 채널 및 듣기 대화가 포함됩니다.

서적

^ back to top ^

처음부터 데이터 과학 : 파이썬의 첫 번째 원칙
파이썬을 통한 인공 지능 - Tutorialspoint
처음부터 기계 학습
확률 론적 기계 학습 : 소개
기계 학습에 대한 포괄적 인 가이드
데이터 과학을 이끄는 방법 - 조기 액세스
데이터와의 싸움
파이썬 및 다스크로 규모의 데이터 과학
파이썬 데이터 과학 핸드북
The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists
Think Like a Data Scientist
Introducing Data Science
Practical Data Science with R
Everyday Data Science & (cheaper PDF version)
Exploring Data Science - free eBook sampler
Exploring the Data Jungle - free eBook sampler
Classic Computer Science Problems in Python
Math for Programmers Early access
R in Action, Third Edition Early Access
Data Science Bookcamp Early access
Data Science Thinking: The Next Scientific, Technological and Economic Revolution
Applied Data Science: Lessons Learned for the Data-Driven Business
The Data Science Handbook
Essential Natural Language Processing - Early access
Mining Massive Datasets - free e-book comprehended by an online course
Pandas in Action - Early access
Genetic Algorithms and Genetic Programming
Advances in Evolutionary Algorithms - Free Download
Genetic Programming: New Approaches and Successful Applications - Free Download
Evolutionary Algorithms - Free Download
Advances in Genetic Programming, Vol. 3 - Free Download
Global Optimization Algorithms: Theory and Application - Free Download
Genetic Algorithms and Evolutionary Computation - Free Download
Convex Optimization - Convex Optimization book by Stephen Boyd - Free Download
Data Analysis with Python and PySpark - Early Access
R for Data Science
Build a Career in Data Science
Machine Learning Bookcamp - Early access
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition
Effective Data Science Infrastructure
Practical MLOps: How to Get Ready for Production Models
Data Analysis with Python and PySpark
Regression, a Friendly guide - Early Access
Streaming Systems: The What, Where, When, and How of Large-Scale Data Processing
Data Science at the Command Line: Facing the Future with Time-Tested Tools
Machine Learning - CIn UFPE
Machine Learning with Python - Tutorialspoint
Deep Learning
Designing Cloud Data Platforms - Early Access
An Introduction to Statistical Learning with Applications in R
The Elements of Statistical Learning: Data Mining, Inference, and Prediction
Deep Learning with PyTorch
Neural Networks and Deep Learning
Deep Learning Cookbook
Introduction to Machine Learning with Python
Artificial Intelligence: Foundations of Computational Agents, 2nd Edition - Free HTML version
The Quest for Artificial Intelligence: A History of Ideas and Achievements - Free Download
Graph Algorithms for Data Science - Early Access
Data Mesh in Action - Early Access
Julia for Data Analysis - Early Access
Casual Inference for Data Science - Early Access
Regular Expression Puzzles and AI Coding Assistants by David Mertz
Dive into Deep Learning
Data for All
Interpretable Machine Learning: A Guide for Making Black Box Models Explainable - Free GitHub version
Foundations of Data Science Free Download
Comet for DataScience: Enhance your ability to manage and optimize the life cycle of your data science project
Software Engineering for Data Scientists - Early Access
Julia for Data Science - Early Access
An Introduction to Statistical Learning - Download Page
Machine Learning For Absolute Beginners
Unifying Business, Data, and Code: Designing Data Products with JSON Schema

Book Deals (Affiliated) ?

eBook sale - Save up to 45% on eBooks!
Causal Machine Learning
Managing ML Projects
Causal Inference for Data Science
Data for All

Journals, Publications and Magazines

^ back to top ^

ICML - International Conference on Machine Learning
GECCO - The Genetic and Evolutionary Computation Conference (GECCO)
epjdatascience
Journal of Data Science - an international journal devoted to applications of statistical methods at large
Big Data Research
Journal of Big Data
Big Data & Society
Data Science Journal
datatau.com/news - Like Hacker News, but for data
Data Science Trello Board
Medium Data Science Topic - Data Science related publications on medium
Towards Data Science Genetic Algorithm Topic -Genetic Algorithm related Publications towards Data Science
all AI news - The AI/ML/Big Data news aggregator platform

뉴스 레터

^ back to top ^

AI Digest. A weekly newsletter to keep up to date with AI, machine learning, and data science. 보관소.
DataTalks.Club. A weekly newsletter about data-related things. 보관소.
The Analytics Engineering Roundup. A newsletter about data science. 보관소.

Bloggers

^ back to top ^

Wes McKinney - Wes McKinney Archives.
Matthew Russell - Mining The Social Web.
Greg Reda - Greg Reda Personal Blog
Kevin Davenport - Kevin Davenport Personal Blog
Julia Evans - Recurse Center alumna
Hakan Kardas - Personal Web Page
Sean J. Taylor - Personal Web Page
Drew Conway - Personal Web Page
Hilary Mason - Personal Web Page
Noah Iliinsky - Personal Blog
Matt Harrison - Personal Blog
Vamshi Ambati - AllThings Data Sciene
Prash Chan - Tech Blog on Master Data Management And Every Buzz Surrounding It
Clare Corthell - The Open Source Data Science Masters
Paul Miller Based in the UK and working globally, Cloud of Data's consultancy services help clients understand the implications of taking data and more to the Cloud.
Data Science London Data Science London is a non-profit organization dedicated to the free, open, dissemination of data science. We are the largest data science community in Europe. We are more than 3,190 data scientists and data geeks in our community.
Datawrangling by Peter Skomoroch. MACHINE LEARNING, DATA MINING, AND MORE
Quora Data Science - Data Science Questions and Answers from experts
Siah a PhD student at Berkeley
Louis Dorard a technology guy with a penchant for the web and for data, big and small
Machine Learning Mastery about helping professional programmers confidently apply machine learning algorithms to address complex problems.
Daniel Forsyth - Personal Blog
Data Science Weekly - Weekly News Blog
Revolution Analytics - Data Science Blog
R Bloggers - R Bloggers
The Practical Quant Big data
Yet Another Data Blog Yet Another Data Blog
Spenczar a data scientist at Twitch . I handle the whole data pipeline, from tracking to model-building to reporting.
KD Nuggets Data Mining, Analytics, Big Data, Data, Science not a blog a portal
Meta Brown - Personal Blog
Data Scientist is building the data scientist culture.
WhatSTheBigData is some of, all of, or much more than the above and this blog explores its impact on information technology, the business world, government agencies, and our lives.
Tevfik Kosar - Magnus Notitia
New Data Scientist How a Social Scientist Jumps into the World of Big Data
Harvard Data Science - Thoughts on Statistical Computing and Visualization
Data Science 101 - Learning To Be A Data Scientist
Kaggle Past Solutions
DataScientistJourney
NYC Taxi Visualization Blog
Learning Lover
Dataists
Data-Mania
Data-Magnum
P-value - Musings on data science, machine learning, and stats.
datascopeanalytics
Digital transformation
datascientistjourney
Data Mania Blog - The File Drawer - Chris Said's science blog
Emilio Ferrara's web page
DataNews
Reddit TextMining
Periscopic
Hilary Parker
Data Stories
Data Science Lab
Meaning of
Adventures in Data Land
DATA MINERS BLOG
Dataclysm
FlowingData - Visualization and Statistics
Calculated Risk
O'reilly Learning Blog
Dominodatalab
i am trask - A Machine Learning Craftsmanship Blog
Vademecum of Practical Data Science - Handbook and recipes for data-driven solutions of real-world problems
Dataconomy - A blog on the newly emerging data economy
Springboard - A blog with resources for data science learners
Analytics Vidhya - A full-fledged website about data science and analytics study material.
Occam's Razor - Focused on Web Analytics.
Data School - Data science tutorials for beginners!
Colah's Blog - Blog for understanding Neural Networks!
Sebastian's Blog - Blog for NLP and transfer learning!
Distill - Dedicated to clear explanations of machine learning!
Chris Albon's Website - Data Science and AI notes
Andrew Carr - Data Science with Esoteric programming languages
floydhub - Blog for Evolutionary Algorithms
Jingles - Review and extract key concepts from academic papers
nbshare - Data Science notebooks
Deep and Shallow - All things Deep and Shallow in Data Science
Loic Tetrel - Data science blog
Chip Huyen's Blog - ML Engineering, MLOps, and the use of ML in startups
Maria Khalusova - Data science blog
Aditi Rastogi - ML,DL,Data Science blog
Santiago Basulto - Data Science with Python
Akhil Soni - ML, DL and Data Science
Akhil Soni - ML, DL and Data Science

Presentations

^ back to top ^

How to Become a Data Scientist
Introduction to Data Science
Intro to Data Science for Enterprise Big Data
How to Interview a Data Scientist
How to Share Data with a Statistician
The Science of a Great Career in Data Science
What Does a Data Scientist Do?
Building Data Start-Ups: Fast, Big, and Focused
How to win data science competitions with Deep Learning
Full-Stack Data Scientist

팟 캐스트

^ back to top ^

AI at Home
AI Today
Adversarial Learning
Becoming a Data Scientist
Chai time Data Science
Data Crunch
Data Engineering Podcast
Data Science at Home
Data Science Mixer
Data Skeptic
Data Stories
Datacast
DataFramed
DataTalks.Club
Gradient Descent
Learning Machines 101
Let's Data (Brazil)
Linear Digressions
Not So Standard Deviations
O'Reilly Data Show Podcast
Partially Derivative
Superdatascience
The Data Engineering Show
The Radical AI Podcast
The Robot Brains Podcast
What's The Point
How AI Built This
The Analytics Engineering Podcast

YouTube Videos & Channels

^ back to top ^

What is machine learning?
Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning
Data36 - Data Science for Beginners by Tomi Mester
Deep Learning: Intelligence from Big Data
Interview with Google's AI and Deep Learning 'Godfather' Geoffrey Hinton
Introduction to Deep Learning with Python
What is machine learning, and how does it work?
Data School - Data Science Education
Neural Nets for Newbies by Melanie Warrick (May 2015)
Neural Networks video series by Hugo Larochelle
Google DeepMind co-founder Shane Legg - Machine Super Intelligence
Data Science Primer
Data Science with Genetic Algorithms
Data Science for Beginners
DataTalks.Club
Mildlyoverfitted - Tutorials on intermediate ML/DL topics
mlops.community - Interviews of industry experts about production ML
ML Street Talk - Unabashedly technical and non-commercial, so you will hear no annoying pitches.
Neural networks by 3Blue1Brown
Neural networks from scratch by Sentdex
Manning Publications YouTube channel
Ask Dr Chong: How to Lead in Data Science - Part 1
Ask Dr Chong: How to Lead in Data Science - Part 2
Ask Dr Chong: How to Lead in Data Science - Part 3
Ask Dr Chong: How to Lead in Data Science - Part 4
Ask Dr Chong: How to Lead in Data Science - Part 5
Ask Dr Chong: How to Lead in Data Science - Part 6
Regression Models: Applying simple Poisson regression
Deep Learning Architectures
Time Series Modelling and Analysis

Socialize

^ back to top ^

Below are some Social Media links. Connect with other data scientists!

Facebook Accounts
Twitter Accounts
Telegram Channels
Slack Communities
GitHub Groups
Data Science Competitions

Facebook Accounts

^ back to top ^

데이터
Big Data Scientist
Data Science Day
Data Science Academy
Facebook Data Science Page
Data Science London
Data Science Technology and Corporation
Data Science - Closed Group
Center for Data Science
Big data hadoop NOSQL Hive Hbase
Analytics, Data Mining, Predictive Modeling, Artificial Intelligence
Big Data Analytics using R
Big Data Analytics with R and Hadoop
Big Data Learnings
Big Data, Data Science, Data Mining & Statistics
BigData/Hadoop Expert
Data Mining / Machine Learning / AI
Data Mining/Big Data - Social Network Ana
Vademecum of Practical Data Science
Veri Bilimi Istanbul
The Data Science Blog

Twitter Accounts

^ back to top ^

지저귀다	설명
Big Data Combine	Rapid-fire, live tryouts for data scientists seeking to monetize their models as trading strategies
Big Data Mania	Data Viz Wiz, Data Journalist, Growth Hacker, Author of Data Science for Dummies (2015)
Big Data Science	Big Data, Data Science, Predictive Modeling, Business Analytics, Hadoop, Decision and Operations Research.
Charlie Greenbacker	Director of Data Science at @ExploreAltamira
Chris Said	Data scientist at Twitter
Clare Corthell	Dev, Design, Data Science @mattermark #hackerei
DADI Charles-Abner	#datascientist @Ekimetrics. , #machinelearning #dataviz #DynamicCharts #Hadoop #R #Python #NLP #Bitcoin #dataenthousiast
Data Science Central	Data Science Central is the industry's single resource for Big Data practitioners.
Data Science London	Data Science. Big Data. Data Hacks. Data Junkies. Data Startups. Open Data
Data Science Renee	Documenting my path from SQL Data Analyst pursuing an Engineering Master's Degree to Data Scientist
Data Science Report	Mission is to help guide & advance careers in Data Science & Analytics
Data Science Tips	Tips and Tricks for Data Scientists around the world! #datascience #bigdata
Data Vizzard	DataViz, Security, Military
DataScienceX
deeplearning4j
DJ Patil	White House Data Chief, VP @ RelateIQ.
Domino Data Lab
Drew Conway	Data nerd, hacker, student of conflict.
Emilio Ferrara	#Networks, #MachineLearning and #DataScience. I work on #Social Media. Postdoc at @IndianaUniv
Erin Bartolo	Running with #BigData--enjoying a love/hate relationship with its hype. @iSchoolSU #DataScience Program Mgr.
Greg Reda	Working @ GrubHub about data and pandas
Gregory Piatetsky	KDnuggets President, Analytics/Big Data/Data Mining/Data Science expert, KDD & SIGKDD co-founder, was Chief Scientist at 2 startups, part-time philosopher.
Hadley Wickham	Chief Scientist at RStudio, and an Adjunct Professor of Statistics at the University of Auckland, Stanford University, and Rice University.
Hakan Kardas	데이터 과학자
Hilary Mason	Data Scientist in Residence at @accel.
Jeff Hammerbacher	ReTweeting about data science
John Myles White	Scientist at Facebook and Julia developer. Author of Machine Learning for Hackers and Bandit Algorithms for Website Optimization. Tweets reflect my views only.
Juan Miguel Lavista	Principal Data Scientist @ Microsoft Data Science Team
Julia Evans	Hacker - Pandas - Data Analyze
Kenneth Cukier	The Economist's Data Editor and co-author of Big Data (http://www.big-data-book.com/).
Kevin Davenport	Organizer of https://www.meetup.com/San-Diego-Data-Science-R-Users-Group/
Kevin Markham	Data science instructor, and founder of Data School
Kim Rees	Interactive data visualization and tools. Data flaneur.
Kirk Borne	DataScientist, PhD Astrophysicist, Top #BigData Influencer.
Linda Regber	Data storyteller, visualizations.
Luis Rei	PhD Student. Programming, Mobile, Web. Artificial Intelligence, Intelligent Robotics Machine Learning, Data Mining, Natural Language Processing, Data Science.
Mark Stevenson	Data Analytics Recruitment Specialist at Salt (@SaltJobs) Analytics - Insight - Big Data - Data science
Matt Harrison	Opinions of full-stack Python guy, author, instructor, currently playing Data Scientist. Occasional fathering, husbanding, organic gardening.
Matthew Russell	Mining the Social Web.
Mert Nuhoğlu	Data Scientist at BizQualify, Developer
Monica Rogati	Data @ Jawbone. Turned data into stories & products at LinkedIn. Text mining, applied machine learning, recommender systems. Ex-gamer, ex-machine coder; namer.
Noah Iliinsky	Visualization & interaction designer. Practical cyclist. Author of vis books: https://www.oreilly.com/pub/au/4419
Paul Miller	Cloud Computing/ Big Data/ Open Data Analyst & Consultant. Writer, Speaker & Moderator. Gigaom Research Analyst.
Peter Skomoroch	Creating intelligent systems to automate tasks & improve decisions. Entrepreneur, ex-Principal Data Scientist @LinkedIn. Machine Learning, ProductRei, Networks
Prash Chan	Solution Architect @ IBM, Master Data Management, Data Quality & Data Governance Blogger. Data Science, Hadoop, Big Data & Cloud.
Quora Data Science	Quora's data science topic
R-Bloggers	Tweet blog posts from the R blogosphere, data science conferences, and (!) open jobs for data scientists.
Rand Hindi
Randy Olson	Computer scientist researching artificial intelligence. Data tinkerer. Community leader for @DataIsBeautiful. #OpenScience advocate.
Recep Erol	Data Science geek @ UALR
Ryan Orban	Data scientist, genetic origamist, hardware aficionado
Sean J. Taylor	Social Scientist. Hacker. Facebook Data Science Team. Keywords: Experiments, Causal Inference, Statistics, Machine Learning, Economics.
Silvia K. Spiva	#DataScience at Cisco
Harsh B. Gupta	Data Scientist at BBVA Compass
Spencer Nelson	Data nerd
Talha Oz	Enjoys ABM, SNA, DM, ML, NLP, HI, Python, Java. Top percentile Kaggler/data scientist
Tasos Skarlatidis	Complex Event Processing, Big Data, Artificial Intelligence and Machine Learning. Passionate about programming and open-source.
Terry Timko	InfoGov; Bigdata; Data as a Service; 데이터 과학; Open, Social & Business Data Convergence
Tony Baer	IT analyst with Ovum covering Big Data & data management with some systems engineering thrown in.
Tony Ojeda	Data Scientist , Author , Entrepreneur. Co-founder @DataCommunityDC. Founder @DistrictDataLab. #DataScience #BigData #DataDC
Vamshi Ambati	Data Science @ PayPal. #NLP, #machinelearning; PhD, Carnegie Mellon alumni (Blog: https://allthingsds.wordpress.com )
Wes McKinney	Pandas (Python Data Analysis library).
WileyEd	Senior Manager - @Seagate Big Data Analytics @McKinsey Alum #BigData + #Analytics Evangelist #Hadoop, #Cloud, #Digital, & #R Enthusiast
WNYC Data News Team	The data news crew at @WNYC. Practicing data-driven journalism, making it visual, and showing our work.
Alexey Grigorev	Data science author
İlker Arslan	Data science author. Shares mostly about Julia programming
불가피한	AI & Data Science Start-up Company based in England, UK

Telegram Channels

^ back to top ^

Open Data Science – First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former.
Loss function porn — Beautiful posts on DS/ML theme with video or graphic visualization.
Machinelearning – Daily ML news.

Slack Communities

맨 위

DataTalks.Club
Women Who Code - Data Science

GitHub Groups

Berkeley Institute for Data Science

Data Science Competitions

Some data mining competition platforms

Kaggle
DrivenData
Analytics Vidhya
InnoCentive
Microprediction

재미있는

Infographic
데이터 세트
지세도

Infographics

^ back to top ^

시사	설명
	Key differences of a data scientist vs. data engineer
	A visual guide to Becoming a Data Scientist in 8 Steps by DataCamp (img)
	Mindmap on required skills (img)
	Swami Chandrasekaran made a Curriculum via Metro map.
	by @kzawadz via twitter
	By Data Science Central
	Data Science Wars: R vs Python
	How to select statistical or machine learning techniques
	Choosing the Right Estimator
	The Data Science Industry: Who Does What
	데이터 과학 ~~Venn~~ Euler Diagram
	Different Data Science Skills and Roles from this article by Springboard
	A simple and friendly way of teaching your non-data scientist/non-statistician colleagues how to avoid mistakes with data. From Geckoboard's Data Literacy Lessons.

데이터 세트

^ back to top ^

Academic Torrents
ADS-B Exchange - Specific datasets for aircraft and Automatic Dependent Surveillance-Broadcast (ADS-B) sources.
hadoopilluminated.com
data.gov - The home of the US Government's open data
United States Census Bureau
usgovxml.com
enigma.com - Navigate the world of public data - Quickly search and analyze billions of public records published by governments, companies and organizations.
datahub.io
aws.amazon.com/datasets
datacite.org
The official portal for European data
NASDAQ:DATA - Nasdaq Data Link A premier source for financial, economic and alternative datasets.
figshare.com
GeoLite Legacy Downloadable Databases
Quora's Big Datasets Answer
Public Big Data Sets
Kaggle Datasets
A Deep Catalog of Human Genetic Variation
A community-curated database of well-known people, places, and things
Google Public Data
World Bank Data
NYC Taxi data
Open Data Philly Connecting people with data for Philadelphia
grouplens.org Sample movie (with ratings), book and wiki datasets
UC Irvine Machine Learning Repository - contains data sets good for machine learning
research-quality data sets by Hilary Mason
National Centers for Environmental Information
ClimateData.us (related: US Climate Resilience Toolkit)
r/datasets
MapLight - provides a variety of data free of charge for uses that are freely available to the general public. Click on a data set below to learn more
GHDx - Institute for Health Metrics and Evaluation - a catalog of health and demographic datasets from around the world and including IHME results
St. Louis Federal Reserve Economic Data - FRED
New Zealand Institute of Economic Research – Data1850
Open Data Sources
UNICEF Data
undata
NASA SocioEconomic Data and Applications Center - SEDAC
The GDELT Project
Sweden, Statistics
StackExchange Data Explorer - an open source tool for running arbitrary queries against public data from the Stack Exchange network.
SocialGrep - a collection of open Reddit datasets.
San Fransisco Government Open Data
IBM Asset Dataset
Open data Index
Public Git Archive
GHTorrent
Microsoft Research Open Data
Open Government Data Platform India
Google Dataset Search (beta)
NAYN.CO Turkish News with categories
코로나 19
Covid-19 Google
Enron Email Dataset
5000 Images of Clothes
IBB Open Portal
The Humanitarian Data Exchange

지세도

^ back to top ^

Comic compilation
Cartoons
Data Science Cartoons
Data Science: The XKCD Edition

Other Awesome Lists

Other amazingly awesome lists can be found in the awesome-awesomeness
Awesome Machine Learning
기울기
awesome-dataviz
awesome-python
Data Science IPython Notebooks.
awesome-r
awesome-datasets
awesome-Machine Learning & Deep Learning Tutorials
Awesome Data Science Ideas
Machine Learning for Software Engineers
Community Curated Data Science Resources
Awesome Machine Learning On Source Code
Awesome Community Detection
Awesome Graph Classification
Awesome Decision Tree Papers
Awesome Fraud Detection Papers
Awesome Gradient Boosting Papers
Awesome Computer Vision Models
Awesome Monte Carlo Tree Search
Glossary of common statistics and ML terms
100 NLP Papers
Awesome Game Datasets
Data Science Interviews Questions
Awesome Explainable Graph Reasoning
Top Data Science Interview Questions
Awesome Drug Synergy, Interaction and Polypharmacy Prediction
Deep Learning Interview Questions
Top Future Trends in Data Science in 2023
How Generative AI Is Changing Creative Work
What is generative AI?
Top 100+ Machine Learning Interview Questions (Beginner to Advanced)

취미

Awesome Music Production

확장하다

awesome datascience

멋진 데이터 과학

스폰서

목차

데이터 과학이란 무엇입니까?

어디서부터 시작합니까?

실제 세계

재해

훈련 자원

튜토리얼

무료 코스

Mooc 's

집중 프로그램

대학

데이터 과학 도구 상자

알고리즘

세 종류의 기계 학습 시스템

비교

감독 학습

감독되지 않은 학습

반 감독 학습

강화 학습

데이터 마이닝 알고리즘

딥 러닝 아키텍처

일반 기계 학습 패키지

딥 러닝 패키지

Pytorch 생태계

텐서 플로우 생태계

케라 생태계

시각화 도구

기타 도구

문학과 미디어

서적

Book Deals (Affiliated) ?

Journals, Publications and Magazines

뉴스 레터

Bloggers

Presentations

팟 캐스트

YouTube Videos & Channels

Socialize

Facebook Accounts

Twitter Accounts

Telegram Channels

Slack Communities

GitHub Groups

Data Science Competitions

재미있는

Infographics

데이터 세트

지세도

Other Awesome Lists

취미