AI를 사용한 사이버 보안의 위협 탐지
개요
"AI를 사용한 사이버 보안의 위협 감지"프로젝트는 기계 학습 알고리즘을 사용하여 위협 감지 시스템을 개발하는 것을 목표로합니다. 이 프로젝트는 여러 단계로 구성되며 각 단계는 사이버 보안을 향상시키는 전반적인 목표에 기여합니다. 다음은 각 단계에 대한 개요입니다.
1 단계 : 데이터 전처리 (Preprocessing.ipynb)
- 이 단계에는 기계 학습을위한 데이터 세트를 준비하기위한 데이터 전처리가 포함됩니다.
- 사용 된 데이터 세트는 CIC-IDS2017 데이터 세트이며 프로그램과 동일한 디렉토리에 위치한 "CSVS"폴더에 저장해야합니다.
- 여기에서 데이터 세트 파일에 액세스 할 수 있습니다.
2 단계 : 공격 데이터 필터링 (AttackDivision.ipynb)
- 이 단계 에서이 프로그램은 "all_data.csv"파일을 사용하여 공격 별 파일을 만듭니다.
- 이러한 공격 파일은 추가 분석을 위해 "./attacks/"디렉토리에 저장됩니다.
- 데이터 세트에는 총 12 개의 공격 유형이 포함되어 있으며이 단계는 개별 검사를 위해이를 분리합니다.
3 단계 : 기능 선택 및 머신 러닝 (featiation 선택 .ipynb)
- 이 단계는 2 단계에서 생성 된 공격 파일의 기능 선택에 중점을 둡니다.
- 이 프로그램은 각 파일에 대해 가장 가중치가 가장 높은 4 가지 기능을 식별합니다.
- 이 선택된 기능은 기계 학습 알고리즘의 입력으로 사용됩니다.
4 단계 : 머신 러닝 알고리즘 평가 (MachinElearningsep.ipynb)
- 마지막 단계는 강력한 평가를 위해 각 공격 파일에 7 개의 기계 학습 알고리즘을 여러 번 적용합니다.
- 이러한 작업의 결과는 화면에 표시되어 "./attacks/results_1.csv"파일에 저장됩니다.
- 또한 결과를 나타내는 박스 및 수염 그래픽이 생성됩니다.
- 그래픽과 결과는 "./attacks/result_graph_1/"폴더에 저장됩니다.
데이터 세트 소스
CIC-IDS2017 데이터 세트에 액세스 할 수 있습니다.