suyanado
'특징공학' 태그의 글 목록

특징공학

정보보안/인공지능 보안을 배우다

[인공지능 보안을 배우다] 8장 PJ_1 악성코드 탐지모델 (특징 분석2)

이전 포스트에서 이어진다Featrue Engineering 첫 번째 코드 이전과 같은 오류다 pe_all = pe_all.drop(['filename', 'MD5', 'packer_type'], axis=1) 로 수정한다. Featrue Engineering세 번째 코드do_randomforest 함수에서 self.y_train이 2D 배열일경우 경고가 뜬다.  fit() 메서드에 전달되기 전에 y_train을 1D 배열로 변환해야 한다. scikit-learn의 fit() 메서드는 1D 배열을 사용하므로, y_train을 ravel()을 사용해 1D 배열로 변환 해 준다. model.py의  랜던포레스트 메서드를 수정한다. 띄어쓰기에 주의한다. clf = RandomForestClassif..

정보보안/인공지능 보안을 배우다

[인공지능 보안을 배우다] 8장 PJ_1 악성코드 탐지모델 (특징 추출1)

특징 추출데이터라벨링까지 마쳤다면 이제 각 데이터의 특징 추출을 한다. 특징이란 각 데이터가 가지는 다른 데이터와 구별되는 요소로서, 이를 통해 악성코드 또는 정상프로그램의 차이점을 파악하여 모델이 학습하도록 한다.예) 악성코드의 경우 특정한 라이브러리를 import 한다 , 이런 기능을 사용한다 등 이 책에서 말하는 특징추출 방법은 세 가지가 있다.첫번째는 pe헤더 이다.pe헤더에는 방금 말했던 것처럼 어떤 라이브러리를 import하는지에 대한 정보가 담겨있다.이를 통해 프로그램이 사용하는 기능이 무엇인지 추측할 수 있다.ClaMP라는 오픈소스를 사용하여 특징추출을 하고 csv파일을 생성해 본다. 책에서 제공하는 실습자료인 pe_hearders.py를 사용하면 된다.오픈소스인 CLamP에서 제공하는데,..

상단으로