Security_Analysis

진단 Tool 제작_1 (데이터 분할) 본문

현업/[dev]_Python

진단 Tool 제작_1 (데이터 분할)

Positivie 2024. 6. 26. 16:55
728x90
반응형

 

주요정보통신기반시설, 전자금융기반시설, ISMS 등 ... 각 취약점 진단에 항목이 존재한다. 

 

스크립트를 수행하면 그 항목의 1번부터 마지막번호까지 합쳐져서 하나의 텍스트파일로 떨어진다.

 

물론 이 텍스트 파일을 열어서 특정 값을 기준으로 데이터를 추출할 수도 있지만, 

사내 스크립트에는 Reference 기능이 있다. 

내가 사용하고 검색한 파일에 대해서 내용을 긁어오는 것이다. 

 

그러다보니, 불필요한 정보들이 너무 많아서 파일의 크기가 큰 경우에는 100MB를 넘어가기도 한다. 

이런 파일들을 Open 하고 Readline 으로 한줄씩 읽어버리면 너무나도 많은 시간이 소요되기 때문에


하나의 스크립트 결과를 항목 코드별로 분할했다.

U-01.txt
U-02.txt
U-03.txt
U-04.txt
U-45.txt
U-46.txt

 

즉, 주요정보통신기반시설 Unix 기준으로 하나의 스크립트 결과에 [U-01] ~ [U-72] 까지 포함되어 있는 내용을 위와 같이 분할하여

 

총 1개의 파일이 72개로 분할되었다.

 

이 파일들을 기반으로, OS종류별, 서비스별, 버전별 등으로 환경을 계속 구축하여 결과를 얻고 파일을 분할하였더니 

약 150개 정도의 서버 결과를 얻을 수 있었다. 

 

이 데이터를 가지고, 데이터 프레임화(수집) 단계를 진행해볼까 한다. 

728x90
반응형