Description
발표자 : 김정주 발표자료 : https://speakerdeck.com/haje01/gigyehagseubeul-hwalyonghan-geim-eobyujing-geomcul
발표내용 :
https://www.pycon.kr/2016apac/program/8
- 통계와 탐색적 데이터 분석의 중요성
- 데이터 분석 툴과 기계학습에 대한 간단한 소개
- 간단한 통계적 아이디어로 스패밍(Spamming) 탐지
- 윈도우 서버에서 로그 수집하기
- AWS EMR로 하둡 사용하기
- 하둡에 맞게 파일 전처리하기
- mrjob으로 파이썬으로 하둡 MR 코딩하기
- scikit-learn의 알고리즘(Decision Tree, Random Forest)을 사용하여 파밍(Farming) 캐릭터 탐지
- 앞으로의 전망