고등학교 인공지능 수학 수업계획 2 (감성사전 업그레이드)
지난 수업자료1(https://namgungyeon.tistory.com/10) 이어
만든 감정분석기의 감성사전을 업그레이드해보자.
[참고자료1] KNU 함국어 감성사전 http://dilab.kunsan.ac.kr/knu/knu.htm
딥러닝을 이용해, 표준국어대사전을 구성하는 각 단어의 뜻풀이를 분석하여 긍부정어를 추출하였다고 한다.
[참고자료2] Kaggle Data set https://www.kaggle.com/rtatman/sentiment-lexicons-for-81-languages
다운로드 버튼을 누르면 (로그인 필요) 파일을 받을 수 있고 받은 압축파일 안에 여러가지 언어의 긍정부정 단어 데이터가 들어 있는데
뒤에 txt 파일 중 nagative_words_ko.txt (한국어 부정단어) , positive_words_ko.txt (한국어 긍정단어) 를 열고 Ctrl+a 를 누르고 Ctrl+c 를 눌러 전체를 클립보드에 복사하면 한 번에 많은 감성사전 Data를 완성할 수 있다.
캐글(kaggle) 은 많은 데이터 전문가가 사용하고 있는 플랫폼이다. 간단하기는 하지만 인공지능 분야에 관심있는 학생들에게 캐글에서 이런 Data 를 받아 활용할 수 있음 정도는 알려 주는 것이 좋다고 생각한다.
댓글
댓글 쓰기