7월, 2021의 게시물 표시

고등학교 인공지능 수학 수업자료 5 (영화별 유사도 분석, 콘텐츠 기반 필터링)

이미지
지난 시간 유사도 분석기 자료를 수정하여 사용자를 기반으로 분류하는 것이 아니라 영화를 기반으로 유사도를 재 분류해보자. 개인별 영화선호도를 성분으로하는 데이터의 행렬을 전환하면 영화를 초점으로 한 데이터를 얻을 수 있다. 이제 역으로 타이타닉은 성분이 (5,5,4,4,2,5,3,4,5,....) 인 데이터(벡터) 로 표현된다. 지난 수업과 마찬가지로 영화명을 1행과 1열로 하는 표를 만들어 영화별 유사도를 분석할 수 있다. 타이타닉과 극한직업이 가장 높은 유사도를 보인다 연수때 예시로 들 간단한 시연 용이었기에 영화를 13개만 선정했지만, 실제에서는 더 많은 항목에 대한 설문을 해서 자료를 모은다면 더 정교하게 유사도를 얻을 수 있을 것이다. 지난 시간에 다룬 사용자 기반의 유사도 분류는 과거 정보가 적은 사용자에 대해서 추천의 정확도가 떨어진다는 단점이 있는데 이렇게 콘텐츠를 기반으로 유사도를 분류하면 이런 점을 보완할 수 있다. 학기 초 다양한 학급의 학생, 혹은 온라인 쌍방향 수업을 한다면 다양한 학교의 학생들이 섞여서 수업을 듣게 될텐데 서로 다양한 주제에 대해 서로의 선호도를 조사하고 분류하게 된다면 나름 분위기 조성에도 도움이 될 만한 좋은 주제라고 생각한다. 다만 연수를 진행하며 발견한 문제는 보지 않은 영화를 0점으로 선택하게는 바람에 불필요하게 생기는 유사도의 차이다. 만약 내가 곡성을 안봤다고 0점이 선택되고 다른 사람이 곡성을 재밌게 봐서 5점을 선택했다면 둘을 유사도 계산에 넣기 보다는 무시하는 쪽이 더 좋겠다는 생각이 들었다. 이건 실제로 수업을 진행해 보며 코드를 수정해 봐야겠다.

고등학교 인공지능 수학 수업자료 4 (유사도 계산기, 선호도 분석 알고리즘)

이미지
  앞서 설명한 코사인 유사도를 기반으로해서 실제로 학생들 개인의 선호도를 분석해보는 수업을 계획했다. 학생들이 유튜브, 넷플릭스 등의 사이트 이용에 익숙하기에 학생들이 흥미도 가질 수 있고 인공지능 알고리즘의 수학적인 원리를 실제로 탐구해 볼 수 있는 아주 좋은 주제다.  인공지능 수학 교과서에 나와있는 강아지나 고양이의 유사도를 계산하는 단순 계산 문제만 풀고 넘어가기에는 너무 아쉬운 단원이다. 넷플릭스는 내가 그동안 추천한 아니면 비추천한 영상을 기반으로 선호도를 분석한다. 쿠팡에서는 내가 최근에 찾아본 제품과 유사도가 높은 제품들을 광고한다. 근데 코사인 유사도를 가지고 이런 개인 선호도를 분석하고 분류하는 실습 수업을 진행하기는 어렵다. 왜냐면 자료의 성분이 많아질 수록 코사인 유사도를 계산하는데에는 많은 시간이 걸리기 때문이다. 어려운것은 아니고 단지 계산해야 할 것이 너무 많고 숫자도 너무 커진다. 그래서 내가 찾아 본 모든 인공지능 수학 교과서에는 손으로 계산해 볼 수 있는 아래 정도의 문제만을 다루고 있다. 미래엔, 고등학교 인공지능수학 (황선욱 외 4인) 69페이지 이런 단순 계산 문제만 풀고 넘어간다면 학생들이 인공지능 수학이라는 교과에 전혀 흥미를 느끼지 못할 것이며 이런 수업 과정에서는 교사가 학생들을 평가할 거리가 전무하기에 세특에 녹일 수 있는 내용을 찾기 어려울 것이다. 그래서 이런 한계를 넘기 위해서는 인공지능 수학 과목은 공학도구의 적절한 사용이 필요하다고 생각한다. 일단 블록코딩으로 구현할까 생각했었는데 일단, 스프레드 시트(엑셀) 프로그램으로 간단히 코사인 유사도 계산기를 만들었다. (차) 공학적 도구를 활용한 수업을 운영할 때에는 다음 사항에 유의한다. ①  공학적 도구를 활용하여 인공지능 기술을 직접 시연해 볼 수 있는 환경을 제공함으로써 인공지능에 활용되는 수학을 경험할 수 있는 기회를 제공 한다. ②공학적 도구로 PC나 모바일 기기를 활용할 수 있으며, 설치형 또는 웹 기반의 소프트웨어를 사용하여 텍스트코딩을 다룰 수

고등학교 인공지능 수학 수업자료 3 (유사도 란?)

이미지
  고등학교 인공지능 수학수업자료3 단원II 텍스트 자료의 표현과 분류 - 텍스트 자료의 분류 이 단원은 인공지능을 이용하여 텍스트를 분류하는 수학적 방법을 이해함을 학습목표로 하고 있다. 벡터화한 두 개의 데이터(단어 또는 문장 또는 기타 자료 등) 의 유사한 정도를 수치화한 것을  유사도  라고 하는데 고등학교 인공지능 수학 교과에서는 보통  유클리드 거리, 코사인 유사도, 자카드 유사도  정도 를 다루고 있다. 교과서별 차이가 있는데 예를들어 미래엔 교과서의 경우 이 세 유사도를 모두 다루고 있으나, 천재교과서의 경우 유클리드 거리만 다룬다. 다루는 개념이 적다고 천재교과서가 안 좋다는 것은 아니다. 아마 인공지능 수학이 고등학교 1학년 수학 만 다루고 배울 수 있는 교과이기에 교과서를 집필하는 교수님과 선생님들도 어디까지 내용을 다룰지에 대한 고민이 있었 것이라 생각하다. 유클리드 거리란? 3 차원 이하 사이의 공간에서는 직관적으로 두점사이의 거리로 정의된다. 2차원 공간에서의 유클리드 거리 이를 성분이 n개인 데이터(벡터) 로 확장하면 아래와 같이 정의할 수 있다. 유클리드 거리가 0에 가까울 수록 유사도가 높다고 말할 수 있으며 개념이 직관적이기에 고1 수학을 이수한 학생들에게 설명하기에 큰 무리는 없다. 코사인 유사도란? 예를들어 다음 세 문서에서 (강원도, 양양, 속초) 가 언급된 수를 셈하여 수치화(벡터화) 한다고 하자. 문서1 = 강원도 양양에 한 수학교사 문서2 = 강원도 양양의 수학교사 남궁연, 그는 강원도 양양을 사랑한다. 문서3 = 남궁연은 속초에서 처음 근무를 시작했다. 이를 수치화하면  문서1 = (1,1,0) , 문서2 = (3,3,0),   문서3= (0,0,1)  이다. 문서1과 문서3의 유클리드 거리가 적다고 해서 문서1과 문서3이 문서1과 문서2 보다 더 유사하다고 말하기에는 무리가 있다. 이렇듯 수치화 한 데이터에 따라 사용하기에 적절한 유사도는 다르고, 코사인 유사도는 벡터 의 크기가 아닌 벡터의 방향으로 두 자료의 유

고등학교 인공지능 수학 수업계획 2 (감성사전 업그레이드)

이미지
지난 수업자료1( https://namgungyeon.tistory.com/10 )  이어 만든 감정분석기의 감성사전을 업그레이드해보자. 감정분석기 파일 사용예 [참고자료1] KNU 함국어 감성사전  http://dilab.kunsan.ac.kr/knu/knu.htm 딥러닝을 이용해, 표준국어대사전을 구성하는 각 단어의 뜻풀이를 분석하여 긍부정어를 추출하였다고 한다. KNU 한국어 감성사전 dilab.kunsan.ac.kr [참고자료2] Kaggle Data set  https://www.kaggle.com/rtatman/sentiment-lexicons-for-81-languages Sentiment Lexicons for 81 Languages Sentiment Polarity Lexicons (Positive vs. Negative) www.kaggle.com 다운로드 버튼을 누르면 (로그인 필요) 파일을 받을 수 있고 받은 압축파일 안에 여러가지 언어의 긍정부정 단어 데이터가 들어 있는데 뒤에_ko 붙은 txt 파일을 찾자 뒤에 txt 파일 중 nagative_words_ko.txt (한국어 부정단어) , positive_words_ko.txt (한국어 긍정단어) 를 열고 Ctrl+a 를 누르고 Ctrl+c 를 눌러 전체를 클립보드에 복사하면 한 번에 많은 감성사전 Data를 완성할 수 있다.  캐글(kaggle) 은 많은 데이터 전문가가 사용하고 있는 플랫폼이다. 간단하기는 하지만 인공지능 분야에 관심있는 학생들에게 캐글에서 이런 Data 를 받아 활용할 수 있음 정도는 알려 주는 것이 좋다고 생각한다.

고등학교 인공지능 수학 수업계획 1 (감정분석기 만들기)

이미지
 2021. 7. 23 강원교육청 인공지능 수학 교과 직무연수 강의 자료 강의ppt( https://drive.google.com/file/d/1sVlzCUQirPu6xR1zN1TR7aI0PMaz2K2D/view?usp=sharing ) 2021학년도 2학기 부터 새롭게 도입되는 인공지능 수학 교과에 내용이 매력적인 부분이 많은데 처음이다 보니 어떻게 수업해야 할지 고민이 되는 부분이 있을 것 입니다. 교과서를 자칫하면 단순 계산 위주의 수업이 되기 쉽습니다. 그래서 저도 인공지능 분야에 지식이 적고 부족지만만 선생님들이 실제로 수업하기에 도움이 될 만한 수업 계획 및 자료를 올려볼 계획입니다.  텍스트 분류 및 처리  단원의 강의를 맡았었기에 이 단원에 대한 수업계획을 먼저 준비해 보았습니다. 1. 내용체계 영역 / 핵심 개념 일반화된 지식 내용 요소 ※  관련 학 습 요소 분류와 예측 인공지능을 이용하면 자료를 정리 ,  분석하고 패턴을 찾아 새로운 대상에 대한 분류와 예측을 할 수 있으며 ,  이때 확률과 함수 등이 활용된다 . ∙ 자료의 분류 ∙ 경향성과 예측 ∙ 유사도 ∙ 추세선 ∙ 조건부확률 2. 성취기준 „ [12 인수 03-01] 인공지능을 이용하여 텍스트를 분류하는  수학적 방법을 이해한다 . 3. 교수 학습 방법 및 유의 사항 „ 텍스트 판별에서는  영화 리뷰 분류 ,  기사 분류  등을 다룰 수 있고 ,  글 자료 사이의  유사도를   계산  하고  텍스트를 판별하여 분류하는  수학적 과정을  이해  하게  한다 . 위의 교수 학습 방법 및 유의 사항을 읽어보면 [ 영화 리뷰 분류 ,  기사 분류  등을 통해.. 텍스트를 판별하는  수학적 과정 을 이해하게 한다 ] 라고 나와 있는데 사실 실제 영화 리뷰나 기사를 가지고 이를 분류해 보는 수업을 진행하기는 어렵다. 실제 영화리뷰나 기사는 자연어인데 이를 벡터화 하는 것은 어렵기 때문이다. 그래서 교과서에서는 대부분 아래와 같은 간단한 예시 문제를 제시할 수 밖에 없다. 천재교육(홍진곤) 인공

중등 수학공학도구 평가 활용 직무연수 강의안(2021.7.22)

이미지
강의안1 (기존) https://drive.google.com/file/d/1N5ltE2OsA_q0Ewt-9Pz5hXTbXvVAV-Dc/view?usp=sharing 강의안2 (추가) https://drive.google.com/file/d/1oHRC1HnLNDA-109qje9TN15xzTNRgz_q/view?usp=sharing 2021. 7. 22 중등 수학공학도구 평가 활용 직무연수, 양양고 교사 남궁연 중 고등학교 수업에서 활용 가능한 수학공학도구는 현재 굉장히 다양합니다. 저는 알지오매스 개발 과정부터 조금 참여했기에 알지오매스를 주제로한 연수를 주로 했는데 연수를 하다보면 왜 다른 좋은 도구들이 있는데 이런 것을 굳이 다른것 도 배워야 하는지 묻는 분들이 많이 계십니다. 그래서 이번 연수의 목표는 어떤 상황에서 어떤 도구를 사용하기에 적절한 지 각각의 도구가 어떤 장점이 있는지 소개하는 것을 목표로 삼아 보았습니다. 2015 수학과 교육과정에서는 정보처리 역량과 창의 융합 역량 을 강조하고 있습니다. 이런 역량과 관련된 수업과정과 평가를 구성 하는데 선생님들께 조금이나마 도움이 되길 바랍니다. 주제1. 중학교 도형 그래프 그리기 다음 세 도형을 그리며  알지오매스의 기본 도구 를 익혀 봅시다. 가. 도형1 나. 도형2 * 아래 도형과 같은 부분은 어떻게 색칠 하면 좋을 까요? ^^ 다. 도형3 *아래 문제를 각도가 60도인 경우로 바꿔서 그리려면 어떻게 해야 할까요?  개인적으로 위와 같은 대부분의 간단한 도형들 그리고 시험출제를 위한 그래프는 알지오매스를 사용해서 그리는 편입니다. 왜냐면 알지오매스의 단축키 , 꾸미기 기능 그리고 캡쳐기능을 사용하면 다른 공학도구에 비해  굉장히 빠르게 작업할 수 있기 때문  입니다. 그러나 계산이 복잡한 자료를 만들때 알지오매스로 구현하기에 한계가 있을 때가 있고, 그런 경우에는  지오지브라(GEOGEBRA) 를 사용합니다. 공학도구 별 장단점이 있습니다. 예 : 알지오매스로 만들다 뚜껑열려 지오지브라로 만든