2021의 게시물 표시

공학도구로 시험문제 도형 그림 그리기1

이미지
  공학도구로 시험문제 도형 그림 그리기 시리즈를 한 5개 정도 포스팅하려고 합니다. 지오지브라, 알지오매스 같은 공학도구의 기본 기능은 그렇게 어렵지 않은데 생각보다 많은 수학 선생님들이 이런 도구의 사용을 어려워하셔서 시험문제가 그림에 종속되어 버리는 문제도 생기는데, 앞으로 포스팅하는 도형 그림만 연습해 보시면 충분히 도움이 되리라 생각합니다. 그림1 - 난이도 하 도형을 그릴 때 먼저 어떤 대상이 어디에 종속되어 있는 대상 인지 생각해 보면 좋습니다. 예를들어 위 그림1에서 점 C' 은 점 C에 종속되어 있습니다. (점 C 를 선분 BE에 선대칭한 점)  1. 점 A,B,C,D,E 를 대수창에 입력 2. 선분 도구를 이용하여 선분들을 연결 선분 도구의 단축키는 S 다 자주쓰니 외우면 편하다 선분 색상은 나중에 일괄 수정하니 일단 신경안써도 됨 3. 선대칭 도구를 이용하여 C' 작도 모든 도구는 선택 시, 상단에 도움말이 잠시 표시된다 4. 점 이름 변경  단축키 (Esc) Esc 를 눌러 선택 도구를 활성화 한 후 대상을 클릭하면 설정 팝업 메뉴가 나오는데, 아래 그림과 같이 C' 을 입력한다. 이 때, LaTeX(레이텍) 체크박스를 체크하면 자동으로 세리프 serif 체  로 변한다.  나머지 점들도 마찬가지 방법으로 세리프체로 변환한다. 5. 삼각형 그리기 다각형도구 단축키(P) 6. 좌표축 및 모눈 안보이게 설정 기하창 우상단의 환경설정을 클릭하면 그리드 보기 설정을 변경할수 있다. 7. 선분의 길이 표시하기 알지오매스에서 편리한 기능 중 하나이다.  지오지브라를 사용할 때는 선분의 길이 설명선을 그리는 작업이 조금 귀찮았는데 알지오매스는 기본 기능으로 제공하고 있어 편하다.  단축키는 E (explain 의 이니셜)이다. 이제 설명선의 문자 x 를 클릭해서 원하는 텍스트로 바꾸면 된다. 이 것 역시  LaTex(레이텍) 을 클릭하여 세리프체로 표현하는 것이 더 보기 좋다 . 세리프체와 일반체 비교  그냥 3cm 로 입력해도

고등학교 인공지능 수학 수업자료 5 (영화별 유사도 분석, 콘텐츠 기반 필터링)

이미지
지난 시간 유사도 분석기 자료를 수정하여 사용자를 기반으로 분류하는 것이 아니라 영화를 기반으로 유사도를 재 분류해보자. 개인별 영화선호도를 성분으로하는 데이터의 행렬을 전환하면 영화를 초점으로 한 데이터를 얻을 수 있다. 이제 역으로 타이타닉은 성분이 (5,5,4,4,2,5,3,4,5,....) 인 데이터(벡터) 로 표현된다. 지난 수업과 마찬가지로 영화명을 1행과 1열로 하는 표를 만들어 영화별 유사도를 분석할 수 있다. 타이타닉과 극한직업이 가장 높은 유사도를 보인다 연수때 예시로 들 간단한 시연 용이었기에 영화를 13개만 선정했지만, 실제에서는 더 많은 항목에 대한 설문을 해서 자료를 모은다면 더 정교하게 유사도를 얻을 수 있을 것이다. 지난 시간에 다룬 사용자 기반의 유사도 분류는 과거 정보가 적은 사용자에 대해서 추천의 정확도가 떨어진다는 단점이 있는데 이렇게 콘텐츠를 기반으로 유사도를 분류하면 이런 점을 보완할 수 있다. 학기 초 다양한 학급의 학생, 혹은 온라인 쌍방향 수업을 한다면 다양한 학교의 학생들이 섞여서 수업을 듣게 될텐데 서로 다양한 주제에 대해 서로의 선호도를 조사하고 분류하게 된다면 나름 분위기 조성에도 도움이 될 만한 좋은 주제라고 생각한다. 다만 연수를 진행하며 발견한 문제는 보지 않은 영화를 0점으로 선택하게는 바람에 불필요하게 생기는 유사도의 차이다. 만약 내가 곡성을 안봤다고 0점이 선택되고 다른 사람이 곡성을 재밌게 봐서 5점을 선택했다면 둘을 유사도 계산에 넣기 보다는 무시하는 쪽이 더 좋겠다는 생각이 들었다. 이건 실제로 수업을 진행해 보며 코드를 수정해 봐야겠다.

고등학교 인공지능 수학 수업자료 4 (유사도 계산기, 선호도 분석 알고리즘)

이미지
  앞서 설명한 코사인 유사도를 기반으로해서 실제로 학생들 개인의 선호도를 분석해보는 수업을 계획했다. 학생들이 유튜브, 넷플릭스 등의 사이트 이용에 익숙하기에 학생들이 흥미도 가질 수 있고 인공지능 알고리즘의 수학적인 원리를 실제로 탐구해 볼 수 있는 아주 좋은 주제다.  인공지능 수학 교과서에 나와있는 강아지나 고양이의 유사도를 계산하는 단순 계산 문제만 풀고 넘어가기에는 너무 아쉬운 단원이다. 넷플릭스는 내가 그동안 추천한 아니면 비추천한 영상을 기반으로 선호도를 분석한다. 쿠팡에서는 내가 최근에 찾아본 제품과 유사도가 높은 제품들을 광고한다. 근데 코사인 유사도를 가지고 이런 개인 선호도를 분석하고 분류하는 실습 수업을 진행하기는 어렵다. 왜냐면 자료의 성분이 많아질 수록 코사인 유사도를 계산하는데에는 많은 시간이 걸리기 때문이다. 어려운것은 아니고 단지 계산해야 할 것이 너무 많고 숫자도 너무 커진다. 그래서 내가 찾아 본 모든 인공지능 수학 교과서에는 손으로 계산해 볼 수 있는 아래 정도의 문제만을 다루고 있다. 미래엔, 고등학교 인공지능수학 (황선욱 외 4인) 69페이지 이런 단순 계산 문제만 풀고 넘어간다면 학생들이 인공지능 수학이라는 교과에 전혀 흥미를 느끼지 못할 것이며 이런 수업 과정에서는 교사가 학생들을 평가할 거리가 전무하기에 세특에 녹일 수 있는 내용을 찾기 어려울 것이다. 그래서 이런 한계를 넘기 위해서는 인공지능 수학 과목은 공학도구의 적절한 사용이 필요하다고 생각한다. 일단 블록코딩으로 구현할까 생각했었는데 일단, 스프레드 시트(엑셀) 프로그램으로 간단히 코사인 유사도 계산기를 만들었다. (차) 공학적 도구를 활용한 수업을 운영할 때에는 다음 사항에 유의한다. ①  공학적 도구를 활용하여 인공지능 기술을 직접 시연해 볼 수 있는 환경을 제공함으로써 인공지능에 활용되는 수학을 경험할 수 있는 기회를 제공 한다. ②공학적 도구로 PC나 모바일 기기를 활용할 수 있으며, 설치형 또는 웹 기반의 소프트웨어를 사용하여 텍스트코딩을 다룰 수

고등학교 인공지능 수학 수업자료 3 (유사도 란?)

이미지
  고등학교 인공지능 수학수업자료3 단원II 텍스트 자료의 표현과 분류 - 텍스트 자료의 분류 이 단원은 인공지능을 이용하여 텍스트를 분류하는 수학적 방법을 이해함을 학습목표로 하고 있다. 벡터화한 두 개의 데이터(단어 또는 문장 또는 기타 자료 등) 의 유사한 정도를 수치화한 것을  유사도  라고 하는데 고등학교 인공지능 수학 교과에서는 보통  유클리드 거리, 코사인 유사도, 자카드 유사도  정도 를 다루고 있다. 교과서별 차이가 있는데 예를들어 미래엔 교과서의 경우 이 세 유사도를 모두 다루고 있으나, 천재교과서의 경우 유클리드 거리만 다룬다. 다루는 개념이 적다고 천재교과서가 안 좋다는 것은 아니다. 아마 인공지능 수학이 고등학교 1학년 수학 만 다루고 배울 수 있는 교과이기에 교과서를 집필하는 교수님과 선생님들도 어디까지 내용을 다룰지에 대한 고민이 있었 것이라 생각하다. 유클리드 거리란? 3 차원 이하 사이의 공간에서는 직관적으로 두점사이의 거리로 정의된다. 2차원 공간에서의 유클리드 거리 이를 성분이 n개인 데이터(벡터) 로 확장하면 아래와 같이 정의할 수 있다. 유클리드 거리가 0에 가까울 수록 유사도가 높다고 말할 수 있으며 개념이 직관적이기에 고1 수학을 이수한 학생들에게 설명하기에 큰 무리는 없다. 코사인 유사도란? 예를들어 다음 세 문서에서 (강원도, 양양, 속초) 가 언급된 수를 셈하여 수치화(벡터화) 한다고 하자. 문서1 = 강원도 양양에 한 수학교사 문서2 = 강원도 양양의 수학교사 남궁연, 그는 강원도 양양을 사랑한다. 문서3 = 남궁연은 속초에서 처음 근무를 시작했다. 이를 수치화하면  문서1 = (1,1,0) , 문서2 = (3,3,0),   문서3= (0,0,1)  이다. 문서1과 문서3의 유클리드 거리가 적다고 해서 문서1과 문서3이 문서1과 문서2 보다 더 유사하다고 말하기에는 무리가 있다. 이렇듯 수치화 한 데이터에 따라 사용하기에 적절한 유사도는 다르고, 코사인 유사도는 벡터 의 크기가 아닌 벡터의 방향으로 두 자료의 유

고등학교 인공지능 수학 수업계획 2 (감성사전 업그레이드)

이미지
지난 수업자료1( https://namgungyeon.tistory.com/10 )  이어 만든 감정분석기의 감성사전을 업그레이드해보자. 감정분석기 파일 사용예 [참고자료1] KNU 함국어 감성사전  http://dilab.kunsan.ac.kr/knu/knu.htm 딥러닝을 이용해, 표준국어대사전을 구성하는 각 단어의 뜻풀이를 분석하여 긍부정어를 추출하였다고 한다. KNU 한국어 감성사전 dilab.kunsan.ac.kr [참고자료2] Kaggle Data set  https://www.kaggle.com/rtatman/sentiment-lexicons-for-81-languages Sentiment Lexicons for 81 Languages Sentiment Polarity Lexicons (Positive vs. Negative) www.kaggle.com 다운로드 버튼을 누르면 (로그인 필요) 파일을 받을 수 있고 받은 압축파일 안에 여러가지 언어의 긍정부정 단어 데이터가 들어 있는데 뒤에_ko 붙은 txt 파일을 찾자 뒤에 txt 파일 중 nagative_words_ko.txt (한국어 부정단어) , positive_words_ko.txt (한국어 긍정단어) 를 열고 Ctrl+a 를 누르고 Ctrl+c 를 눌러 전체를 클립보드에 복사하면 한 번에 많은 감성사전 Data를 완성할 수 있다.  캐글(kaggle) 은 많은 데이터 전문가가 사용하고 있는 플랫폼이다. 간단하기는 하지만 인공지능 분야에 관심있는 학생들에게 캐글에서 이런 Data 를 받아 활용할 수 있음 정도는 알려 주는 것이 좋다고 생각한다.