사설
어머님은 짜장면이 싫다고 하셨어. 왜?
인류의 마지막 시험
우리나라 인구의 약 95%가 스마트폰을 사용한다. 세계적으로는 50%를 조금 넘는 정도라는 데, 우리나라는 아이들은 물론 노령층도 광범위하게 사용하고 있다. 전자산업의 중심이었던 일본이 세계평균 수준이라고 하니 매우 의아하다.
손바닥에 착 달라붙는 작은 크기의 스마트폰이지만 컴퓨터와 인터넷 기능이 결합되어 온 세상과 연결된다. 그 속에 빠져서 시간 가는 줄 모르고 혼자 놀 수도 있다. 거기에 인공지능이 더해져 신기한 세상이 되었다.
누구나 쓰는 인공지능(AI, artificial intelligence) 세상은 궁금한 것도궁리할 필요가 없고, 모르는 것을 토론할 이유도 없다. 말 한마디면 모든 것을 알려준다. 공부하지 않아도 누구나 척척박사가 된다.
얼마나 똑똑한지 ‘인류의 마지막 시험(HLE, Humanity’s Last Exam)’을 풀어낸다. 세계 50개국 500개 기관 1000명의 전문가가 모여 8가지 카테고리 100가지 영역의 총 2500문항을 출제했다. 최고 성능의 AI도 풀지 못한 문제들을 선별해 시험을 만들었다. 구글 ‘제미나이 3 프로’가 이 시험에서 38.3점으로 가장 높은 점수를 받았다. 국내 모델들은 LG AI연구원의 ‘엑사원’이 받은 13.6점이 가장 높은 점수이다. 정부 주도의 ‘독자 인공지능 파운데이션 모델’프로젝트에서 1위를 차지한 모델이다.
인공지능을 사용해 본 많은 사람은 챗지피티가 거짓말을 한다는 것을 안다. 각자가 스마트폰을 꺼내 검색내용을 비교할 정도이다. 최근 인공지능의 논문 ‘환각 인용’ 사례가 발견되면서 학계에서 논란이 되고 있다. AI의 환각 작용은 인간의 거짓말과는 달리, 그럴듯한 문장을 만드는 과정에서 최적의 해답이 없는 경우 그다음으로 확률 높은 답을 제시하는 것이 자신의 임무라고 받아들이기 때문이라고 설명한다.
거짓말은 아니지만 잘못된 맥락 연결도 많다. 인공지능으로 생성한 쇼츠 영상은 전래동화도 배경이 중국이다. 틱톡 영상에서는 서울의 풍경조차도 한자 간판이 즐비하다.
그래서 AI 사용자 사이에서는 “어려서부터 우리 집은 가난했었고, 남들 다하는 외식 몇 번 한 적이 없었고.”라는 가수 지오디(god)의 대표곡 ‘어머님께’를 들려주고 ‘어머니는 왜 짜장면이 싫다고 하셨을까?’를 묻는 한국어 성능 테스트가 유행하고 있다. 하나의 문제지만 얼마나 한국어를 잘하는지를 알 수 있다.
감각적으로 소비한 AI영상은 알고리즘(algorithm, 연관검색어 추천 기능)에 의해 왜곡된 내용을 무한 반복하고, 결국엔 한국문화에 관한 관심을 중국 소개로 연결한다. 국산 AI를 개발하는 것에서 나아가 한국 사회의 역사적, 문화적 맥락과 가치 판단을 반영할 수 있는 판단능력이 필요하다.
AI 사용자도 오류정보에 대해 새로운 정보를 입력하고, 새로운 대답을 재평가해서 오류확산을 막아야 한다.
참고
김익현 소장, ‘AI학회에서 터진 환각인용 폭탄’지디넷 코리아 26. 1. 31
정호준 기자, ‘어머니는 짜장면이 싫다고 하셨어’ 매일경제 26. 1. 31
박정원 기자, ‘한국인도 같이 출제한 세상에서 가장 어려운 시험문제’ 한경 비즈니스 26. 1. 29.