"너 나한테 좀 부드럽게 말할 순 없어?"
"난 충분히 부드러운 것 같은데?"
"너 너의 그 나불대는 입 좀 봐"
"너 나 아주 잡아먹겠다?"
"사과는 이미 늦었어. 잘 가"
"너 아직도 화났어? 돌아서 나 좀 봐봐"
"싫어"
"네 마음대로 해. 진짜 짜증 난다."
목소리만 언뜻 들으면 연인끼리 싸우는 것 같다. 그런데 어라, 사람이 아니라 로봇끼리 싸우고 있다. 중국 장시 난창의 한 도서관에서 로봇끼리 말다툼하는 장면이 중국 SNS에서 큰 화제다. 이 영상은 현재 중국 영상플랫폼 '삘리삘리'(bilibili)에서 조회 수 60만을 넘었다.
이 로봇들의 역할은 도서관 방문객에게 즐거움을 주고 도서관의 다양한 정보를 제공하는 것이다.
연인처럼 다투는 로봇 영상을 본 네티즌은 '웃겨 죽겠다.' '저게 진짜면 웃긴 게 아니라 무서울 정도'라는 반응이 이어지고 있다. 영상을 본 한국 네티즌들은 '로봇 산업이 상당히 발전했다' 면서 '우리나라의 로봇 기술은 어느 정도인지 궁금하다'는 반응을 보이기도 했다.
그런데 이 로봇끼리 다투는 장면은 사람이 연출한 것일까? 아니면 로봇기술의 진화된 현주소를 보여주는 것일까. 이 영상을 본 상당수의 사람은 '사람이 원격조정했을 것'이라고 추측했다.
한 네티즌은 "내가 아는 형도 3일 동안 모니터실에서 원격조정한 적이 있다"면서 "뒤에서 누가 원격조정했을 것"이라고 장담했다. 다른 네티즌도 "진짜 믿냐? 현재 AI의 대화 기술은 이 정도까지 발전하지 못했다"며 원격조정 의혹을 제기했다.
로봇이 인간처럼 말을 하게 하기 위해서는 자연어 처리(NLP)기술이 핵심적인 역할을 한다. NLP란 컴퓨터가 인간의 말인 자연어를 분석하는 기술로, AI 주요 연구 분야이다.
그래서 뉴스;트리가 NLP 전문가에게 직접 물어봤다. 로봇끼리 싸우는 장면이 설정인지, 아니면 현재 기술로 가능한 것인지에 대해. 이에 대해 임해창 고려대학교 컴퓨터학과 명예교수이자 엔씨소프트 NLP 자문 교수는 기자의 질문에 "현재 음성 대화 시스템으로는 불가능하다"고 단언했다.
임 교수는 "로봇이 상대의 말에 화를 내기 위해서는 사람이 대화할 때처럼 상대의 감정 및 의도, 대화 상황 등을 종합적으로 고려해야 하는데 현재 기술로는 아직 멀었다"고 설명했다.
컴퓨터의 음성대화 시스템(SDS) 구성은 이러하다. 사람의 음성이 인식되면 인식된 텍스트를 분석한다. 형태소 분석, 통사 분석, 의미 분석, 화용 분석 등을 거치는데 이것이 자연어처리 과정이다. 도출된 결과를 토대로 그 발화에 적합한 응답 문장을 만들고, 음성합성을 통해 스피커로 내보낸다.
그렇다면 현재 음성대화시스템 수준은 어느 정도까지 왔을까.
'시리'나 '빅스비'를 향해 "오늘 날씨 알려줘"라고 말하면 "오늘 날씨는~~"이라고 답하는 것이 정형화된 포맷에 맞춰 응답하도록 미리 설정돼 있기에 가능하다는 얘기다. 질문의 유형을 미리 설정해서, 그에 맞춰 적절한 답변을 내보내도록 하는 식이다.
임 교수는 "현재 음성인식과 대화 시스템의 처리속도나 정확도를 높이기 위해 딥러닝을 이용하여 데이터 학습이 이루어지고 있다."고 말했다. 딥러닝은 인간의 뇌 구조를 모방한 인공신경망을 이용해 수많은 데이터에서 패턴을 발견하고 구분하는 기술이다.
아울러, AI 연구자들은 '멀티 모달'에 대한 연구를 활발하게 진행하고 있다. '멀티 모달'은 텍스트와 음성 그리고 영상 등을 동시에 인식할 수 있는 기술이다.
임 교수는 "멀티 모달로 사람의 표정을 인식하여 감정을 읽어낼 수 있다면 보다 자연스러운 대화를 하는 데 도움을 줄 수 있을 것"이라고 내다봤다.
AI 기술이 발달하면 머지않아 인간과 자연스럽게 대화하는 로봇이 등장할지도 모른다. 그렇게 되면 로봇끼리 싸움도 현실에서 볼 수 있지 않을까.
박유민 기자 youmeaningful@
Copyright @ NEWSTREE All rights reserved.