레플리
글 수 189

기능형 챗봇에도 초거대모델이 필요

조회 수 759 추천 수 0 2022.07.03 18:18:37


챗봇은 크게 기능형과 감성형으로 구분됩니다. 기능형 챗봇은 목적지향 챗봇, task oriented dialog system, goal oriented dialog system이라고 불립니다. 시리나 구글 어시스턴트, 은행 챗봇 등 사람들에게 정보를 제공하거나 도와주는 역할을 합니다. 감성형 챗봇은 일상대화 챗봇, open domain chatbot이라고도 하는데, 사용자와 잡담을 주고받는데 주로 사용됩니다. 앞으로는 에이닷처럼 하나의 챗봇이 기능형과 감성형 기능을 모두 지원하는 방향으로 나아갈 것입니다. 영화 Her의 사만다처럼요.

 

감성형 챗봇은 최근 딥러닝 덕분에 크게 발전하고 있습니다. 여러 턴의 맥락을 이해할 뿐만 아니라, 다양한 지식들을 기억하고 이를 대답에 사용하기도 합니다.얼마 전 논란이 되었던 구글의 람다는 지각이 있는게 아니냐는 주장이 있을 정도였습니다. 그렇다면 왜 기능형 챗봇은 아직까지 그 성능이 크게 오르지 않는 것일까요.

 

현재 기능형 챗봇은 대부분 의도(intent)와 개체(entity)라는 방법을 사용합니다. 예를 들어, '어제 경제뉴스를 보여줘'라고 물어봤다면 '뉴스보기'라는 의도로 분류합니다. 그리고 '어제'와 '경제'라는 핵심 개체들을 추출합니다. 다음으로 프로그래머가 만들어놓은 각 의도에 해당하는 함수에 개체정보를 파라미터로 넘겨 실행합니다. 마지막으로 함수의 출력 결과를 템플릿 문장에 넣어 대답을 합니다.

 

intent_entity.jpg

 

 

 

이런 방식의 가장 큰 문제점은 다양성이 부족하다는 것입니다. 미리 사람이 정의하고 코드로 만들어 놓은 질문에만 대답이 가능합니다. 새로운 유형의 질문에 대답을 하려면, 개발자가 시간과 노력을 들여 하나씩 추가해야 합니다. 문맥을 고려하기도 어렵습니다. 맥락에 따라 대답하려면, 이 역시 규칙을 만들어서 시나리오를 사전에 설계해야 합니다. 그렇기 때문에 챗봇이 이해하고 처리할 수 있는 경우의 수가 너무 적습니다. 지금 대부분의 기능형 챗봇들이 사람들에게 외면을 받는 이유입니다.

 

이를 해결하려면 감성형과 마찬가지로 기능형 챗봇도 딥러닝을 적극 활용해야 합니다. 물론 지금 기능형 챗봇도 딥러닝을 일부 사용하고 있습니다. 다만 의도를 분류하거나 개체를 추출하는 영역에 국한되어 있습니다. 저는 입력을 받아 대답을 하는 전체 과정에 사람의 개입을 최소화해야 한다고 생각합니다. 람다같은 생성모델처럼 end-to-end 방식이 필요합니다.

 

 

 

메타가 만든 Blenderbot2.0을 보면 이런 기능이 일부 포함되어 있습니다. 이 챗봇은 사용자가 물어보면 그 내용을 인터넷에서 검색하고, 그 내용을 참조하여 대답을 합니다. 우선 학습데이터를 구축하기 위해 별도의 툴을 만들었습니다.

 

질문을 받으면 사람이 이 툴에서 키워드를 넣어 검색을 합니다. 여러 검색결과가 나오면 그 중 하나를 선택하고 거기에 맞게 대답을 합니다. 이렇게 어떤 키워드로 검색할지, 검색결과 중 어느 내용으로 대답을 만들지가 모두 데이터가 됩니다. 이렇게 학습한 모델 역시 같은 툴을 사용합니다. 사람이 물어보면 거기에 맞는 검색 키워드를 생성하여 검색을 하고, 어떤 검색결과를 사용하지 결정합니다. 그리고 이를 참조하여 최종적으로 대답문장을 만듭니다.

 

blenderbot2_1.jpg

 

blenderbot2_2.jpg

 

 

 

같은 방법을 콜센터 챗봇에 그대로 적용할 수 있습니다. 우선 데이터셋을 수집하는게 먼저입니다. 상담원은 이와 비슷한 툴을 통해서만 DB를 검색하거나 정보를 찾습니다. 그리고 그 행동 하나하나를 대답문장과 같이 데이터셋으로 만들고 학습을 합니다. 이렇게 하면 사람처럼 다양한 질문을 처리할 수 있는 딥러닝 챗봇을 구현할 수 있습니다. 물론 GPT-3 같은 초거대모델 정도가 되어야 복잡한 상황을 이해하고 대답할 수 있다고 봅니다.

 

아직은 데이터셋을 구축하는 것부터 쉽지 않습니다. 초거대모델을 새로 수집한 데이터로 파인튜닝하는 것도 필요합니다. 하지만 몇 년안에 초거대모델을 사용한 기능형 챗봇도 곧 등장할 거라고 예상합니다. 아마 지금도 어디선가 개발하고 있지 않을까요. 당장 올해 출시된다고 해도 그리 놀라지 않을 듯 합니다.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
챗봇의 종류 및 적용 분야 file 깊은바다 2018-03-04 22172
챗봇의 한계와 미래 file 깊은바다 2018-10-15 6237
챗봇에서 자연어처리 적용 방법 깊은바다 2017-04-29 5406
챗봇 접객 자동화 3가지 영역 - 웹 컨시어지 챗봇 깊은바다 2019-10-03 4832
대화 인터페이스, 챗봇, 그리고 자연어처리 깊은바다 2018-04-06 4422
카카오 i 오픈빌더 유료화의 문제점 깊은바다 2020-07-28 2441
대화 프로그램 - ELIZA 깊은바다 2016-03-25 2048
GPT-3, Dialogflow, 카카오i 오픈빌더 요금 비교 file 깊은바다 2022-03-02 1960
구글은 챗봇이 나쁜 생각이었다고 인정했다 file 깊은바다 2018-10-29 1839
MS의 Bot Framework 챗봇 세미나 후기 file [2] 깊은바다 2017-09-24 1655
네이버 톡톡 챗봇 API file 깊은바다 2017-08-31 1655
플로차트로 만드는 챗봇서비스 - 단비(danbee.Ai) 깊은바다 2017-11-19 1384
인공지능 스피커 설문조사 결과 깊은바다 2018-11-24 1350
AMICA.ai - 네이버에서 만든 챗봇 API 깊은바다 2017-02-28 1260
플로차트 방식의 새로운 챗봇 빌더 - Dialogflow CX file 깊은바다 2020-09-06 1259