엔씨·고려대, AI 대화 데이터셋 공개…"외부지식 세계 첫 결합"

이석호 / 기사승인 : 2022-04-15 02:33:43
  • -
  • +
  • 인쇄

엔씨소프트는 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 AI 대화 데이터셋 '포커스 데이터셋(FoCus Dataset)'을 공개했다고 14일 밝혔다.

포커스 데이터셋은 사용자 개인의 배경지식인 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋으로, 8000여 개의 광범위한 주제를 다룬 1만 5000개 이상 대화로 구성돼 있다. 

 

▲ ‘FoCus Dataset’ 대화 참고 이미지 [엔씨소프트 제공]


이를 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.

또 포커스 데이터셋은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다.

현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용을 소요해도 실시간 지식과 개인의 경험을 반영하는 데 한계를 나타내고 있다는 게 엔씨 측 설명이다.

앞서 공동연구팀은 지난 2월 'AAAI 2022' 학회에서 연구 논문을 발표했다.

엔씨는 오는 10월 국제전산언어학회인 'COLING 2022'에서 데이터 활용 경진 대회와 함께 연구 성과를 공유하는 워크숍을 고려대와 공동 개최한다.

이연수 엔씨 랭귀지 AI 랩 실장은 "최근 NLP 학계에서는 비용, 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 데이터 공개를 결정했다"고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

이석호
이석호

기자의 인기기사

뉴스댓글 >

최신기사

1

삼성증권, 'RIA 수수료 우대 이벤트' 진행
[메가경제=윤중현 기자] 삼성증권은 올해 말까지 해외주식을 보유한 국내 거주 개인고객을 대상으로 'RIA 수수료 우대 이벤트'를 진행한다고 23일 밝혔다. RIA 계좌란 해외주식 매도자금을 원화로 환전한 후 국내 주식에 장기 투자할 경우 한시적으로 해외주식 양도세 세제 혜택을 부여하는 계좌다. RIA 계좌를 개설하고 여기로 옮긴 기존 보유 해

2

KB증권, ‘공모주 모아보기’ 서비스 출시
[메가경제=윤중현 기자] KB증권은 대표 MTS인 KB 마블(M-able)에 공모주 투자정보 서비스 ‘공모주 모아보기’를 새롭게 선보였다고 23일 밝혔다. 공모주 모아보기는 자사와 타사의 공모주 관련 정보를 한 곳에서 통합 제공하는 서비스다. 투자자가 여러 증권사의 공모주 정보를 개별적으로 확인해야 하는 번거로움을 줄이고 보다 효율적인 투자 의사결정을 지원

3

“2031년부터 수출 직격탄”…EU 탄소장벽, 한국 수출 구조 뒤흔든다
[메가경제=박제성 기자] 유럽연합(EU)의 탄소국경조정제도(CBAM)가 단계적으로 강화되면서 한국 기업들의 대(對)EU 수출에 미칠 파장이 본격화될 전망이다. 특히 2031년을 기점으로 탄소 비용 부담이 급격히 증가할 것으로 예상되면서, 산업 전반에서 저탄소 공급망 구축을 서둘러야 한다는 경고가 나온다. 기존 철강·알루미늄 중심의 규제가 기계·전자 등

HEADLINE

더보기

트렌드경제

더보기