엔씨·고려대, AI 대화 데이터셋 공개…"외부지식 세계 첫 결합"

이석호 / 기사승인 : 2022-04-15 02:33:43
  • -
  • +
  • 인쇄

엔씨소프트는 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 AI 대화 데이터셋 '포커스 데이터셋(FoCus Dataset)'을 공개했다고 14일 밝혔다.

포커스 데이터셋은 사용자 개인의 배경지식인 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋으로, 8000여 개의 광범위한 주제를 다룬 1만 5000개 이상 대화로 구성돼 있다. 

 

▲ ‘FoCus Dataset’ 대화 참고 이미지 [엔씨소프트 제공]


이를 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.

또 포커스 데이터셋은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다.

현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용을 소요해도 실시간 지식과 개인의 경험을 반영하는 데 한계를 나타내고 있다는 게 엔씨 측 설명이다.

앞서 공동연구팀은 지난 2월 'AAAI 2022' 학회에서 연구 논문을 발표했다.

엔씨는 오는 10월 국제전산언어학회인 'COLING 2022'에서 데이터 활용 경진 대회와 함께 연구 성과를 공유하는 워크숍을 고려대와 공동 개최한다.

이연수 엔씨 랭귀지 AI 랩 실장은 "최근 NLP 학계에서는 비용, 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 데이터 공개를 결정했다"고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

이석호
이석호

기자의 인기기사

뉴스댓글 >

최신기사

1

롯데손보 “경영개선권고 위법 가능성"ㅋ
[메가경제=이상원 기자] 금융위원회의 '경영개선권고'에 대해 롯데손해보험이 반박하고 나섰다.금융위는 5일 오후 정례회의를 통해 롯데손해보험(이하, 롯데손보)에 대한 적기시정조치 '경영개선권고'를 의결했다고 밝혔다. 금융당국은 롯데손보 자본 적정성이 취약하다고 판단, 건전성 관리 강화를 주문했다. 금융감독원은 지난해 정기검사와

2

CJ온스타일, 가습기·전기매트도 ‘오늘도착’
[메가경제=심영범 기자]서울에 첫 한파주의보가 발효되면서 겨울철 계절가전 수요가 급증하고 있다. CJ온스타일은 때 이른 초겨울 추위를 대비해 가습기·전기매트·온열기기 등 약 100여개 겨울 계절가전에 ‘오늘도착’ 등 빠른 배송 서비스를 확대한다고 5일 밝혔다. 실제로 CJ온스타일이 추위가 시작된 지난 10월 27일부터 11월 2일까지 계절가전 주문금액을

3

김승연 회장, 한화 선수단에 준우승 기념 오렌지색 아이폰으로 '찐사랑' 증명
[메가경제=정호 기자] 김승연 한화그룹 회장이 한화이글스의 2025 한국시리즈 준우승을 축하하기 위해 선수단에게 팀 상징과 같은 '오랜지색'의 아이폰을 선물했다. 이 아이폰 17 프로는 선수단과 스태프 총 60명에게 전달됐다. 5일 한화그룹에 따르면 김 회장은 전날 아이폰을 건네며 "한국시리즈 준우승을 진심으로 축하한다"

HEADLINE

더보기

트렌드경제

더보기