엔씨·고려대, AI 대화 데이터셋 공개…"외부지식 세계 첫 결합"

이석호 / 기사승인 : 2022-04-15 02:33:43
  • -
  • +
  • 인쇄

엔씨소프트는 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 AI 대화 데이터셋 '포커스 데이터셋(FoCus Dataset)'을 공개했다고 14일 밝혔다.

포커스 데이터셋은 사용자 개인의 배경지식인 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋으로, 8000여 개의 광범위한 주제를 다룬 1만 5000개 이상 대화로 구성돼 있다. 

 

▲ ‘FoCus Dataset’ 대화 참고 이미지 [엔씨소프트 제공]


이를 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.

또 포커스 데이터셋은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다.

현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용을 소요해도 실시간 지식과 개인의 경험을 반영하는 데 한계를 나타내고 있다는 게 엔씨 측 설명이다.

앞서 공동연구팀은 지난 2월 'AAAI 2022' 학회에서 연구 논문을 발표했다.

엔씨는 오는 10월 국제전산언어학회인 'COLING 2022'에서 데이터 활용 경진 대회와 함께 연구 성과를 공유하는 워크숍을 고려대와 공동 개최한다.

이연수 엔씨 랭귀지 AI 랩 실장은 "최근 NLP 학계에서는 비용, 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 데이터 공개를 결정했다"고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

이석호
이석호

기자의 인기기사

뉴스댓글 >

최신기사

1

헥토헬스케어 온리추얼, 中 CBE 2026 참가…스킨케어 확장 첫 공개
[메가경제=심영범 기자]헥토헬스케어의 이너뷰티 브랜드 온리추얼이 글로벌 포트폴리오를 공개한다. 오는 12일부터 14일까지 중국 상하이 뉴 인터내셔널 엑스포 센터에서 열리는 CBE 2026은 글로벌 뷰티 기업과 바이어들이 대거 참여하는 대표 산업 박람회다. 온리추얼은 이번 전시를 통해 기존 이너뷰티 중심 브랜드에서 ‘먹고, 바르고, 붙이는’ 통합 뷰티 솔루션

2

쿠팡, 공정위 상대 소송 제기…“김범석 동일인 지정 취소해달라”
[메가경제=심영범 기자]공정거래위원회(이하 공정위)가 김범석 쿠팡Inc. 이사회 의장을 상호출자제한기업집단 쿠팡의 동일인으로 지정한 데 대해 쿠팡이 법적 대응에 나섰다. 동일인 지정 처분에 대해 기업집단이 행정소송을 제기한 것은 이번이 처음이다. 11일 관련 업계에 따르면 쿠팡은 최근 서울고등법원에 동일인 변경 지정 처분 등 취소 소송과 함께 집행정지 신청

3

대상·한국수출입은행, ‘그냥드림’ 맞손… 취약계층 지원 확대
[메가경제=심영범 기자]대상이 한국수출입은행과 손잡고 취약계층 지원 사업인 ‘그냥드림’에 참여한다. 대상은 취약계층의 기본 먹거리와 생필품 등을 지원하는 ‘그냥드림’ 사업에 참여한다고 11일 밝혔다. ‘그냥드림’은 보건복지부가 지난해 12월부터 시범 운영 중인 복지 프로그램으로, 생계에 어려움을 겪는 국민에게 먹거리와 생필품 등을 제공하는 사업이다. 이번

HEADLINE

더보기

트렌드경제

더보기