스마일게이트 AI센터, 악플·혐오 발언 데이터셋 공개

이석호 기자 / 기사승인 : 2022-01-20 16:26:18
  • -
  • +
  • 인쇄

스마일게이트 AI센터가 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.

스마일게이트 AI센터는 최근 온라인 공간에서 혐오 표현이 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 이를 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 

 

▲ 스마일게이트 제공


이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

악플 및 혐오 발언 데이터는 2019년 1월 1일부터 지난해 7월 1일까지 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글에서 수집됐다. 이 과정에서 혐오 관련 데이터의 시의성과 편향성 등을 감안해 55만여 개의 데이터를 기반으로 1만 개 데이터셋을 구축했다.

특히 '여성·가족' '성소수자' '남성' '인종·국적' '연령' '지역' '종교' '기타혐오' 등 8개의 대상으로 범주화했다. 또 혐오 발언 분류를 위한 기준 모델을 공개해 혐오 발언 추출이 가능하도록 했다.

이 데이터셋은 향후 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 다양한 영역에서 활용될 수 있을 것으로 예상된다.

스마일게이트는 앞으로 지속적인 연구개발(R&D)을 실시하면서 확보된 기술력을 바탕으로 혐오 표현을 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화할 계획이다.

이번에 수집된 데이터는 스마일게이트 AI센터 깃허브 페이지를 통해 이달 중 공개 예정이다.

스마일게이트 AI 센터 한우진 센터장은 “이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류·예방돼 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다"이라고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

뉴스댓글 >

HEADLINE

더보기

PHOTO NEWS

트렌드경제

더보기