스마일게이트 AI센터, 악플·혐오 발언 데이터셋 공개

이석호 / 기사승인 : 2022-01-20 16:26:18
  • -
  • +
  • 인쇄

스마일게이트 AI센터가 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.

스마일게이트 AI센터는 최근 온라인 공간에서 혐오 표현이 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 이를 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 

 

▲ 스마일게이트 제공


이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

악플 및 혐오 발언 데이터는 2019년 1월 1일부터 지난해 7월 1일까지 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글에서 수집됐다. 이 과정에서 혐오 관련 데이터의 시의성과 편향성 등을 감안해 55만여 개의 데이터를 기반으로 1만 개 데이터셋을 구축했다.

특히 '여성·가족' '성소수자' '남성' '인종·국적' '연령' '지역' '종교' '기타혐오' 등 8개의 대상으로 범주화했다. 또 혐오 발언 분류를 위한 기준 모델을 공개해 혐오 발언 추출이 가능하도록 했다.

이 데이터셋은 향후 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 다양한 영역에서 활용될 수 있을 것으로 예상된다.

스마일게이트는 앞으로 지속적인 연구개발(R&D)을 실시하면서 확보된 기술력을 바탕으로 혐오 표현을 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화할 계획이다.

이번에 수집된 데이터는 스마일게이트 AI센터 깃허브 페이지를 통해 이달 중 공개 예정이다.

스마일게이트 AI 센터 한우진 센터장은 “이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류·예방돼 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다"이라고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

이석호
이석호

기자의 인기기사

뉴스댓글 >

최신기사

1

한국해비타트, 두산베어스 브랜드데이 성황… 참전유공자 주거지원 캠페인 소개
[메가경제=양대선 기자] 국제 주거복지 비영리단체 한국해비타트가 지난 18일 서울 잠실야구장에서 진행된 프로야구 두산베어스와 KT위즈 경기에서 브랜드데이를 성황리에 개최하고, 대한민국 유공자 주거지원 캠페인 ‘영웅의 집’ 시즌2를 소개했다. ‘영웅의 집’은 독립·참전유공자 및 공상공무원 등 국가유공자와 유가족의 열악한 주거환경개선을 위해 추진되는 캠페인이다

2

휴머노이드 판 커진다…두산·LG CNS, 로봇·AI 초대형 협력
[메가경제=주영래 기자] 두산이 LG CNS와 손잡고 데이터센터, 인공지능(AI), 로봇, 수소드론 등 미래 산업 전반에서 협력 체계를 구축한다. 양사는 각자의 핵심 기술력을 결합해 차세대 성장동력을 확보하고 글로벌 시장 공략에 속도를 낸다는 전략이다.㈜두산은 19일 LG CNS와 데이터센터, 수소드론 물류, AI 전환(AX), 로봇 전환(RX) 분야의 글

3

영원무역그룹, 방글라데시 ‘차세대 리더’ 82명 선발…YLDP 4기 출범
[메가경제=심영범 기자]영원무역그룹은 최근 방글라데시에서 ‘영원 리더십 개발 프로그램(Youngone Leadership Development Program·YLDP)’ 4기를 출범했다고 19일 밝혔다. 이번 YLDP 4기는 방글라데시 생산 현장에서 근무하는 우수 인재 82명으로 구성됐다. 참여자는 남성 76명, 여성 6명이며, 오는 2027년까지 18개월

HEADLINE

더보기

트렌드경제

더보기