[트렌드탐구]'모라벡의 역설' 넘은 AI음성비서 '목소리 너머 사용자 속마음까지 읽다'
[트렌드탐구]'모라벡의 역설' 넘은 AI음성비서 '목소리 너머 사용자 속마음까지 읽다'
  • 류수근 기자
  • 승인 2019.06.29 14:20
  • 댓글 0
이 기사를 공유합니다

쓰임새 무한확장...최대 관건은 '신뢰성' 

[메가경제 류수근 기자] '모라벡의 역설(Moravec's Paradox)'이라는 게 있다. 손가락으로 물건집기나 의사소통 등 인간에게 쉬운 것은 컴퓨터에 어렵고, 복잡한 수학계산 등 인간에게 어려운 것은 컴퓨터에게 쉽다는 역설이다. 1970년대 미국의 로봇 공학자인 한스 모라벡이 한 ‘어려운 일은 쉽고, 쉬운 일은 어렵다’라는 말에서 비롯됐다. 컴퓨터와 인간의 능력 차이를 역설적으로 표현했다.

하나 4차 산업혁명 시대에 접어들면서 이 역설은 더 이상 힘을 얻기 어려워졌다. 인공지능(AI) 기술이 발달하면서부터다. 머신러닝, 딥러닝 등 인간의 지능을 모방한 인공지능 개발기법이 진화하면서 이제 컴퓨터는 영장류의 맨 꼭대기에 위치한 인간의 뇌를 닮아가고 있다.

'모라벡의 역설'을 뒤엎은 인공지능 가상비서

모라벡의 역설을 보기 좋게 뒤집는 대표적인 기술이 인공지능(AI) 가상비서인 ‘음성비서’다. 이 대화형 인공지능(AI)은 컴퓨터가 인간의 말을 알아듣기 시작하면서 스마트폰, 집과 회사, 그리고 이동수단인 차량까지 유용한 심부름꾼이 되고 있다.

 

[그래픽= 삼성전자 뉴스룸]
인공지능(AI) 가상비서인 대화형 AI의 진화가 눈부시다. 스마트폰에 이어 거실과 주방, 침실을 점령 중이다. [그래픽= 삼성전자 뉴스룸]

 

인간과 컴퓨터 간 음성비서를 중개하는 대표적인 형태는 스마트 스피커다. 인공지능 소프트웨어인 음성비서의 활용성이 커지면서 글로벌 스마트 스피커 시장은 나날이 팽창하고 있다.

“"빅스비, 나 집에 왔어" 이렇게 제가 명령어를 외치면, 보이시죠? 집에 있는 모든 조명들이 켜지고요. 꺼져 있던 에어컨과 공기청정기가 켜지게 되고요. 집 안을 돌아다니면서 청소하던 로봇 청소기가 충전하기 위해서 집안으로 들어가게 됩니다.”

지난해 7월에 열린 광주 국제 IoT(사물인터넷) 가전 로봇박람회 장에 마련된 삼성전자 ‘홈 IoT' 부스에서의 한 장면이다. 해당 부스 가이드가 관람객들에게 삼성전자의 인공지능 가상비서 ’빅스비(BixBy)를 통해 스마트홈 기능을 실현해 보였다.

거실 한쪽의 무풍 에어컨은 “하이, 빅스비, 나 더워”라고만 말했는데도 빅스비는 “인공지능 패턴 분석 결과에 맞춰 희망 온도를 2도 낮출게요”라고 응답하며 사용자가 가장 선호하는 온도를 추천해줬다.

만화나 영화에서나 상상할 법한 장면이 문득 우리 실생활의 일부분이 된 것이다. 매년 초 미국 라스베가스에서 열리는 ‘CES’ 등 세계의 유명 가전·IT(정보통신) 전시회에서는 몇 년전부터 음성 인식 기반 제품이 홍수를 이루고 있다. 이것은 ‘음성비서’가 나날이 중요해지고 있다는 사실을 방증한다.

음성비서, 스마트폰에서 스마트 스피커에 들어가다

음성비서가 빠르게 우리 생활 속에 뿌리 받는 이유는 ‘음성’이 주는 장점 때문이다. 우리는 어릴 때부터 말을 하며 살았다. 자연스럽게 우리 몸에 뱄다. 그래서 굳이 의도하지 않아도 우리의 생각은 입을 통해 말이 되어 나온다.

 

[출처= 삼성전자 뉴스룸]
[그래픽= 삼성전자 뉴스룸]

 

음성을 이용해서 명령하면 번거로움도 사라진다. 타이핑이나 마우스, 터치 등을 이용해 검색하려면 여러 복잡한 단계를 거쳐야 하지만 음성을 통하면 입만 뻥끗하면 된다. 굳이 어떤 절차로 검색이 이루어지는지 이용자는 알 필요가 없다. 대화로 주고받으니 컴퓨터가 친구처럼 친근하게 다가온다.

이런 매력으로 인해 4차 산업혁명의 대표기술 중 하나인 음성비서는 이제 소비자와 다양한 방식으로 만나고 있다.

음성비서는 스마트폰에서 시작돼 전용 스마트 스피커 시대를 맞이했다. 지난 2011년 아이폰4S와 함께 내놓아 세계를 놀라게 한 지능형 음성인식 기능인 ‘시리(Siri)’가 그 선구자였다.

이에 뒤질세라 똑똑한 나만의 비서를 만들기 위해 국내 제조업체도 발빠르게 움직였다. 이듬해인 6월에는 삼성전자가가 ‘갤럭시S3’에 ‘S보이스’를 처음으로 탑재했고, LG전자도 ‘옵티머스 뷰’와 ‘옵티머스 LTE2’에 ‘큐보이스’를 도입했다.

 

마이크로소프트 '보이스 리포트'의 스마트 스피커 구매 희망 비율 [출처= 마이크로소프트]

 

본격적인 음성비서 시대는 전용 '스마트 스피커(smart speaker)' 시대의 개막과 함께 도래했다. 세계적으로는 아마존의 '알렉사(Alexa)'와 구글의 '어시스턴트(Assistant)' 2파전에 마이크로소프트의 '코타나(Cortana)'가 도전하는 형국이다. 글로벌 전자제품 제조업체인 삼성전자는 '빅스비(Bixby)'를 앞세워 가전과 스마트폰 세계에서 입지를 키워왔다.

국내에서는 SK텔레콤의 '누구(NUGU)', KT의 '기가 지니(GiGA Genie)' 등 이동통신사의 음성비서와, 국내 최대 포털사이트 네이버가 론칭한 '클로바(Clova) 등이 활약 중이다.

국내 음성비서 스마트스피커 시장은 SK텔레콤이 2016년 9월 ‘누구’를 처음 내놓은 이후 KT의 ‘기가 지니’와 네이버의 ‘웨이브’, 카카오의 ‘카카오머니’ 등의 스마트 스피커가 잇따라 출시되며 빠른 성장세를 보여왔다.

여기에 국내 시장에는 구글이 한글화된 ‘어시스턴트’를 앞세운 '구글홈'을 내놓으며 뛰어들었고, 삼성전자도 인공지능 스피커 ‘갤럭시홈’ 출시일을 기다리고 있다.

음성인식기술 ‘목소리 너머 이용자의 의중까지 읽어라’

음성비서는 최첨단 IT 기술의 집약체다. 인공지능(AI) 알고리즘과 빅데이터에 기반한 여러 기술이 차츰 더 인간에 가까운 소통 수준에 도달하고 있다.

[출처= 삼성전자 뉴스룸]
[출처= 삼성전자 유튜브 영상 캡처]

 

인간과 컴퓨터 간 인터페이스 방식은 지속적으로 발전해왔다. 여러 방식이 있지만 문자든 아이콘이든 음성이든 특정 수단을 활용해 인간이 하고자 하는 일을 컴퓨터에게 전달한다는 공통점을 갖고 있다. 음성 인식 기술은 최첨단 인터페이스 방식이다.

컴퓨터 인터페이스는 ‘텍스트’에서 점차 ‘그래픽’으로 진화했다. 텍스트 인터페이스가 글자를 타이핑하는 방식이었다면 그래픽 기반 인터페이스(GUI)는 특정 앱의 아이콘을 마우스로 클릭하거나 손가락으로 터치하는 형태를 띠었다. GUI 다음으로 등장한 게 바로 음성 인식 기반 인터페이스(Voice User Interface, VUI)다.

음성 인식 방식은 텍스트 방식이나 그래픽 방식과 현저히 다른 점들이 있다. 음성 인식 기반 기기에서는 먼저 자연어 인식을 통해 사용자 명령을 이해할 수 있어야 하고, 인식된 명령어를 바탕으로 해당 기능이나 서비스를 연결시키는 작업도 수반한다.

음성인식 기술이 인간의 수고를 대신하려면 우선 시끄러운 상황 등 각기 다른 환경에서도 사람의 음성 명령을 정확히 알아채야 하고, 말소리에서 화자(話者)의 의도를 정확히 파악해 원하는 서비스와 연결해줘야 한다. 그리고 인식한 음성을 명령어로 정확하게 변환시킬 수 있어야 한다.

음성인식 기술은 1950년대부터 꾸준히 연구돼왔지만 그후에도 오랫동안 ‘모라벡의 역설’을 뛰어넘지 못했다. 인식률의 장벽이었다. 음의 고저와 속도, 발성의 차이 등 우리가 말하는 기본적인 음성의 차이는 물론 사투리 등을 구분하는데 큰 진전을 보지 못했다.

1990년대 이 벽을 허물기 위해 야후가 집중적으로 투자해 인식률을 80%정도까지 높였지만 더 이상은 넘지 못했다. 이 때문에 인간과 컴퓨터 간 소통은 키보드와 마우스, 터치 등을 통해서만 이루어질 수밖에 없었다.

음성인식 기술은 2010년대 중반부터 획기적인 발전을 이뤘다. 검색엔진의 새 장을 연 구글이 대규모 음성 데이터를 모아 이용하려는 노력을 기울였고, 알파고를 통해 세계를 놀라게 한 머신러닝과 딥러닝 알고리즘이 만나면서 인간 음성의 영역에서 지속되던 모라벡의 역설이 마침내 깨지게 됐다.

2013년 상반기까지만 해도 80%를 넘지 못했던 구글 머신러닝의 음성인식률은 4년여 만인 2017년 95%에 도달하는 경이적 발전을 이뤘다.

 

[출처= 삼성전자 뉴스룸]
 아마존이 개발한 ESP(Echo Spatial Perception) 기술은 여러 기기에서 동일한 음성 명령이 확인됐을 때 사용자와 가장 가까이 있는 기기에서만 반응하도록 설계됐다. [그래픽= 삼성전자 뉴스룸]

 

우리나라도 한국어 음성인식률이 크게 향상됐으며 중국 최대의 검색엔진인 바이두의 음성인식 기술 ‘딥 스피치(Deep Speech)’는 인식률이 97%에 도달했다.

음성인식 기술의 획기적인 발전으로 인간과 로봇 간의 직접 대화도 가능한 시대가 됐다. 2016년에 탄생한 홍콩의 인간형 휴머노이드 로봇 '소피아(Sophia)'는 대표적인 사례다. 핸슨 로보틱스가 개발한 소피아는 눈 안의 카메라로 사람의 얼굴을 보며 자연어 서브시스템을 이용해 음성을 처리하고 사람과 대화를 나눈다.

음성인식(ASR), 음성이해(NLU), 음성합성(TTS) 등은 현재 음성인식을 가능케 한 핵심 기술들이다. ASR은 발화자의 명령어를 컴퓨터가 이해하는 텍스트 언어로 ‘자동 변화하는 기술’이고, NLU는 주어진 텍스트 언어가 어떤 의미인지 파악하는 기술이다. TTS는 ASR과 반대 기념으로 문장을 음성으로 전환하는 기술이다. 이들 기술을 통해 인간은 사람처럼 말하는 로봇을 만나게 됐다.

아직도 음성 인식 기술은 초기 단계다. 그만큼 앞으로 해결해야 할 과제가 많다. 난제는 대부분의 스마트 기기가 ‘개인화된 장치’인 데 반해 음성 인식 인터페이스가 탑재된 장치는 공용인 경우가 많다는 데서 비롯된다.

명령을 내리는 화자(話者)를 구분한 후 그에 맞게 기기 사용자 계정을 연결해주는 복수 계정 지원 문제, 여러 장치에서 명령어를 중복해 인식하는 경우에 대한 해결책, 하나의 기기에서 서로 다른 음성 인식 기술을 이용할 수 있도록 하는 문제 등의 정교한 고도화 과정이다.

스마트 스피커, 음성비서를 거실과 주방으로 데려오다

음성인식 가상비서의 대표제품은 스마트 스피커다. 세계적으로는 아마존을 필두로 구글 등 2018년 누적 1억대가 보급되었다.

‘캐즘(chasm)’이란 용어가 있다. 첨단기술 제품이나 혁신제품이 개발된 후 소수의 혁신수용자가 지배하는 ‘초기시장’에서 다수의 실용수용자가 소비하는 ’주류시장‘으로 넘어가는 과정에서 일시적으로 수요가 정체하거나 후퇴하는 현상이다.

 

곧 출시될 것으로 보이는 삼성전자의 '갤럭시홈'은 어떤 장점으로, 어느정도의 영향력을 발휘할까? [사진= 연합뉴스] 

 

미국에서는 이미 음성비서가 캐즘을 넘어 일상화 단계에 접어들었다. 이미 음성비서는 신기한 혁신제품이 아니라 생활 저변에 자리잡은 일상용품이 되고 있다.

음성비서가 단기간에 사람의 일상에 파고든 이유는 연결매체가 편리한 ‘음성’이기 때문이다. 인간은 ‘언어의 동물’이라고 표현될 만큼 평생 언어로 소통하며 산다.

보이스 사용자경험(UX)의 장점을 살린 음성비서는 단순질문, 음악, 날씨정보, 길찾기, 맛집찾기, 여행정보, 쇼핑, 스마트홈 서비스 등 다방면으로 사용 영역을 넓혀가고 있다.

음성비서가 인기를 모으며 똑똑한 스마트 스피커 시장은 확대일로다. 가정 내 가전제품과 사물인터넷(IoT) 기기의 혁신과 맞물리면서 스마트홈 플랫폼의 핵심인프라로 자리매김했다. 인공지능 방식의 설계를 표방하는 아파트에는 스마트 스피커가 빌트인 형태로 제공되고 있다.

미국 소비자기술협회(CTA)가 꼽은 ‘미국의 2019년 신흥 기술 제품 판매 예상 매출’에 따르면, 스마트워치(47억달러)와 스마트홈 디바이스(46억달러)에 이어 스마트스피커(32억달러)가 세 번째였다. CTA는 스마트 스피커 시장이 지난해에 비해 올해 7% 성장할 것으로 내다봤다.

스마트스피커는 이제 스마트폰과 대적할 만큼 몸집을 키웠다. 2018년 컨설팅사 에센츄어에 따르면, 스마트 스피커 소유자의 3분의 2에게서 스마트폰 사용량이 감소했다. 음악, 정보검색, 온라인구매 등 여러 면에서 사용량이 줄어든 것으로 나타났다.

미국의 시장조사기관 '닐슨' 조사에 따르면, 2018년 2분기 기준 미국 가정의 스마트 스피커 보유비율은 24%에 달해 전 분기보다 22%나 높아졌다. 스마트 스피커를 가진 사람 중 10명 중 4명은 1대 이상을 보유하고 있었고, 사용 장소는 거실(63%), 침실(35%), 주방(28%) 순이었다.

한 주 간 스마트 스피커 이용 행태는 음악을 듣는 ‘오디오 기능 활용’(90%) 다음으로 날씨·교통 등 ‘실시간정보 검색’(81%), 역사적 사실 등 ‘사실정보 검색’(75%) 순으로 나타났다고 이 조사는 전했다. 이제 검색시장에서도 음성비서는 주역이 되고 있는 것이다.

음성검색의 증가는 편리성이 가장 큰 무기다. 손과 몸 하나 까딱하지 않아도 원하는 것을 찾을 수 있으니 편할 수밖에 없다. 이 과정에서 대화형 인공지능은 이용자들의 수많은 음성정보들을 축적하며 인간의 음성과 지능에 차츰 더 다가가고 있다.

AI음성비서 “너 참 쓰임새 많기도 하구나”

AI음성비서를 활용하는 이용자 행태도 다양해지고 있다.

마이크로소프트(MS)의 ‘보이스 리포트’에 따르면, 스마트폰과 스마트 스피커 등 음성비서를 사용하는 응답자중 72%는 음성검색을 사용했고, 응답자의 절반 이상이 스마트 스피커를 이용해 음성검색(35%)을 한 것으로 나타났다. 응답자 중 36%는 TV나 사물인터넷(IoT)에서, 31%는 커넥티드카(31%)에서 각각 음성명령을 이용하고 있었다.

 

SK텔레콤 스마트 스피커 '누구' [출처= SK텔레콤]

 

이 리포트는 2018년 3월부터 6월까지 온라인을 통해 미국, 영국, 캐나다, 오스트리아, 인도네시아를 대표하는 2000명의 응답자를 대상으로 조사한 결과라고 전했다. 애플 ‘시리(siri)’와 구글 ‘어시스턴트(assistant)’ 사용자가 나란히 36%로 가장 많았고, 아마존 '알렉사(Alexa)' 25%, MS ‘코타나(Cortana)' 19%가 그 다음을 이었다.

애플과 구글의 음성비서 사용자가 많은 것은 양사의 모바일폰이 세계적으로 다량 보급돼 있기 때문으로 MS는 풀이했다. 미국내 모바일폰은 약 2억5천만 대, 스마트 스피커는 약 5천만 대에 이른다. 애플 시리와 구글 어시스턴트는 모바일폰에서, 아마존 알렉사는 스마트 스피커에서 각각 시장을 주도하고 있다.

음성비서 활용도는 앞으로도 계속 늘어날 것이다. 종전의 타이핑 방식은 손을 이용해 타이핑해야 하고 오타를 수정해야 하는 등 번거롭다. 음성비서의 이용증가는 향후 음성인식 오류의 개선 정도에 따라 더욱 더 늘어날 전망이다.

지난해 시장조사기관 가트너는 2020년까지 75%의 가구가 적어도 한 개 이상의 스마트 스피커를 보유할 것으로 내다봤다. 음성비서의 보급 초창기라는 점을 고려하면 놀라운 수준이다.

MS자료도 이를 뒷받침한다. 2019년 1월 현재 미국의 45% 가구가 스마트 스피커를 갖고 있고 추가 26%는 구매할 계획도 있었다. 응답자의 41%는 이미 복수의 스마트 스피커 소유자였다. 만족도도 높아서 응답자의 80%가 음성비서 이용에 ‘다소 또는 많이’ 만족한다고 답했다.

스마트 스피커로 홈관리를 하는 응답자도 절반이 넘는 54%였다고 이 보고서는 전했다. 이중 음악(63%), 조명(57%), 보안시스템/카메라(38%), 온도조절(37%) 이용 순이었다. 음성비서를 이용한 검색은 ‘빠른 사실(quick fact) 찾기(68%)’, 길찾기(65%), 업무관련(47%), 상품/서비스(44%) 순으로 많았다.

AI음성비서의 확산, 최대의 관건은 ‘신뢰성’

AI음성비서는 이제 스마트 스피커 형태에서 디스플레이 모양이나 가전제품에 내재화된 구조로 진화하고 있다. 서비스의 방향도 비즈니스와 소비자를 연결하는 B2C 중심 서비스에서 비즈니스와 비즈니스를 연결하는 다양한 B2B 서비스로 확장하고 있다.

기대가 크면 우려도 큰 법이다. 신뢰 부족은 이용자들이 스마트 스피커와 음성비서의 사용을 불안하게 만드는 가장 큰 이유다.

 

[그래픽= 삼성전자 뉴스룸]
[그래픽= 삼성전자 뉴스룸]

 

MS ‘보이스 리포트’에서도 응답자들의 가장 큰 관심사는 음성비서의 신뢰성으로, ‘데이터보안’ 항목이 52%에 이르렀다.

응답자의 52%는 개인정보와 데이터가 안전하지 않다고 생각했고, 24%는 자신의 개인정보가 어떻게 쓰이는지 모른다고 답했다. 36%는 자신의 개인정보나 데이터가 사용되는 것을 원하지 않았고, 적극적으로 자신을 청취하거나 녹음한다고 생각하는 응답자도 41%였다. 14%는 음성비서 너머의 회사를 믿지 못하는 것으로 조사됐다.

특히, 사람들의 일상과 관심사가 반영되는 데이터로 인해 사생활 침해 가능성이 상존한다.

4차 산업혁명의 한 특성이 빅데이터 처리기술이다. 과거 정형화된 데이터만을 처리하던 기술에서 이제는 사람과 사물 등 모든 영역의 사소한 흔적까지 정보가 되는 시대다. 음성비서를 통해 소비되는 소소한 정보들까지 이용자를 식별하고 분석하는 중요한 단서가 될 수 있다.

한국산업기술평가관리원(KEIT) 김정돈 PD는 ‘음성인식 가상비서 기술 동향 및 전망’이라는 보고서에서, “머신러닝 기술이 수집하는 대량의 데이터로 인해 사생활 침해 가능성이 높아진다”고 보고, “스마트스피커의 상시 대기 상태로 인해 상시 침해를 받을 수 있는 프라이버시 로깅(privacy logging) 환경 생성 및 이용자의 사적대화나 검색 내용을 도용하는 음성 무단 점거(voice squatting) 가능성이 높아질 수 있다”고 지적했다.

아울러 “스마트 스피커의 특성상 주변인이 같이 들을 수 있어 전화통화 내용, 구매정보, 계좌정보 등 개인정보 노출과 상대적으로 보안성이 약한 IoT 기기들의 해킹도 고려하여야 한다”고 조언했다.

유통업체가 ‘보이스 커머스’에 투자하는 이유

음성비서 사용이 늘어나면 화면(screen)은 줄어들까? 그렇지 않을 것 같다. 사람들은 항상 눈으로 확인하고 싶은 욕망이 있어서다.

오히려 함께 화면을 제공하면 음성서비스 효과도 더 잘 살릴 수 있다. 디스플레이가 탑재된 스마트 스피커가 속속 등장하는 이유라고 할 수 있다.

 

SK텔레콤은 지난 4월 18일, 디스플레이를 탑재한 보이는 AI 스피커 '누구 네모(NUGU nemo)'를 공개했다. [사진출처= SK텔레콤]

 

음성비서의 성장으로 ‘보이스 커머스(vCommerce)’ 시장도 커지고 있다. 음성비서를 이용하게 되면, 매장 앞에 줄을 선다거나 영업시간에 쫓기거나 전통적인 웹사이트 결제과정의 번거로움을 피할 수 있다.

많은 소비자들이 이미 음성비서를 이용해 상품과 매장 영업시간과 위치 등을 찾고 있다. 음성비서를 통해 구매한 MS보고서 응답자 중 74%는 아주 쉽게 거래를 끝낼 수 있었다고 답했다.

국내에서도 유통업계에는 지난해부터 목소리로 상품 검색부터 주문과 결제까지 완료하는 보이스 커머스가 속속 도입돼 서비스되고 있다. 일례로 현대백화점, 롯데그룹 계열 유통사, K쇼핑, CJ오쇼핑, SK스토아 등은 보이스 커머스를 도입했거나 추가 도입할 예정이다.

‘데이터는 21세기 원유’라고들 한다. 데이터를 모으고 분석하면 고객들의 다양한 성향을 읽고 미래 행동까지 예측할 수 있다.

기업들은 보이스 커머스 도입을 통해 고객서비스를 강화하는 측면도 있지만 고객들의 다양한 구매 데이터를 확보할 수 있다는 장점에 앞다투어 투자하고 있다.

하지만 음성비서를 이용한 쇼핑은 자칫 플랫폼 업체의 상술에 지배당할 수 있다. 항상 키보드나 마우스, 터치를 사용해 이용자가 직접 서핑하며 물품을 비교검색하는 경우와 달리, 음성비서를 통한 쇼핑은 미리 적용된 알고리즘에 따라 인공지능이 알아서 추천하는 방식이기 때문이다. 이미 미국에서는 아마존이 ‘알렉사’를 통해 의도적으로 자사에 유리한 제품을 추천하도록 한다는 의구심이 끊이지 않고 있다.

AI음성비서 생태계, 상생의 지혜가 필요하다

정보통신(IT) 산업의 특징은 ‘승자독식’이다. 음성비서가 만들어가는 세계에서 2등에게도 돌아갈 것은 많지 않다.

음성비서에 대응할 수 있는 인공지능 기반 기술의 서비스를 발굴하려면 대규모 자본 투입이 불가피하다. 자금력이 있는 기업만이 제대로 응대할 수 있고, 서비스 툴도 개발할 수 있다. 자연히 그 혜택도 힘있는 기업에게 쏠릴 수밖에 없다. 쇼핑 등 서비스 시장에 빈익빈 부익부 현상을 가속시킬 수 있다.

 

카카오미니 [사진출처= 카카오]

 

이용자가 편해지는 만큼 피해자도 생겨날 수 있다. 음성인식 기술의 활성화로 인해 일자리를 빼앗기는 영역도 있다. 그런 만큼 공유와 협력 시대에 걸맞는 상생의 지혜가 요구된다.

도도한 변화를 거스를 수는 없다. 우리는 속도와 효율성 그리고 편리성의 프리미엄 시대에 살고 있다. 이제 음악, 날씨, 맛집, 여행정보 검색부터 조명, 가스제어, 냉난방기기와 자동차관리까지 음성비서의 역할은 나날이 커져갈 것이다.

많은 기업이 인공지능 가상비서 경쟁 환경에서 낙오되지 않으려 필사적인 노력을 경주하고 있다. 보다 뛰어난 음성 인식 기술 개발에 매진하는 쪽도 있고, 범용으로 공개된 음성 인식 기술을 기반으로 관련 기기 시장에서의 경쟁 우위를 유지하려 노력하는 쪽도 있다.

대화형 인공지능(AI)을 대중화하는데 기폭제가 된 아마존의 스마트 스피커 ‘에코(Echo)’의 성공사례는 주목할 만하다. 등장 초기, ‘에코’에 탑재된 음성비서 ‘알렉사’는 애플 ‘시리’나 마이크로소프트 ‘코타나’에 비해 늦게 선보인데다 소프트웨어 성능도 그다지 탁월하지 않다는 평을 받았다. 원통형의 밋밋한 디자인도 별로 주목받지 못했다.

그런데도 에코가 이 분야에서 선두주자로 평가받게 된 바탕에는 아이디어와 열정으로 가득한 ‘서드파티(3rd Party)’들과의 폭넓은 생태계 조성에 있었다. 경쟁 스마트 스피커에 비해 소비자들이 활용할 수 있는 응용 애플리케이션을 많이 만들어내면서 시장 장악에 성공했다.

어떤 방향이든 이를 잘 이용해 부가가치를 창조한다면 4차 산업혁명 시대에 수혜자가 될 수 있다. 그러나 편리성을 주는 만큼 프라이버시 침해 등 우려도 도사리고 있다. 음성비서를 지혜롭게 활용하기 위한 공존의 노력이 요구된다.

<자료참조= MS ‘보이스 리포트’, KEIT '음성인식 가상비서 기술 동향 및 전망', KISDI '음성인식 AI비서 시장의 현황과 시사점‘, 삼성전자 뉴스룸>

 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.