[트렌드탐구] '음성+인공지능(AI)+스피커'가 만났을 때
[트렌드탐구] '음성+인공지능(AI)+스피커'가 만났을 때
  • 이필원 기자
  • 승인 2019.05.19 10:42
  • 댓글 0
이 기사를 공유합니다

AI스피커 국내시장, SK텔레콤 '누구' 오픈 후 빠르게 성장
이통3사, 네이버, 카카오, 구글 이어 삼성, 아마존도 기대감

[메가경제 이필원 기자] 마침내 삼성전자의 '갤럭시 홈(Galaxy Home)' 출시가 카운트다운에 들어가는 등 국내 인공지능(AI) 스피커 시장이 후끈 달아오르고 있다.

음성을 매개로 명령을 내리고 대화를 나눌 수도 있는 AI 스피커는 지난 2014년 아마존이 최초의 음성인식 AI스피커 ‘에코(Echo)'를 출시한 이후 구글 등 글로벌 IT 공룡들이 자사의 음성인식 기반의 가상 비서인 '인공지능(AI) 음성비서(Voice Assistant)'를 탑재한 스피커를 잇따라 출시하며 새로운 메가트렌드를 형성해왔다. 

지난해말 KT그룹의 디지털 미디어렙 나스미디어가 펴낸 ‘2019 디지털 미디어&마케팅 전망’에 따르면 올해 국내 AI스피커 보급 대수는 800만 대에 이를 것으로 예측됐다. 한 집에 한 대씩 보급된다고 가정하면 전체 가구 2천여만 가구의 약 40%가 AI스피커를 보유하는 셈이 된다. AI 스피커의 대중화 시대가 활짝 열린 것이다.

AI 스피커는 국내에 첫 도입된지 1년여만인 2017년 100만대 수준에서 지난해는 300만대로 껑충 뛰어올랐고, 올해는 그 보급 추세가 더욱 더 가파르게 형성될 전망이다.

국내 AI스피커 시장의 문을 연 SK텔레콤과 KT

 

SK텔레콤은 2016년 8월 인공지능(AI) 음성비서 '누구'가 탑재된 전용 스피커를 출시하며 국내에 인공지능 스피커 시장을 열었다. [사진 출처= SK텔레콤]

 

글로벌 ICT 기업들은 미래 성장을 위해 앞다투어 인공지능 기술을 개발하고 상용화를 서두르며 일상에 적용해왔다.

AI 스피커는 음성 기반 인공지능 가상 서비스인 'AI 음성 비서‘와 한 몸이나 다름없다. 애플의 '시리(Siri)'를 비롯, 아마존의 '알렉사(Alexa)', 구글의 '구글 어시스턴트(Google Assistant)', 마이크로소프트의 '코타나(Cortana)', SK텔레콤의 '누구(NUGU)', KT의 '기가 지니(GiGA Genie)', 삼성의 '빅스비(Bixby)', 네이버의 '클로바(Clova) 등이다. AI 음성비서 뒤에는 장소와 시간을 불문하고 개인 서버처럼 기능하는 클라우드 기술이 받치고 있다.  

AI 스피커는 첨단 인공지능과 음성인식 기술이 오랜 역사를 갖고 있는 입출력 장치인 스피커와 만나 만들어내는 신기술의 집약체다. 음성을 통해 고객이 원하는 바를 파악해 음악 스트리밍 서비스나 스마트홈과 연동하고, TV나 조명 등 가전기기를 제어하며, 음악 추천, 날씨 정보제공, 스마트폰 위치 찾기 등 이용자에게 다양한 정보와 편의를 제공하고 있다.

국내 AI 스피커 시장은 SK텔레콤이 2016년 9월 ‘누구’를 처음 내놓은 이후 KT의 ‘기가 지니’와 네이버의 ‘웨이브’, 카카오의 ‘카카오머니’ 등이 잇따라 출시되며 빠른 성장세를 보여왔다. 여기에 구글이 한글화된 '구글홈'을 내놓으며 국내 AI 스피커 시장은 글로벌 시장화가 이루어졌고, 곧 삼성전자의 ‘갤럭시홈’도 출시될 예정이어서 각축전은 한층 더 치열해질 전망이다. 

 

삼성전자는 지난해 8월 뉴욕에서 열린 '갤럭시 노트9 언팩' 행사에서 AI 스피커 '갤럭시홈'을 선보여 주목을 끌었다. [사진출처= 삼성전자]
삼성전자는 지난해 8월 뉴욕에서 열린 '갤럭시 노트9 언팩' 행사에서 AI 스피커 '갤럭시홈'을 선보여 주목을 끌었다. [사진출처= 삼성전자]

 

AI 음성비서 ‘알렉사’를 탑재한 아마존의 AI 스피커 ‘에코(Echo)’도 한국시장 출시 가능성이 스멀스멀 피어오르고 있다. 에코는 아직 한국시장에 정식 출시되지는 않았지만 이미 국내 언론사 뉴스를 음성으로 들을 수 있고, 국내 기업들도 적극 활용하고 있는 상황이다. 

국내 AI 스피커의 선두주자는 SK텔레콤이다. SK텔레콤은 지난 2016년 8월 31일 AI 음성 비서 ‘누구(NUGU)’가 탑재된  전용 스피커를 처음 공개했다.

친구, 연인, 가족, 비서 등 고객이 원하는 누구라도 될 수 있다는 의미를 지닌 ‘누구’는 이용자가 스피커에 대화하듯 말하면 고도화된 음성인식 기술과 인공지능 엔진을 통해 고객이 원하는 바를 파악해 수행하는 서비스임을 내세우며 새바람을 몰고 왔다.

당시 SK텔레콤은 “‘누구’를 시작으로 음성인식과 인공지능이 생활 전반을 획기적으로 바꿔가는 ‘AI 대중화 시대’를 열어가겠다”고 포부를 밝혔다.

KT는 2017년 1월 세계 최초로 IPTV와 인공지능을 융합한 형태인 ‘기가 지니(GiGA Genie)’를 내놨다. KT는 출시 당시 “기가 지니는 대부분 가정에서 보유하고 있는 TV에 기반한 만큼 누구나 쉽게 인공지능 서비스를 이용하는 ‘홈 인공지능 시대’를 여는 서막이 될 것으로 기대한다”고 밝혔다.

기가 지니는 KT융합솔루션 브랜드인 기가(GiGA)와 요술램프 지니(Gene)를 결합한 이름으로, 스피커와 카메라 등 똑똑한 기능을 갖춘 IPTV 세톱박스의 이름이자 AI 기반의 홈 비서 서비스를 가리킨다.

KT는 TV 및 음악 감상, 일정관리, 교통안내, 홈 IoT기기 제어, 영상통화 등 스마트한 기능을 두루 갖췄다고 설명했다. 출시 당시 KT는 “기존 AI 스피커가 음성인식 위주의 '청각’에 초점을 맞춘 것에 비해 기가 지니는 스피커와 함께 TV 연동과 카메라 내장으로 '시청각’ 기반의 인공지능 서비스를 제공한다”고 강조했다.

네이버·카카오 양대 포털사이트의 '캐릭터 경쟁'

우리나라를 대표하는 양대 포털사이트인 네이버와 카카오도 AI스피커 시장에서 격돌 중이다. 특히, 네이버와 카카오는 자사의 인기 캐릭터를 앞세운 AI 스피커 ‘프렌즈(Friends)’와 ‘카카오미니(Kakao Mini)’를 출시하며 완판 신화를 이끌어내기도 했다.

 

'카카오미니'에 휴대성을 더한 신제품 '카카오미니C' [사진출처= 카카오] 

 

프렌즈는 스피커 본체 자체를 캐릭터 디자인으로 제작했고, 카카오미니는 스피커 본체에 캐릭터 피규어를 얹힌 형태로 소비자를 유혹했다. 두 모델 모두 귀여운 인기 캐릭터의 즐거움도 함께 맛볼 수 있는 차별화된 AI 스피커로 주목받았다.

우선 네이버는 2017년 8월, AI 음성 비서 ‘클로바(Clova)'를 탑재한 스마트 스피커인 ‘웨이브(WAVE)'를 내놓았다. 오디오 중심의 디바이스 성능과 콘텐츠를 중점적으로 구현한 웨이브는 음악 추천, 실시간 정보검색, 어린이를 위한 동요와 동화 콘텐츠, 외국어 통번역, 뉴스를 챙겨주는 모닝 브리핑 등을 앞세웠다. 웨이브는 2017년 8월 11일부터 네이버 뮤직 단독 이벤트를 통해서만 한정적으로 출시했지만 반향은 컸다.

네이버는 웨이브에 이어 2017년 10월 26일에는 ‘프렌즈’를 출시했다. 네이버와 자회사인 라인이 개발한 프렌즈는 클로바가 탑재된 두 번째 인공지능 스피커다. 특히 프렌즈는 라인프렌즈의 인기 캐릭터 ‘브라운’과 ‘샐리’를 모티브로 만들어 큰 호응을 얻었다. 네이버는 지난해 5월에는 기존 프렌즈 스피커보다 작고 가벼운 ‘프렌즈 미니(Friends Mini)'도 출시해 좋은 반응을 얻었다.

카카오는 2017년 11월 7일, 자체 개발한 인공지능 플랫폼인 ‘카카오 아이(Kakao I)’를 탑재한 AI 스피커 ‘카카오미니’로 AI 스피커 시장에 도전장을 냈다. 카카오 미니에는 음악, 시각, 대화, 추천, 번역 등 AI 핵심 엔진 기술이 결합되어 있다. 카카오 미니는 카카오프렌즈인 ‘라이언’과 ‘어파치’ 등 자사의 인기 피규어를 앞세웠다. 

카카오 미니는 출시 당일 첫 판매를 시작한지 9분만에 5000대 완판 기록을 세웠고, 같은달 28일 2차 판매에서도 26분만에 2만5000대가 모두 판매되는 진기록을 세웠다. 

카카오는 지난해 8월 기존 AI 스피커 '카카오미니'에 휴대성을 더한 신제품 '카카오미니C'도 출시했다. 카카오미니C는 별매 충전식 배터리인 '포트블팩'을 이용하면 최대 5시간 연속으로 음악을 재생하고 10시간 연속 대기할 수 있다. 카카오는 다른 장소에서도 카카오미니에 음성 명령을 내릴 수 있는 '카카오미니 보이스 리모트'도 내놨다.  

LG유플러스는 통신 3사 중에서는 마지막으로 2017년 12월 네이버 클로바를 탑재한 AI서비스인 ‘유플러스(U+)우리집AI'를 내놓았다. LG유플러스의 고품질 인공지능 서비스와 네이버의 넓은 유통망이 결합돼 탄생했다는 점에서 새로운 상생의 모델로 주목받았다. 유플러스우리집AI는 유플러스TV VOD 검색을 비롯, 스마트홈 제어, 네이버 검색, 쇼핑 등의 콘텐츠를 내세웠다.

구글의 국내 진격과 삼성전자의 비상 채비

글로벌 AI 스피커 공룡들의 국내 시장 진출 기세도 거세다.

구글은 지난해 9월, AI 비서 ‘구글 어시스턴트’를 기반으로 하는 AI 스피커인 ‘구글홈(Google Home)’과 ‘구글홈 미니(Google Home Mini)' 2종을 국내에 출시했다. 구글홈은 지난 2016년 처음 출시된 이후 아마존의 ’에코‘와 함께 미국 AI 스피커 시장을 양분하고 있는 제품이다.

 

구글은 지난해 9월 18일 AI 스피커 '구글홈'을 국내에 공식 출시했다. [사진= 연합뉴스]
구글은 지난해 9월 18일 AI 스피커 '구글홈'을 국내에 공식 출시했다. [사진= 연합뉴스]

 

구글홈은 그동안 한국어가 지원되지 않아 국내 출시를 미뤄왔지만 2017년 9월 ‘구글 어시스턴트’의 한국어 지원 개시와 함께 출시가 예견돼 왔다. 구글은 강력한 사물인터넷(IoT) 연동과 다중언어 기능 등을 차별화된 장점으로 내세우고 있다.

아마존의 ‘에코(Echo)’ 역시 국내 시장 진출 가능성이 대두되고 있어 향후 국내 인공지능 스피커 시장에서의 경쟁은 더욱 뜨거워질 전망이다.

아마존의 AI 음성 비서인 ‘알렉사(Alexa)’는 아직 한국어를 지원하지 않고 있어 ‘에코’의 국내 출시일정도 현재로서는 가늠하기 어렵다. 하지만 아마존은 이미 한국어 뉴스 브리핑 서비스를 제공하고 있어 향후 국내 시장 진출을 배제할 수 없다.  

최근 가장 핫한 AI 스피커 이슈는 바로 한국을 대표하는 삼성전자가 내놓을 모델과 관련된 전망이다.

삼성전자는 지난해 8월 뉴욕에서 열린 ‘갤럭시 노트9 언팩’ 행사에서 인공지능 스피커 ‘갤럭시홈(Glalaxy Home)’을 전격 공개했다. 이날 삼성전자는 스피커를 부각시킨 느낌을 준 갤럭시홈과 함께 AI 음성 비서인 ‘빅스비(Bixby)'의 고도화 버전인 ‘뉴 빅스비(New Bixby)’도 함께 소개했다. 삼성전자는 그간 빅스비 서비스를 확대하면서도 스피커를 출시하지 않아 궁금증을 불러일으키던 터였다.

삼성전자는 지난 2017년 3월 전장사업과 오디오 사업의 강화 목적으로 미국의 전장 전문기업인 하만(Harman)의 인수를 마쳤다. 하만은 JBL, 하만카돈, 마크레빈슨, AKG, 렉시콘 등 프리미엄 오디오 브랜드를 보유하고 있는 기업이다. 

세계 최고의 오디오로 합류시킨 삼성전자가 내놓을 AI 스피커가 어떨지 시선이 쏠리는 것은 어쩌면 당연하다. 지난해 갤럭시노트9 언팩 행사에서 첫선을 보인 갤럭시홈은 하부에 다리가 셋 달린 항아리 모양으로 하만의 AKG 스피커 6개를 장착했으며, 통합 플랫폼으로 확장된 ‘빅스비’를 기반으로 하고 있다. 삼성전자는 인공지능 스피커 ‘갤럭시홈 미니’를 곧 출시할 전망이다. 

◆ '듣는' AI 스피커에서 '보이는' AI 스피커 시대로

최근 해외 시장에서는 지난 2017년 아마존 ‘에코 쇼(show)’가 출시된 이후 구글 등 글로벌 업체들이 디스플레이가 탑재된 AI 스피커를 연이어 출시하는 등 관련 시장이 빠르게 확산하고 있다.

 

SK텔레콤은 지난 4월 18일, 디스플레이를 탑재한 보이는 AI 스피커 '누구 네모(NUGU nemo)'를 공개했다. [사진출처= SK텔레콤]

 

올들어 국내에서도 인공지능(AI) 스피커가 보이는 형태로 진화하고 있다. 그동안 누구, 기가지니, 웨이브, 카카오미니, 갤럭시홈, 구글홈에는 디스플레이 화면이 없었다. 외형은 음성 중심의 스피커 디자인에 치중했다. 이같은 AI 스피커들은 이용자의 음성을 인식해 피드백을 주는 1차원적인 소통 서비스를 제공했다.

하지만 이제는 듣기만 하던 AI 스피커에서 보이는 AI 스피커 시대를 맞고 있다. 디스플레이가 탑재된 AI 스피커들이 속속 등장하고 있는 것. 음성만이 아니라 아니라 영상을 통한 사용자인터페이스(UI)나 사용자경험(UX)을 제공하는 방향으로 진화하고 있다. 디스플레이가 달린 인공지능 스피커는 음성과 함께 화면으로 직관적인 설명이 가능하다는 장점이 있다.

음성만의 AI스피커를 1세대 AI 스피커라면 디스플레이를 탑재한 AI 스피커는 2세대라고 할 수 있다. 보이는 AI 스피커는 이용자의 니즈에 보다 입체적으로 반응할 수 있다.

보이는 AI 스피커 역시 SK텔레콤이 지난달 첫 테이프를 끊었다. SK텔레콤은 소리 외에 화면으로도 정보를 전달하는 디스플레이 탑재형 AI 스피커 ‘누구 네모(NUGU nemo)'를 출시했다.

SK텔레콤은 ‘누구 네모’가 기존 AI 스피커의 시각 제한성을 극복한 국내 최초의 가정용 인공지능 디스플레이 스피커라고 정리했다. 아울러 “7인치 디스플레이를 탑재한 ‘누구 네모’의 출시로 소비자들은 AI 스피커가 전달하는 정보를 보다 직관적이고 정확하게 확인하는 것은 물론, 사용 편의가 대폭 향상될 것으로 기대된다”고 설명했다.

SK텔레콤은 특히 어린이들의 디스플레이 사용에 따른 시력 저하 문제를 영상인식 기술을 통해 해결했다고 강조했다. 영상을 보고 있는 아이가 화면 가까이 올 경우, 적절한 거리에서 시청할 수 있도록 VOD(주문형비디오)를 자동으로 멈추고 ‘뒤로 가기’를 안내한다.

‘누구 네모’는 올해 세계적 디자인 공모전인 'iF 디자인 어워드'에서 '제품 디자인상'을 수상한 제품이다. 누구 네모는 디스플레이 화면에서 ▲노래 가사 확인 ▲실시간 환율정보 ▲증권정보 ▲운세 ▲지식백과 사전 ▲한영사전 등 다양한 정보를 확인할 수 있다고 설명한다. 기존의 누구와 같이 음악 감상·날씨 확인·일정관리 등 30여개 생활밀착형 기능도 제공한다.

‘누구 네모’에는 최적의 울림통을 가진 JBL스테레오 스피커가 탑재됐다. JBL스테레오 스피커는 전 음역을 표현할 수 있는 2개의 10W 풀레인지 드라이버가 적용돼 콤팩트한 사이즈에서도 최대 20W 출력으로 최고의 음질을 선보인다고 설명했다.

 

곧 출시될 것으로 보이는 삼성전자의 '갤럭시홈'은 어떤 장점으로, 어느정도의 영향력을 발휘할까? [사진= 연합뉴스] 
곧 출시될 것으로 보이는 삼성전자의 '갤럭시홈'은 어떤 장점으로, 어느정도의 영향력을 발휘할까? [사진= 연합뉴스] 

 

KT는 화면과 셋톱박스를 결합한 ‘일체형 인공지능 TV’로 맞불을 놓았다. KT는 지난달 29일 기자설명회를 열고 국내 최초로 일체형 인공지능 TV ‘기가지니 테이블TV'를 공개했다.

기가지니 테이블TV는 개인용 TV로도 활용할 수 있으며, 디스플레이 크기는 11.6인치이고, 유선랜 없이 와이파이 연결만으로 이용할 수 있다. 기존 기가지니처럼 하만카돈의 프리미엄 스피커를 탑재했다.

SK텔레콤과 KT가 잇따라 보이는 AI 스피커를 출시하며 또 다른 경쟁구도를 형성하는 가운데 구글도 상반기 중 디스플레이가 탑재된 AI 스피커 ‘구글홈 허브(Google Home Hub)’를 출시할 것으로 알려져 귀추가 주목되고 있다.

구글홈 허브는 지난해 10월 미국 현지에서 출시됐으며, 7인치 화면을 장착하고 무게는 480g이다. 음성만으로 엔터테인먼트를 즐길 수 있고 크롬캐스트가 연결된 TV에서 동영상을 스트리밍할 수 있다.

AI 스피커가 빠르게 침투하는 이유

AI 스피커는 스마트폰 내에 머물렀던 음성비서를 가전과 사물인터넷(IoT) 등 다양한 디바이스로 확장하며 플랫폼으로 자리 잡아가고 있다. 특히 가전제품을 비롯한 집 안의 모든 장치를 연결하고 제어하는 스마트홈의 고도화에 기여하며 '커넥티드홈'을 구현하고 있다. 

 

KT는 지난 4월 29일 국내 최초 일체형 AI TV '기가지니 테이블TV'를 공개했다. [사진출처= KT]

 

인공지능 스피커가 세계적으로 인기를 얻고 있는 이유는 무엇일까? 바로 ‘음성’이라는 도구의 장점에 기인한다.

음성은 인간이 가진 가장 본질적이며 유용한 의사전달 도구이다. 그러한 ‘음성’을 이용한 AI 스피커는 인간과 컴퓨터의 상호작용에 가장 이상적인 소통 창구가 되고 있다.

하지만 ‘자연어’인 음성을 컴퓨터로 인식해 소통하는 것은 고도의 기술을 요한다. 음성인식 관련 연구는 지난 1954년 IBM과 조지타운대학이 공동으로 참여한 기계번역 기술 개발 프로젝트까지 거슬러 올라가지만 방대한 음성데이터 처리를 위한 컴퓨터의 연산 능력 부족과 낮은 인식률로 인해 2000년 중반까지만 해도 음성인식 기술은 널리 사용되지 못했다.

그러던 것이 2011년 10월 아이폰4S에 ‘시리(Siri)'가 탑재되면서 본격적인 상용화의 길을 걷기 시작했다. 이후 2013년 구글이 음성검색 기능인 ’오케이 구글(OK Google)' 서비스 지원을 시작하며 음성검색 빈도가 크게 증가하기 시작했고, 이후 인공지능 비서인 ‘구글 어시스턴트(Google Assistant)’로 상향되며 AI 스피커의 시대가 만개했다.

음성을 도구로 사용하는데 가장 편하면서도 유용한 입출력 장치는 마이크와 스피커다. 특히 스피커는 음성인식 기술 구현에 가장 핵심적인 입출력 장치만으로 이루어져 있어 데이터 수집 측면에서도 스마트폰이나 TV보다 훨씬 효율적이다. 인공지능 기반 플랫폼과 스피커가 결합한 AI 스피커가 줄줄이 탄생한 시대적 배경이다.

4차 산업혁명 시대는 각종 전자제품과 가전, 시설이 서로 통신을 주고 받는 사물인터넷(IoT)의 영역이 무한대로 확장하는 시대다. 이와 함께 이를 제어하는 허브 역할을 하는 플랫폼이 필요해졌다.

음성을 이용한 AI 스피커는 사물인터넷 시대에 유용한 기기제어 플랫폼으로도 영역을 확대해 왔다. 특히, 스마트홈을 통제할 핵심 기기로 그 편의성과 유용성을 인정받으며 그 활용폭을 빠르게 넓히고 있다. 과연 음성인식 AI 비서나 스피커가 융합한 AI 스피커 시장은 어디까지 진화할지, 그리고 누가 진정한 승자가 될지 주목된다. <자료참조= 정보통신정책연구원 '음성인식 AI 비서 시장의 현황과 시사점'>

 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.