기후위기시계
실시간 뉴스
  • G70에 국내 최초 탑재…‘서버형 음성인식’ 체험해보니
-카카오 서버 데이터 기반, 근처 맛집ㆍ주소 검색 3단계로 단축
-주행시 음성인식 저해 요인 최소화…안내멘트 중 음성 검색 가능
-신호 약한 지역에선 검색에 시간 걸려
-“G70 우선 적용 후 신차 확대…해외 출시되는 G70에도 탑재 예정”


[헤럴드경제=박혜림 기자]“길 안내, 헤럴드스퀘어.”

스티어링휠에 달린 ‘음성인식 버튼’을 누른 뒤 안내받고자 하는 상호명을 말로 지시하자 곧바로 서울 용산구 후암동에 위치한 ‘헤럴드경제 본사’가 내비게이션 화면 맨 상단에 떠올랐다. 내비게이션을 켜고 목적지를 입력하는 데 걸린 시간은 불과 5초 남짓. 자음과 모음을 한 자 한 자 입력하기 위해 스크린에 손가락을 가져다 댈 필요도, 여러 개의 주소 가운데 원하는 목적지를 선택하기 위해 스크롤을 내릴 필요도 없었다.

지난 18일 기자는 경기도 화성시에 위치한 현대자동차 남양연구소를 찾아 오는 9월 출시되는 제네시스 ‘G70’에 탑재될 ‘서버형 음성인식’ 기술을 미리 체험했다.
지난 18일 기자는 경기도 화성시에 위치한 현대자동차 남양연구소를 찾아 다음달 출시되는 제네시스 ‘G70’에 탑재될 ‘서버형 음성인식’ 기술을 미리 체험했다. 사진은 서버형 음성인식 검색 인식 진행 과정으로, 서버형 음성인식은 ▷길 안내+상호명 혹은 주소 ▷주소 선택 ▷확인 등 세 단계 만으로 길 안내를 받을 수 있다. [사진=현대자동차]
현대자동차 남양연구소 연구원들이 목소리 데시벨을 측정하는 모습. 이러한 과정을 통해 마이크에 입력되는 소리값을 균일하게 맞춘다. [사진=현대자동차]

서버형 음성인식은 현대ㆍ기아차가 카카오의 인공지능(AI) 플랫폼을 활용해 개발한 것으로, 간단한 상호나 주소만 말해도 조회 결과를 화면에 띄워주는 기술이다. 예컨대 기존의 단말음성인식이 ▷길 안내 ▷시ㆍ도 선택 ▷상호명 음성 입력 ▷주소 선택 ▷확인 등 짧게는 5번의 과정을 거친다면, 서버형 음성인식은 ▷길 안내+상호명 혹은 주소 ▷주소 선택 ▷확인 등 세 단계 만으로 길 안내를 받을 수 있다. 국내에선 G70이 최초이며, 전세계 최초로는 BMW가 ‘뉘앙스’라는 업체와 손을 잡고 북미에서 처음 선보인 바 있다.

이처럼 간편하게 목적지를 검색할 수 있는 이유는 단말음성인식이 입력된 키워드 10만~100만개 안에서만 검색이 가능하다면, 서버형 음성인식은 카카오 서버에 축적된 방대한 양의 데이터베이스를 기반으로 검색을 진행하기 때문이다. 남양연구소 관계자는 “카카오 내비게이션 서버에 쌓인 다양한 사용자의 발화 및 정보 등이 주기적으로 검색 인식률을 높여 나간다”고 설명했다. 그 결과 단말음성인식에서는 불가능한 맛집 안내나 ○○인근 △△ 등의 검색도 가능해진다. 실제로 기자가 “길 안내, 수지구청 근처 빽다방”을 검색하자 용인시 수지구청 인근에 위치한 빽다방 여러 곳이 검색됐으며, “길 안내, 이 근처 맛집”이라는 음성 명령을 내리니 카카오 데이터를 기반으로 거리를 고려한 주변 맛집 수십여 곳을 제시하기도 했다.

또 한 가지 눈여겨 볼 점은 음성으로 주소 검색이 가능하단 점이다. 한국어 숫자는 영어, 일본어 등 여타 외국어와 달리 음절이 짧아 번지 검색 시 인식률이 떨어졌다. 그러나 이날 기자가 서버형 음성인식을 통해 ‘현대연구소로 150번지’를 검색하자 남양연구소가 즉각 검색됐다. 이 역시도 서버에 축적된 방대한 자료 덕분이라고 남양연구소 관계자는 설명했다.

언뜻 듣기엔 카카오 내비게이션을 자동차에 이식한 정도로 보이지만, 면밀히 살펴보면 휴대전화를 기반으로 하는 카카오 내비게이션 보다 운전자의 편의에 최적화돼 있다.

풍절음과 노면음 등 고속 주행 시 음성인식률을 저해할 수 있는 요인이 작용해도 오버헤드 콘솔에 달려있는 마이크가 소음을 인식해 이를 배제하도록 했다. 일반인의 상식으론 음성인식률은 마이크의 성능과 관계가 있을 것처럼 여겨지지만, 남양연구소 관계자는 “마이크 성능보단 녹음 조건이 좋아야 하며, 발화를 했을 때 음의 잘림이나 과잉이 없어야 인식률이 높아진다”고 말했다.

또 기존에는 음성으로 검색을 할 때에는 “삐 소리 후 말씀하세요”라는 안내메시지가 나온 뒤에야 음성인식이 가능했지만, 현대차는 안내메시지가 나오는 중에도 음성을 인식하도록 했다. 안내메시지를 사전에 프로그램에 인식시킨 후 해당 소리를 제거하는 방식으로 가능케 했다.

물론 약점도 있다. 서버 기반이기 때문에 통신 연결이 필수적인 만큼 신호가 약한 지역에선 검색에 시간이 걸린다. 이에 현대차 연구원들이 일부러 신호가 약한 지역을 찾아다니며 시험을 거듭했다고 연구소 관계자는 귀띔했다.

사용자의 목소리를 저장해 발화하는 음성인식 기술을 1세대, 사전 녹음이 없어도 인식이 가능한 수준을 2세대로 본다면 서버 연동형 음성인식은 2.5세대와 3세대 사이라는 게 전문가들의 중론이다. 연구소 관계자는 “향후 사용자가 발화한 것이 자연스레 인식되고, 자연어 처리까지 가능해지는 게 음성인식 기술의 궁극적인 목표”라면서 “나아가 사용자의 의도 파악까지 된다면 그것이 인공지능(AI)이라 볼 수 있을 것”이라고 말했다.

일단 현대차는 G70에 서버형 음성인식 기술을 탑재한 뒤 이를 순차적으로 신차 등에 적용할 방침이며, 내년 초 북미에서 출시되는 G70의 경우엔 해외 업체와 손을 잡고 유사한 기술을 적용한다는 계획이다. 또 음성인식 기술을 기반으로 한 문자메시지 전송 서비스 등도 검토 중이다.

rim@heraldcorp.com




맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크