9개 언어 음성인식기 개발

국내 연구진이 한국어뿐 아니라 영어, 일본어, 중국어 등 9개 언어 음성을 인식할 수 있는 기술을 개발했습니다.

한국전자통신연구원(ETRI)은 일상생활에서 쓰는 대화를 최대 95%까지 인식해 문자로 변환할 수 있는 기술을 개발했다고 18일 밝혔습니다.

최근 가전제품 제조업체부터 인터넷 포털, 이동통신 업체, 은행 등까지 음성인식 기술을 스마트 가전, 인공지능 검색, 인공지능 뱅킹 등에 활용하기 위한 시도가 활발히 진행되고 있습니다.

하지만 인식률이 생각보다 높지 않아, 기기를 직접 제어하는 것보다 불편하다는 지적도 나옵니다.

연구팀은 인공지능 학습 방식인 딥러닝 기술을 비롯해 대용량 데이터 자동 정제기술, 다국어 발음 생성기술 등 다국어 음성언어처리 기술을 적용한 음성인식기를 개발했습니다.

9개 국어에 이르는 다국어 음성인식기를 개발한 것은 이번이 처음입니다.

구글과 비교하면 한국어 인식률은 96%로 우위에 있고, 다른 언어에 대한 인식률은 90∼95% 정도로 비슷한 수준이라고 ETRI는 전했습니다.

통역 서비스는 물론 인공지능 비서, 방송 자막화, 콜센터 서비스 등에 활용할 수 있을 것으로 기대됩니다.

ETRI는 자체 개발한 자동통역 애플리케이션 “지니톡”(Genie Talk)에 9개 언어 음성인식 기술을 적용, 내년 평창 동계올림픽 기간 외국인을 대상으로 서비스할 예정입니다.

일본 도쿄올림픽이 열리는 2020년까지는 서비스 대상 언어를 14개로 늘릴 방침입니다.

ETRI 김상훈 박사는 “국내 이동통신업체와 기술 이전을 논의 중”이라며 “앞으로 동남아어, 힌디어 등 다른 언어로도 서비스를 확대할 계획”이라고 말했습니다.
[보도정보센터]

작성자없음  
  • 작성자없음  
  •  
  •  

프로그램:

전체뉴스

의견쓰기