실시간 뉴스



네이버 AI 스피커, 유인나 목소리로 말한다


4시간의 녹음 분량으로 자연스러운 합성음 재현해내는 HDTS 기술 자체 개발

[아이뉴스24 민혜정 기자] 네이버의 인공지능 플랫폼 클로바(Clova)가 탑재된 스마트 스피커와 클로바 앱에서 배우 유인나의 목소리를 통해 다양한 서비스를 만나볼 수 있게 됐다.

네이버 클로바는 자체 연구개발한 음성합성기술 nVoice의 HDTS 기술을 활용해 클로바를 통한 모든 음성 답변을 유인나 씨의 목소리로 접할 수 있도록 지원한다고 30일 발표했다.

HDTS(Hybrid Dnn Text-to-Speech)는 약 4시간 만의 녹음으로 사람의 목소리와 비슷하게 자연스러운 합성음을 만들어내는 세계 최고 수준의 음성합성기술이다.

특히 이번에 활용된 HDTS의 기술은 단순히 녹음한 음원을 제공하는 방식이 아닌, 단 4시간의 녹음으로 사람의 목소리와 가깝게 자연스러운 합성음을 재현해낼 수 있다. 유인나의 일부 음성 데이터 만으로, 클로바가 제공하는 모든 합성음을 유인나 씨의 실제 음성과 비슷한 억양과 톤으로 만나볼 수 있는 셈이다.

유인나 목소리의 서비스 적용은 클로바앱에서 설정 가능하며, 스마트 스피커의 경우 "유인나 목소리로 바꿔줘"처럼 음성 명령을 통해서도 만나볼 수 있다.

네이버는 배우 유인나 씨의 라디오 DJ 이력을 바탕으로, 이에 특화된 '유인나의 연애상담' 스킬(skill)도 새롭게 출시한다. 클로바 스마트 스피커 혹은 클로바앱에서 "유인나 연애상담 시작해줘"라고 명령하면 연애상담 챗봇이 시작되며 "새로운 데이트 코스 추천해줘", "소개팅에서 어떤 얘기해?", "애정표현 어떻게 해?"와 같은 질문을 통해 유인나의 목소리로 소개팅, 썸, 이별 등에 관한 다양한 연애 상담을 경험할 수 있다.

김재민 네이버 서치앤클로바 음성합성 리더는 "클로바가 연구개발한 HDTS 기술은 최소 40시간 이상의 녹음 시간이 필요한 UTS(Unit-selection Text-to-Speech; 합성단위 선택방식) 기술보다 한층 고도화된 기술로써, 글로벌 IT기업들이 실제 서비스에 활용하고 있는 음성합성기술 대비 우수성을 갖췄다"며 "기존 기술 대비 필요한 데이터나 시간 등이 줄어든 만큼, 향후 보다 넓은 범위의 환경에서 해당 기술이 활용될 기회가 늘어날 것으로 기대한다"고 강조했다.

민혜정기자 hye555@inews24.com







alert

댓글 쓰기 제목 네이버 AI 스피커, 유인나 목소리로 말한다

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
포토뉴스