사람보다 더 사람 같은 AI 목소리, 어떻게 만들까요?

female-programmer-scanning-her-face-with-biometric-security-technology-virtual-screen-digital-remix

성우가 필요하신가요?

타입캐스트의 400개가 넘는 캐릭터 중 내 콘텐츠에 가장 잘 어울리는 목소리와 가상 연기자를 선택해 보세요.

추천 글

인공지능의 활용도가 다각화되는 시대, AI의 영역은 어디까지 확장될지 그 귀추가 주목되고 있습니다.

특히 음성과 영상 분야에서의 AI의 활용도는 점점 더 높아지고, 우리 주변에서도 AI를 쉽게 만나볼 수 있습니다.

사람보다 자연스러운 AI 목소리의 등장

voice-assistant-technology-with-scientist-holding-transparent-tablet-digital-remix
사람보다 더 사람 같은 AI 목소리가 속속들이 등장하고 있습니다.

유튜브에서 영상 시청을 하다 보면 여러 채널의 내레이션 목소리가 같은 경우를 목격하신 적이 있을 겁니다. 한 사람의 성우가 여러 채널에서 활동을 하는지 의문을 가지셨겠지만, 사실은 AI 목소리입니다.

AI 목소리 만들기는 게임, 뉴스, 애니메이션, 교육 등 다양한 콘텐츠 채널에서 발견할 수 있는데요. 성우 대신 활용하고 집에서 쉽게 AI 목소리를 자유자재로 조절할 수 있다는 점에서 활용도가 높아진 것이죠.

특히 어느 누구든지 크리에이터에 도전하는 요즘, 자신의 목소리를 노출하지 않고도 시청자와 대화하듯 콘텐츠를 제작할 수 있어 많은 사람들이 찾고 있습니다.

간단한 AI 목소리 출력의 비결, TTS

digital-mixer-recording-studio-with-computer-recording-sounds-music
TTS를 이용하면 스튜디오 녹음 없이도 자연스러운 음성을 만들어낼 수 있습니다.

그렇다면 AI 목소리는 어떻게 출력되는 걸까요? AI 목소리는 TTS 기술을 통해 만들어집니다.

TTS란 컴퓨터의 프로그램을 통해 사람의 목소리를 구현해내는 것을 뜻하며, 성우 없이도 거의 모든 단어와 문장을 쉽게 모사할 수 있다는 특징이 있습니다.

이세돌 9단을 이긴 알파고를 개발한 구글 딥마인드 산하의 웨이브넷은 머신러닝의 일종인 딥러닝 기반의 TTS 시스템을 제작한 바 있는데요. 연구를 거듭한 결과 성우가 직접 읽은 문장보다 더욱 자연스러운 문장을 구사할 수 있는 수준에 이르렀다고 합니다. 일반인을 대상으로 실험한 결과 어느 것이 성우의 목소리인지 구별하기 어려울 정도였다고 합니다.

음성합성 기반 서비스의 등장

이렇게 음성합성 기술을 기반으로 한 서비스들은 사람들에게 다양한 편의성을 선사하며 대중화되었습니다. 해외에서는 리드스피커나 브라우즈어라우드와 같은 웹기반 서비스 솔루션이 웹사이트를 읽어주는 TTS 프로그램으로 대중화되었고, 일본에서는 지방자치단체 홈페이지의 70% 이상이 TTS 음성 서비스를 제공합니다.

국내의 경우 지하철 신분당선에서는 TTS 목소리를 활용하여 안내 방송을 하고 있습니다. 여러 디스코드TTS 또한 사람들이 간단히 활용할 수 있는 밈이 되었고요. 수년 전만 해도 인공지능의 목소리는 사람의 목소리와는 분별력 있을 만큼 어색하다고 평가되었지만, 이제는 다릅니다. 사람이 말하는 문장의 높낮이, 감정, 길이까지 섬세하게 조정하여 소리로 출력할 수 있기 때문이죠.

집에서 쉽고 편하게 AI 목소리 만들기

young-asian-lady-fashion-designer-using-mobile-phone-receiving-purchase-order-show-clothes-live-streaming
AI 목소리를 활용해 크리에이터 활동을 펼칠 수도 있습니다.

그렇다면 누구나 인공지능 목소리를 자유자재로 활용할 수 있을까요? 정답은 ‘그렇다’입니다.

한국을 대표하는 AI 목소리 서비스 ‘타입캐스트’는 간단한 편집만으로 누구나 성우가 말하는 것 같은 퀄리티의 음성을 제작할 수 있는데요.

전문 성우가 녹음한 목소리를 기반으로 AI 목소리를 제작했기 때문에 감정 표현, 운율, 속도 조절까지 능숙합니다.

활용방법 또한 간단합니다.

텍스트로 된 문장을 입력한 후 원하는 AI 성우를 선택해 음성을 조절하면 되는데요. 음성 제작이 다 끝났으면 음성 파일을 통합본이나 문장별로 다운로드받을 수 있습니다. 현재 한국어, 영어, 일본어, 스페인어 네 가지 언어를 지원해 다국적으로 활용도 가능하며, 영어 더빙에 최적화된 AI 성우도 마련되어 있습니다.

타입캐스트는 AI 목소리를 사용하길 원하는 개인, 기업, 공공기관, 단체 등 누구나 쉽고 편리하게 사용할 수 있다는 특징이 있습니다.

AI 목소리에서 더 나아가 가상 인간까지

designer-using-transparent-digital-tablet-screen-futuristic-technology
‘나’를 대신할 새로운 매개체, 가상 인간을 활용하면 더 자연스럽게 영상 콘텐츠를 제작할 수 있습니다.

타입캐스트에서는 AI 목소리뿐만 아니라 가상 인간 비디오 기능을 이용할 수 있습니다.

원하는 가상 인간을 선택하여 비디오 파일을 저장해 여러 플랫폼에서 활용이 가능하며, 짧은 클립 공유로 게시물이나 타인에게 공유할 수도 있습니다.

실제로 타입캐스트의 가상 인간은 유튜브 숏츠나 틱톡 등 다방면에서 많이 활용되고 있습니다. 특히 사용자가 작성한 문장에 맞춰 얼굴 표정이 변화하고, 입 모양도 문장에 맞춰 달라집니다.

타입캐스트의 가상 인간 에밀리가 등장하는 유튜브 콘텐츠

타입캐스트는 자연스러운 음성 표현을 위해 말하는 속도, 끊어서 말하기, 목소리별 스타일 변동, 다양한 감정 추가 등 여러 가지 옵션을 제공해 사람보다 더 사람 같은 AI 목소리와 가상인간 서비스를 제공하고 있습니다.

이러한 AI 목소리와 가상인간 서비스는 평소 좋아하는 책이나 영화 및 드라마 각본, 영상에 더빙할 대본 등 무궁무진한 주제로 나만의 오디오·비디오 영상 콘텐츠를 제작할 수 있다는 편리함이 있습니다.

특히 스튜디오가 아닌, 방 안에서도 쉽게 가상 인간과 AI 목소리를 다재다능하게 활용할 수 있다는 점은 누구나 전문적으로 콘텐츠를 제작할 수 있게끔 하는 큰 동력이 됩니다.

세상에서 가장 쉬운 콘텐츠 제작 툴 타입캐스트

간단하게 텍스트만 입력하면 누구나 쉽게 AI 보이스 생성과 영상 콘텐츠 제작이 가능해요!