cURL
Voices
퀵 클로닝
짧은 오디오 샘플을 업로드해 커스텀 보이스를 생성하면, 이후 텍스트 음성 변환 호출에서 기본 보이스와 동일하게 사용할 수 있습니다.
WAV 또는 MP3 파일(최대 25MB)을 업로드하면 서버가 speaker embedding 을 추출하여 uc_ prefix 가 붙은 커스텀 보이스 ID 를 반환합니다. 이 ID 는 POST /v1/text-to-speech 의 voice_id 등 voice_id 를 받는 어떤 엔드포인트에도 그대로 전달할 수 있습니다. 원본 오디오는 응답 후 background 에서 S3 에 업로드됩니다.
제한 사항
- 오디오 파일: 최대 25MB. WAV 또는 MP3.
- 오디오 길이: 5초 이상 150초 이하.
- 보이스 이름: 1~30자.
- 모델:
ssfm-v21또는ssfm-v30. 클로닝된 보이스는 해당 엔진 모델에 묶입니다. - 플랜별로 동시에 보유 가능한 커스텀 보이스 수가 제한됩니다(
custom_voice_slot). 슬롯이 가득 찼다면DELETE /v1/voices/{voice_id}로 비워주세요.
일반 사용 흐름
POST /v1/voices/clone으로 샘플 오디오 업로드 →voice_id수신 (예:uc_64a1b2...).POST /v1/text-to-speech의voice_id에 클로닝된 ID 사용.- 더 이상 필요 없으면
DELETE /v1/voices/{voice_id}로 삭제.
POST
cURL
인증
인증을 위한 API 키. 타입캐스트 API 콘솔에서 API 키를 생성할 수 있습니다.
본문
multipart/form-data
응답
Successful Response - Custom voice created
POST /v1/voices/clone 응답 — 퀵 클로닝으로 생성된 커스텀 보이스 메타데이터.