메인 콘텐츠로 건너뛰기
POST
/
v1
/
text-to-speech
cURL (파일로 저장)
curl --request POST \
  --url https://api.typecast.ai/v1/text-to-speech \
  --header 'Content-Type: application/json' \
  --header 'X-API-KEY: <api-key>' \
  --output output.wav \
  --data @- <<EOF
{
  "voice_id": "tc_60e5426de8b95f1d3000d7b5",
  "text": "Everything is so incredibly perfect that I feel like I'm dreaming.",
  "model": "ssfm-v30",
  "language": "eng",
  "prompt": {
    "emotion_type": "smart",
    "previous_text": "I feel like I'm walking on air and I just want to scream with joy!",
    "next_text": "I am literally bursting with happiness and I never want this feeling to end!"
  },
  "output": {
    "volume": 100,
    "audio_pitch": 0,
    "audio_tempo": 1,
    "audio_format": "wav"
  },
  "seed": 42
}
EOF
"[Binary audio data - WAV file content]"

인증

X-API-KEY
string
header
필수

인증을 위한 API 키. 타입캐스트 API 콘솔에서 API 키를 생성할 수 있습니다.

본문

application/json
voice_id
string
필수

'tc_'로 시작하고 고유 식별자가 뒤따르는 형식의 캐릭터 ID(예: 'tc_60e5426de8b95f1d3000d7b5'). 대소문자 구분: 소문자를 사용해야 함(tc_xxx). 사용 가능한 캐릭터는 캐릭터 목록 조회을 참조하세요.

예시:

"tc_60e5426de8b95f1d3000d7b5"

text
string
필수

음성으로 변환할 텍스트. 최소 1자, 최대 2000자. 텍스트 길이에 따라 크레딧이 소비됩니다. 영어, 한국어, 일본어, 중국어를 포함한 여러 언어를 지원합니다. 특수 문자와 구두점은 자동으로 처리됩니다.

Required string length: 1 - 2000
예시:

"모든 것이 너무나 완벽해서 마치 꿈을 꾸는 것 같습니다."

model
enum<string>
필수

음성 합성에 사용할 캐릭터 모델.

  • ssfm-v30: 향상된 플로우와 추가 감정 프리셋이 있는 최신 모델(권장)
  • ssfm-v21: 빠르고 안정적인 모델로 신뢰할 수 있는 품질 제공
사용 가능한 옵션:
ssfm-v30,
ssfm-v21
예시:

"ssfm-v30"

language
string

ISO 639-3 표준을 따르는 언어 코드. 대소문자 구분 안 함("KOR"과 "kor" 모두 허용). 제공하지 않으면 텍스트 내용을 기반으로 자동 감지됩니다.

ssfm-v30 지원 언어 (37개)
코드언어코드언어코드언어
ARA아랍어IND인도네시아어POR포르투갈어
BEN벵골어ITA이탈리아어RON루마니아어
BUL불가리아어JPN일본어RUS러시아어
CES체코어KOR한국어SLK슬로바키아어
DAN덴마크어MSA말레이어SPA스페인어
DEU독일어NAN민남어SWE스웨덴어
ELL그리스어NLD네덜란드어TAM타밀어
ENG영어NOR노르웨이어TGL타갈로그어
FIN핀란드어PAN펀자브어THA태국어
FRA프랑스어POL폴란드어TUR터키어
HIN힌디어UKR우크라이나어VIE베트남어
HRV크로아티아어YUE광둥어ZHO중국어
HUN헝가리어
ssfm-v21 지원 언어 (27개)
코드언어코드언어코드언어
ARA아랍어IND인도네시아어RON루마니아어
BUL불가리아어ITA이탈리아어RUS러시아어
CES체코어JPN일본어SLK슬로바키아어
DAN덴마크어KOR한국어SPA스페인어
DEU독일어MSA말레이어SWE스웨덴어
ELL그리스어NLD네덜란드어TAM타밀어
ENG영어POL폴란드어TGL타갈로그어
FIN핀란드어POR포르투갈어UKR우크라이나어
FRA프랑스어HRV크로아티아어ZHO중국어
예시:

"kor"

prompt
스마트 프롬프트 (ssfm-v30) · object

생성된 음성의 감정 및 스타일 설정.

예시:
{
"emotion_type": "smart",
"previous_text": "I feel like I'm walking on air and I just want to scream with joy!",
"next_text": "I am literally bursting with happiness and I never want this feeling to end!"
}
output
Output · object

볼륨(0-200), 피치(-12~+12 반음), 템포(0.5배~2.0배), 형식(wav/mp3)을 포함한 오디오 출력 설정으로 최종 오디오 특성을 제어합니다

seed
integer

음성 생성 변이를 제어하기 위한 랜덤 시드. 출력에 영향을 주기 위해 임의의 정수 값을 사용합니다.

예시:

42

응답

Success - Returns audio file

WAV 오디오 파일 바이너리 데이터(비압축 PCM, 16비트, 모노, 44.1kHz)