메인 콘텐츠로 건너뛰기
2026년 4월
APISDK스트리밍
스트리밍 TTS & 구독 API

새 엔드포인트: POST /v1/text-to-speech/stream

전체 합성을 기다리지 않고 생성되는 오디오 청크를 실시간으로 전달하는 저지연 스트리밍 엔드포인트가 추가되었습니다.
POST /v1/text-to-speech/stream
/v1/text-to-speech와의 주요 차이점:
기능표준스트리밍
응답완성된 오디오 파일청크 오디오 스트림
지연 시간전체 합성 대기첫 청크 ~200ms
volume / target_lufs지원미지원
출력 설정OutputOutputStream (피치, 템포, 포맷만)
요청 스키마:
{
  "voice_id": "tc_xxxxx",
  "text": "문의해 주셔서 감사합니다. 금요일 오후 7시로 예약이 확정되었습니다.",
  "model": "ssfm-v30",
  "language": "kor",
  "output": {
    "audio_pitch": 0,
    "audio_tempo": 1.0,
    "audio_format": "wav"
  }
}
응답: 청크 바이너리 스트림 (audio/wav 또는 audio/mpeg).

새 엔드포인트: GET /v1/users/me/subscription

인증된 사용자의 플랜 등급, 크레딧 사용량, 동시 요청 제한을 조회합니다.
GET /v1/users/me/subscription
응답 스키마:
{
  "plan": "lite",
  "credits": {
    "plan_credits": 100000,
    "used_credits": 157300
  },
  "limits": {
    "concurrency_limit": 5
  }
}

SDK 업데이트

9개 공식 SDK 모두 스트리밍 및 구독 지원이 추가되었습니다:
SDK버전스트리밍 메서드
Python0.2.0text_to_speech_stream() (동기 + 비동기)
JavaScript0.3.0textToSpeechStream()ReadableStream
Gov0.2.0TextToSpeechStream()io.ReadCloser
Rust0.2.0text_to_speech_stream()Stream<Bytes>
Swiftv0.2.0textToSpeechStream()AsyncThrowingStream
C#0.2.0TextToSpeechStreamAsync()Stream
Java1.1.0textToSpeechStream()InputStream
Kotlin1.1.0textToSpeechStream()InputStream
C1.1.0typecast_text_to_speech_stream() (콜백)
2026년 1월
모델API보이스
ssfm-v30 모델 & v2 API

새 모델: ssfm-v30

음성 품질이 개선되고 기능이 확장된 새로운 ssfm-v30 모델 지원이 추가되었습니다.새로운 기능:
  • 스마트 이모션 - SmartPrompt를 사용한 문맥 인식 감정 추론
  • 7가지 감정 프리셋 - whisper, toneup, tonedown 프리셋 추가
  • 범용 감정 지원 - 모든 감정을 모든 캐릭터에서 사용 가능
  • 37개 언어 - 10개 새 언어 추가
새로 추가된 언어: 벵골어, 광둥어, 힌디어, 헝가리어, 민난어, 노르웨이어, 펀자브어, 태국어, 터키어, 베트남어요청 스키마 변경:
// ssfm-v30 SmartPrompt 사용 (문맥 인식 감정)
{
  "model": "ssfm-v30",
  "prompt": {
    "emotion_type": "smart",
    "previous_text": "I feel like I'm walking on air and I just want to scream with joy!",
    "next_text": "I am literally bursting with happiness and I never want this feeling to end!"
  }
}

// ssfm-v30 PresetPrompt 사용 (수동 감정 선택)
{
  "model": "ssfm-v30",
  "prompt": {
    "emotion_type": "preset",
    "emotion_preset": "happy",
    "emotion_intensity": 1.0
  }
}

새 엔드포인트: GET /v2/voices

모델별로 그룹화된 감정과 추가 메타데이터가 포함된 향상된 캐릭터 목록 엔드포인트가 추가되었습니다.
GET /v2/voices
쿼리 파라미터:
파라미터타입설명
modelstring모델별 필터링 (ssfm-v21, ssfm-v30)
genderstring성별별 필터링 (male, female)
agestring연령대별 필터링 (child, teenager, young_adult, middle_age, elder)
use_casesstring사용 사례별 필터링 (Audiobook, Game, E-learning 등)
응답 스키마:
[
  {
    "voice_id": "tc_xxxxx",
    "voice_name": "음성 이름",
    "models": [
      {
        "version": "ssfm-v30",
        "emotions": ["normal", "happy", "sad", "angry", "whisper", "toneup", "tonedown"]
      },
      {
        "version": "ssfm-v21",
        "emotions": ["normal", "happy", "sad"]
      }
    ],
    "gender": "female",
    "age": "young_adult",
    "use_cases": ["Audiobook", "E-learning"]
  }
]

지원 중단: 캐릭터 관리 엔드포인트

다음 엔드포인트가 지원 중단되어 제거되었습니다:
엔드포인트상태
POST /v1/voices제거됨
GET /v1/voices/{voice_id}제거됨
향상된 메타데이터가 포함된 캐릭터 목록을 보려면 GET /v2/voices를 사용하세요.
2025년 4월
모델API
초기 API 출시

초기 출시: ssfm-v21

ssfm-v21 모델로 타입캐스트 Text-to-Speech API를 출시했습니다.엔드포인트:
메서드엔드포인트설명
POST/v1/text-to-speech텍스트에서 음성 생성
GET/v1/voices사용 가능한 음성 목록
기능:
  • 저지연 음성 합성
  • 4가지 감정 프리셋: normal, happy, sad, angry
  • 음성에 따라 감정 사용 가능 여부가 다름
  • 27개 언어 지원
지원 언어: 영어, 한국어, 아랍어, 불가리아어, 중국어, 크로아티아어, 체코어, 덴마크어, 네덜란드어, 핀란드어, 프랑스어, 독일어, 그리스어, 인도네시아어, 이탈리아어, 일본어, 말레이어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 슬로바키아어, 스페인어, 스웨덴어, 타갈로그어, 타밀어, 우크라이나어요청 스키마:
{
  "voice_id": "tc_xxxxx",
  "text": "Everything is so incredibly perfect that I feel like I'm dreaming.",
  "model": "ssfm-v21",
  "language": "kor",
  "prompt": {
    "emotion_preset": "normal",
    "emotion_intensity": 1.0
  },
  "output": {
    "volume": 100,
    "audio_pitch": 0,
    "audio_tempo": 1.0,
    "audio_format": "wav"
  }
}