타입캐스트 API 를 위한 공식 Java 라이브러리입니다. AI 기반 음성을 사용하여 텍스트를 생동감 있는 음성으로 변환하세요.
Java 8 이상 버전과 호환됩니다. Maven, Gradle, 수동 설치와 함께 작동합니다.
Maven Central Typecast Java SDK
소스 코드 Typecast Java SDK 소스 코드
pom.xml에 다음 의존성을 추가하세요:< dependency >
< groupId > com.neosapience </ groupId >
< artifactId > typecast-java </ artifactId >
< version > 1.0.1 </ version >
</ dependency >
build.gradle에 추가하세요:implementation 'com.neosapience:typecast-java:1.0.1'
로컬 Maven 저장소에 클론하고 설치하세요: git clone https://github.com/neosapience/typecast-sdk.git
cd typecast-sdk/typecast-java
mvn clean install -DskipTests
버전 1.0.1 이상 이 설치되어 있는지 확인하세요. 이전 버전이 있다면 pom.xml 또는 build.gradle에서 의존성 버전을 업데이트하세요.
빠른 시작
import com.neosapience.TypecastClient;
import com.neosapience.models. * ;
import java.io.FileOutputStream;
public class QuickStart {
public static void main ( String [] args ) throws Exception {
// 클라이언트 초기화
TypecastClient client = new TypecastClient ( "YOUR_API_KEY" );
// 텍스트를 음성으로 변환
TTSRequest request = TTSRequest . builder ()
. voiceId ( "tc_672c5f5ce59fac2a48faeaee" )
. text ( "안녕하세요! 저는 텍스트 음성 변환 에이전트입니다." )
. model ( TTSModel . SSFM_V30 )
. build ();
TTSResponse response = client . textToSpeech (request);
// 오디오 파일 저장
try ( FileOutputStream fos = new FileOutputStream ( "output." + response . getFormat ())) {
fos . write ( response . getAudioData ());
}
System . out . println ( "Audio saved! Duration: " + response . getDuration () + "s, Format: " + response . getFormat ());
// 정리
client . close ();
}
}
Typecast Java SDK는 텍스트 음성 변환을 위한 강력한 기능을 제공합니다:
다중 음성 모델 : ssfm-v30(최신) 및 ssfm-v21 AI 음성 모델 지원
다국어 지원 : 영어, 한국어, 스페인어, 일본어, 중국어 등 37개 언어 지원
감정 제어 : 이모션 프리셋(normal, happy, sad, angry, whisper, toneup, tonedown) 또는 스마트 문맥 인식 추론
오디오 사용자 정의 : 라우드니스 LUFS(-70 to 0), 피치(-12 to +12 반음), 템포(0.5x to 2.0x), 형식(WAV/MP3) 제어
음성 탐색 : 모델, 성별, 나이, 사용 사례별 필터링이 가능한 V2 Voices API
빌더 패턴 : 쉬운 요청 구성을 위한 빌더 패턴의 Fluent API
스트리밍 : 저지연 재생을 위한 실시간 청크 오디오 전송
포괄적인 오류 처리 : 각 오류 유형에 대한 특정 예외 클래스
환경 변수, .env 파일 또는 생성자를 통해 API 키를 설정하세요:
// 환경 변수 사용
// export TYPECAST_API_KEY="your-api-key-here"
TypecastClient client = new TypecastClient ();
// 또는 직접 전달
TypecastClient client = new TypecastClient ( "your-api-key-here" );
// 또는 사용자 정의 base URL과 함께
TypecastClient client = new TypecastClient ( "your-api-key-here" , "https://custom-api.example.com" );
환경 파일
프로젝트 루트에 .env 파일을 만드세요:
TYPECAST_API_KEY = your-api-key-here
고급 사용법
감정 제어 (ssfm-v30)
ssfm-v30은 두 가지 감정 제어 모드를 제공합니다: 프리셋 및 스마트 .
AI가 문맥에서 감정을 추론하도록 합니다: TTSRequest request = TTSRequest . builder ()
. voiceId ( "tc_672c5f5ce59fac2a48faeaee" )
. text ( "모든 것이 잘 될 거예요." )
. model ( TTSModel . SSFM_V30 )
. prompt ( SmartPrompt . builder ()
. previousText ( "방금 최고의 소식을 들었어요!" ) // 선택적 문맥
. nextText ( "축하할 수 있어서 너무 기다려져요!" ) // 선택적 문맥
. build ())
. build ();
TTSResponse response = client . textToSpeech (request);
프리셋 값으로 감정을 명시적으로 설정합니다: TTSRequest request = TTSRequest . builder ()
. voiceId ( "tc_672c5f5ce59fac2a48faeaee" )
. text ( "이 기능들을 보여드리게 되어 정말 기대됩니다!" )
. model ( TTSModel . SSFM_V30 )
. prompt ( PresetPrompt . builder ()
. emotionPreset ( EmotionPreset . HAPPY ) // normal, happy, sad, angry, whisper, toneup, tonedown
. emotionIntensity ( 1.5 ) // 범위: 0.0 ~ 2.0
. build ())
. build ();
TTSResponse response = client . textToSpeech (request);
오디오 사용자 정의
라우드니스, 피치, 템포 및 출력 형식을 제어합니다:
TTSRequest request = TTSRequest . builder ()
. voiceId ( "tc_672c5f5ce59fac2a48faeaee" )
. text ( "사용자 정의 오디오 출력!" )
. model ( TTSModel . SSFM_V30 )
. output ( Output . builder ()
. targetLufs ( - 14.0 ) // 범위: -70 ~ 0 (LUFS)
. audioPitch ( 2 ) // 범위: -12 to +12 반음
. audioTempo ( 1.2 ) // 범위: 0.5x to 2.0x
. audioFormat ( AudioFormat . MP3 ) // 옵션: WAV, MP3
. build ())
. seed ( 42 ) // 0 이상의 정수 시드 (재현 가능한 결과)
. build ();
TTSResponse response = client . textToSpeech (request);
try ( FileOutputStream fos = new FileOutputStream ( "output." + response . getFormat ())) {
fos . write ( response . getAudioData ());
}
System . out . println ( "Duration: " + response . getDuration () + "s, Format: " + response . getFormat ());
음성 탐색 (V2 API)
향상된 메타데이터로 사용 가능한 음성을 나열하고 필터링합니다:
// 모든 음성 가져오기
List < VoiceV2Response > voices = client . getVoicesV2 ();
// 기준으로 필터링
VoicesV2Filter filter = VoicesV2Filter . builder ()
. model ( TTSModel . SSFM_V30 )
. gender ( GenderEnum . FEMALE )
. age ( AgeEnum . YOUNG_ADULT )
. build ();
List < VoiceV2Response > filtered = client . getVoicesV2 (filter);
// 음성 정보 표시
for ( VoiceV2Response voice : voices) {
System . out . println ( "ID: " + voice . getVoiceId () + ", Name: " + voice . getVoiceName ());
System . out . println ( "Gender: " + voice . getGender () + ", Age: " + voice . getAge ());
for ( ModelInfo model : voice . getModels ()) {
System . out . println ( "Model: " + model . getVersion () + ", Emotions: " + model . getEmotions ());
}
if ( voice . getUseCases () != null ) {
System . out . println ( "Use cases: " + String . join ( ", " , voice . getUseCases ()));
}
}
스트리밍
저지연 재생을 위한 실시간 오디오 청크 스트리밍:
import javax.sound.sampled. * ;
// 오디오 재생 설정: 32000 Hz, 16비트, 모노, 리틀엔디안
AudioFormat format = new AudioFormat ( 32000 , 16 , 1 , true , false );
SourceDataLine line = AudioSystem . getSourceDataLine (format);
line . open (format, 8192 );
line . start ();
try ( InputStream stream = client . textToSpeechStream (request)) {
byte [] buf = new byte [ 4096 ];
boolean first = true ;
int bytesRead ;
while ((bytesRead = stream . read (buf)) != - 1 ) {
int offset = 0 ;
if (first) {
offset = 44 ; // 44바이트 WAV 헤더 건너뛰기
bytesRead -= 44 ;
first = false ;
}
line . write (buf, offset, bytesRead);
}
}
line . drain ();
line . close ();
client . close ();
WAV 스트리밍 형식: 32000 Hz, 16비트, 모노 PCM. 첫 번째 청크에 44바이트 WAV 헤더(size = 0xFFFFFFFF)가 포함되며, 이후 청크는 원시 PCM 데이터만 포함합니다. MP3 형식: 320 kbps, 44100 Hz, 각 청크는 독립적으로 디코딩 가능합니다. java.io.OutputStream과의 이름 충돌을 피하려면 com.neosapience.models.OutputStream으로 정규화된 이름을 사용하세요. 스트리밍 엔드포인트는 volume 및 targetLufs를 지원하지 않습니다.
지원 언어
SDK는 자동 언어 감지와 함께 37개 언어를 지원합니다:
코드 언어 코드 언어 코드 언어 ENG영어 JPN일본어 UKR우크라이나어 KOR한국어 ELL그리스어 IND인도네시아어 SPA스페인어 TAM타밀어 DAN덴마크어 DEU독일어 TGL타갈로그어 SWE스웨덴어 FRA프랑스어 FIN핀란드어 MSA말레이어 ITA이탈리아어 ZHO중국어 CES체코어 POL폴란드어 SLK슬로바키아어 POR포르투갈어 NLD네덜란드어 ARA아랍어 BUL불가리아어 RUS러시아어 HRV크로아티아어 RON루마니아어 BEN벵골어 HIN힌디어 HUN헝가리어 NAN민난어 NOR노르웨이어 PAN펀자브어 THA태국어 TUR터키어 VIE베트남어 YUE광둥어
지정하지 않으면 입력 텍스트에서 언어가 자동으로 감지됩니다.
오류 처리
SDK는 API 오류 처리를 위한 특정 예외 클래스를 제공합니다:
import com.neosapience.TypecastClient;
import com.neosapience.exceptions. * ;
try {
TTSResponse response = client . textToSpeech (request);
} catch ( UnauthorizedException e ) {
// 401: 잘못된 API 키
System . err . println ( "Invalid API key: " + e . getMessage ());
} catch ( PaymentRequiredException e ) {
// 402: 크레딧 부족
System . err . println ( "Insufficient credits: " + e . getMessage ());
} catch ( ForbiddenException e ) {
// 403: 접근 거부
System . err . println ( "Access denied: " + e . getMessage ());
} catch ( NotFoundException e ) {
// 404: 리소스를 찾을 수 없음
System . err . println ( "Voice not found: " + e . getMessage ());
} catch ( UnprocessableEntityException e ) {
// 422: 유효성 검사 오류
System . err . println ( "Validation error: " + e . getMessage ());
} catch ( RateLimitException e ) {
// 429: 요청 한도 초과
System . err . println ( "Rate limit exceeded - please try again later" );
} catch ( InternalServerException e ) {
// 500: 서버 오류
System . err . println ( "Server error: " + e . getMessage ());
} catch ( TypecastException e ) {
// 일반 오류
System . err . println ( "API error (" + e . getStatusCode () + "): " + e . getMessage ());
}
예외 계층 구조
예외 상태 코드 설명 BadRequestException400 잘못된 요청 매개변수 UnauthorizedException401 잘못되거나 누락된 API 키 PaymentRequiredException402 크레딧 부족 ForbiddenException403 접근 거부 NotFoundException404 리소스를 찾을 수 없음 UnprocessableEntityException422 유효성 검사 오류 RateLimitException429 요청 한도 초과 InternalServerException500 서버 오류 TypecastException* 기본 예외 클래스