FishSpeech Docs
集成指南

接口选择

选择合适的 Kitta Audio API 形态。

接口选择

Kitta Audio API 位于 /api/v1 和实时 WebSocket /v1/*/live。多数集成从文字转语音开始,再按需要加入异步任务、实时识别、图像、视频或口型同步。

API适用场景响应
POST /v1/tts/speech短文本和快速接入测试音频二进制
POST /v1/tts/tasks长文本或任务制工作流先返回任务,再轮询结果
GET /v1/tts/live低延迟流式 TTSWebSocket 音频事件
POST /v1/asr/tasks转写已有音频先返回任务,再轮询结果
GET /v1/asr/live实时语音识别WebSocket 识别事件
POST /v1/images/tasks图像生成先返回任务,再轮询结果
POST /v1/videos/tasks视频生成先返回任务,再轮询结果
POST /v1/lip-sync/tasks创建口型同步视频任务先返回任务,再轮询结果
GET /v1/voices选择可用音色音色列表 JSON
GET /v1/usage查询额度和用量用量汇总 JSON

建议

首次接入从同步 TTS 开始:

POST /v1/tts/speech

当文本较长、用户可以等待,或需要任务对账时,使用异步 TTS:

POST /v1/tts/tasks
GET /v1/tts/tasks/{taskId}

手动测试请求时使用 API Playground:

/zh-CN/api-playground

On this page