集成指南
接口选择
选择合适的 Kitta Audio API 形态。
接口选择
Kitta Audio API 位于 /api/v1 和实时 WebSocket /v1/*/live。多数集成从文字转语音开始,再按需要加入异步任务、实时识别、图像、视频或口型同步。
| API | 适用场景 | 响应 |
|---|---|---|
POST /v1/tts/speech | 短文本和快速接入测试 | 音频二进制 |
POST /v1/tts/tasks | 长文本或任务制工作流 | 先返回任务,再轮询结果 |
GET /v1/tts/live | 低延迟流式 TTS | WebSocket 音频事件 |
POST /v1/asr/tasks | 转写已有音频 | 先返回任务,再轮询结果 |
GET /v1/asr/live | 实时语音识别 | WebSocket 识别事件 |
POST /v1/images/tasks | 图像生成 | 先返回任务,再轮询结果 |
POST /v1/videos/tasks | 视频生成 | 先返回任务,再轮询结果 |
POST /v1/lip-sync/tasks | 创建口型同步视频任务 | 先返回任务,再轮询结果 |
GET /v1/voices | 选择可用音色 | 音色列表 JSON |
GET /v1/usage | 查询额度和用量 | 用量汇总 JSON |
建议
首次接入从同步 TTS 开始:
POST /v1/tts/speech当文本较长、用户可以等待,或需要任务对账时,使用异步 TTS:
POST /v1/tts/tasks
GET /v1/tts/tasks/{taskId}手动测试请求时使用 API Playground:
/zh-CN/api-playground