FishSpeech Docs
API Reference实时语音转文字

实时语音转文字

使用 WebSocket 进行实时语音识别。

实时语音转文字

实时 ASR 适合会议字幕、语音输入和实时转写。客户端通过 WebSocket 连接后发送 MessagePack 事件,服务端转发音频流并返回识别结果。

GET /v1/asr/live
Authorization: Bearer YOUR_API_KEY

生产连接地址示例:

wss://kittaaudio.com/v1/asr/live

模型

实时 ASR 使用 kitta-asr-realtime-v1。普通文件转写请使用 语音转文字 的异步任务接口。

计费

实时 ASR 按分钟计费。会话开始时先扣首分钟额度,跨过新的分钟边界后继续追加扣费;如果服务端启动失败,会按失败退款规则处理。

错误

握手鉴权失败返回 401。会话内错误会通过结束事件返回错误码和说明,客户端应停止发送音频并关闭连接。

On this page