微软官方的 Azure TTS 服务目前拥有一定的免费额度,如果免费额度对你来说够用的话,请支持官方的服务。
如果只需要为固定的文本生成语音,可以使用有声内容创作。它提供了更丰富的功能可以生成更自然的声音。
本项目使用的是Edge浏览器“大声朗读”功能的接口,不保证后续可用性和稳定性。
本项目仅供学习和参考,请勿商用
默认的音频格式为 mp3 ,如果需要获取为其他格式的音频请修改请求头的 FORMAT(可用的选项可以在 ra/index.ts 中查看)。
Headers
FORMAT: audio-16khz-128kbitrate-mono-mp3
请求的正文为 ssml 格式,支持定制发音人和说话风格
Content-Type: text/plain
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
<voice name="zh-CN-XiaoxiaoNeural">
文字
</voice>
</speak>
| 字段名称 | 字段说明 | 类型 | 必填 | 备注 |
|---|---|---|---|---|
| 文字 | 你要转换的文字 | string | Y | - |
| name | 发音人 | string | Y | - |
发音人可以查看相关的示例和文档:
Content-Type: audio/mpeg
会返回一个音频文件