@mzzsfy
tts接口 /api/tts?text=你好&download=false
兼容openai的/v1/audio/speech接口
访问/api/tts/list 查看支持模型
tts接口支持参数:
download 默认为true 浏览器打开时下载为文件或者在线播放,长文本不建议在线播放
text 必传 需要tts的文本,如果为<speak>格式的xml,将无视下面所有参数
shardLength 默认1000 分片文本长度
thread 默认5 线程数
fastDownload 默认false 更激进的并发策略,更消耗内存,完成速度更快,更容易出错,仅下载模式且分片很多时可使用
自定义模型参数
audioType 音频编码,如 audio-24khz-48kbitrate-mono-mp3
voiceName 模型名称,如 zh-CN-XiaoxiaoNeural
style SsmlStyle,一般为空
pitch 速度
rate 语调,使用这个参数建议使用自定义xml
支持使用环境变量修改默认参数,DEFAULT_VOICE_NAME,DEFAULT_AUDIO_FORMAT,DEFAULT_AUDIO_STYLE
参考: https://learn.microsoft.com/en-us/azure/ai-services/speech-service/speech-synthesis-markup-voice
私有化部署: https://hub.docker.com/r/mzzsfy/tts
当国内无法访问时请酌情添加下方环境变量
严格模式,国内ip必须添加,国外服务器请勿添加 TTS_STRICT_MODE=true
禁用dns解析 TTS_BING_NO_DNS = true
自定义微软服务器 ip列表 TTS_BING_IP_LIST=ip1,ip2,ip3
如果这个软件有帮助到你,请我喝杯咖啡