|
 
- UID
- 469567
- 帖子
- 6123
- 主題
- 6120
- 精華
- 0
- 積分
- 6140
- 楓幣
- 40
- 威望
- 6131
- 存款
- 0
- 贊助金額
- 0
- 推廣
- 0
- GP
- 1
- 閱讀權限
- 90
- 在線時間
- 182 小時
- 註冊時間
- 2024-12-17
- 最後登入
- 2025-11-5
|
|
名 稱:ChatterBox
軟體版本:V2版_TTS
軟體類型:一鍵啟動
檔案大小:16GB
存放空間:Katfile
Chatterbox 是由 Resemble AI 開發的一款開源多語言文本轉語音(TTS)模型,特點是支持23種語言,并且能實現零樣本語音克隆(即用極短的語音樣本克隆出相似的聲音)。它基於強大的 0.5B Llama 模型架搆,訓練數據超過 50 萬小時,性能媲美 ElevenLabs 等商業閉源方案,甚至在某些評測中更受用戶青睞。
今天分享的 ChatterBox V2版,在官方的基礎上,集成了包含中文等23種多國語言支持,新增了自定義音色功能。特點是小巧輕量,只有0.5B的參數量,且純CPU即可實現快速生成。
多語言支持:涵蓋中文、英語、日語、法語、西班牙語等23種語言,適合全球化應用。情感控制:可調整語音的夸張程度(如讓聲音更激昂或更平靜),適合遊戲、動畫配音等場景。
零樣本克隆:僅需几秒的語音樣本,就能合成相似的聲音,無需額外訓練。
低延遲:生成速度快,適合實時交互場景(如AI助手、遊戲NPC)。
水印技朮:內置防濫用機制,所有生成音頻均含不可見水印,可追蹤來源。
應用領域
遊戲/動畫:為角色生成多語言配音,調整情感表現。
短視頻/自媒體:快速制作多語言旁白或搞笑語音。
AI助手:提升語音交互的自然度,支持個性化音色。
教育:生成不同語言的朗讀內容,輔助語言學習。
使用教程:(建議N卡,顯存4G起。支持50系顯卡,支持無限卡純CPU生成)
分為TTS(文本轉語音)和VC(語音轉換)兩種模式
TTS,和其他類似軟件操作一樣,輸入文本,上傳參考音頻,生成即可。
VC,上傳需要轉換的音頻和參考音頻,提交生成即可。
檔案下載
下載 左邊1011
|
|