冰楓論壇

 找回密碼
 立即註冊
搜索
查看: 469|回覆: 2
打印 上一主題 下一主題

[影音處理] MuseTalk V3 一鍵整合包

[複製鏈接]

6120

主題

0

好友

6140

積分

論壇元老

Rank: 8Rank: 8

UID
469567
帖子
6123
主題
6120
精華
0
積分
6140
楓幣
39
威望
6131
存款
0
贊助金額
0
推廣
0
GP
0
閱讀權限
90
在線時間
182 小時
註冊時間
2024-12-17
最後登入
2025-11-5
跳轉到指定樓層
1
發表於 2025-5-21 17:48:03 |只看該作者 |倒序瀏覽
軟體名稱:MuseTalk(不支持9:16格式)
軟體版本:V3
軟體類型:一鍵整合包(附影片)
軟體語言: 多語網譯
檔案大小:9.8GB

按順序(不然報錯)
1.測試重繪
2.生成


1.jpg
2.jpg
3.jpg
4.jpg


MuseTalk 是騰訊開發的一款AI數位人唇形同步工具,它能根據輸入的音訊自動調整虛擬人物的嘴部動作,讓數位人說話時的口型和聲音完美匹配。只需要上傳一段驅動音訊,和一段人物視頻,即可一鍵生成無限說自認說話視頻,適用各種自媒體口播和直播等領域!
MuseTalk 對於最低硬體要求,在 windows 環境下使用配備 4GB 顯存的 NVIDIA GeForce RTX 3050 Ti 筆記本 GPU 測試了該系統。在 fp16 模式下,生成 8 秒的視頻大約需要 5 分鐘。

今天分享的MuseTalk V3版,同步官方最新的 MuseTalk V1.5版模型。與 1.0 版本相比,這個版本的模型有了顯著改進,提高了清晰度、身份一致性和精確的唇音同步。


應用領域:

短視頻製作:給動漫角色或真人換配音不用重拍
虛擬主播:讓AI主播的嘴型更自然
外語教學:展示標準發音口型
社交娛樂:讓照片唱歌說話做成搞笑視頻

使用教程:(建議N卡,顯存4G起。為了保證生成速度,建議顯存8G起。基於CUDA11.8)

上傳驅動音訊和參考視頻,設置相關參數(對應參數都有詳細說明),生成即可。
可以先調整參數,點測試重繪,預覽效果,再根據預覽調整參數,最後生成。

批量生成使用說明:
解壓一鍵包,依次打開 configs\inference,用記事本或者其他編輯器打開 batch.yaml

task_0:
video_path: "data/video/1.mp4"
audio_path: "data/audio/1.wav"
bbox_shift: -7
task_1:
video_path: "data/video/2.mp4"
audio_path: "data/audio/2.wav"
bbox_shift: -7
顯存低於8G不要使用批量,容易爆顯存

一個視頻對應一個task,以此類推,把所有的素材放到一個目錄裡,比如存放在data下的video和audio,一個存放視頻,一個存放音訊,注意視頻和音訊檔案名不要搞錯了。
bbox就是控制嘴巴張開幅度的。
配置完成後,保存。 一鍵啟動批量處理,等待完成

檔案下載
需要的請重新下載
下載 (進門左邊0521)
收藏收藏0 推0 噓0

分享這篇文章



把本文推薦給朋友或其他網站上,每次被點擊增加您在本站積分: 1鑰匙
複製連結並發給好友,以賺取推廣點數
簡單兩步驟,註冊、分享網址,即可獲得獎勵! 一起推廣文章換商品、賺$$

26

主題

0

好友

432

積分

中級會員

Rank: 3Rank: 3

UID
292490
帖子
1126
主題
26
精華
0
積分
432
楓幣
10082
威望
426
存款
0
贊助金額
0
推廣
0
GP
1669
閱讀權限
30
在線時間
125 小時
註冊時間
2020-10-30
最後登入
2025-11-23

2020聖誕節紀念勳章 2021中秋節紀念勳章 2021聖誕節紀念勳章 2022端午節紀念勳章 2022中秋節紀念勳章 2023端午節紀念勳章 2024端午節紀念勳章 2024中秋節紀念勳章 2024聖誕節紀念勳章 2025端午節紀念勳章

2
發表於 2025-5-21 19:05:00 |只看該作者
good
Thank you!
[發帖際遇]: marcellin 發表有損賴皇言論遭到青鳥出征抵制,因而造成營業損失 2 楓幣 幸運榜 / 衰神榜
點評回覆

使用道具 舉報

2

主題

1

好友

292

積分

中級會員

Rank: 3Rank: 3

UID
193984
帖子
21458
主題
2
精華
0
積分
292
楓幣
40839
威望
200
存款
0
贊助金額
0
推廣
0
GP
400
閱讀權限
30
性別
保密
在線時間
1839 小時
註冊時間
2017-6-27
最後登入
2025-12-7

2024聖誕節紀念勳章 2025端午節紀念勳章 2025中秋節紀念勳章

3
發表於 2025-5-21 20:10:03 |只看該作者
MuseTalk -- 是一款AI數位人唇形同步工具,它能根據輸入的音訊自動調整虛擬人物的嘴部動作,讓數位人說話時的口型和聲音完美匹配。這個軟体很實用,感謝大大分享 !!
點評回覆

使用道具 舉報

高級模式
B Color Image Link Quote Code Smilies

廣告刊登意見回饋關於我們管群招募本站規範DMCA隱私權政策詐騙防範及資料調閱

Copyright © 2011-2025 冰楓論壇, All rights reserved

免責聲明:本網站是以即時上載留言的方式運作,本站對所有留言的真實性、完整性及立場等,不負任何法律責任。

而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷內容之真實性。

小黑屋|手機版|冰楓論壇

GMT+8, 2025-12-7 04:37

回頂部