冰楓論壇

標題: LTX-2 v3_0 WEBUI+ComfyUI 一鍵啟動 [打印本頁]

作者: 일레이나    時間: 前天 16:37
標題: LTX-2 v3_0 WEBUI+ComfyUI 一鍵啟動
名      稱:LTX-2  (WebUI原則上一次7秒一段,約10分鐘)
軟體版本:v3_0
軟體類型:一鍵啟動 WEBUI+ComfyUI
語言類型:網譯
檔案大小:46Gb

1.jpg
2.jpg
3.jpg
4.jpg


測試效果

LTX-2 是由 Lightricks 推出的開源音視頻生成模型,它的最大特點是能在同一個模型里同時生成“畫面”和“聲音”,
讓視頻和音頻自然同步。它支持文本、圖片甚至音頻作為輸入,能快速生成對應的視頻或音頻內容。

在各路社區大神的不斷努力下,GGUF版模型和插件不斷更新,
今天分享的一鍵包所有主力模型都更換為更輕的GGUF版模型,
自帶預留顯存插件,可以手動設置預留顯存數值,
防止顯存不足導致OOM報錯,甜品卡8G顯存即可流暢運行。

模型特點
音視頻一體化:不像傳統模型只做視頻或音頻,LTX-2 可以在一個框架里同時生成兩者,保證畫面和聲音的協調。  
多模態輸入:支持文字轉視頻、圖片轉視頻、文字轉音頻、音頻轉視頻等多種組合方式。  
開源可訓練:提供完整代碼和權重,用戶可以在本地訓練或微調,甚至用 LoRA 技朮快速定制風格。  
高效推理:有精簡版(distilled)和量化版(fp8、fp4),在不同硬件環境下都能運行。  
分辨率與幀率提升:配套的空間和時間“upscaler”可以讓視頻更清晰、幀率更高。  
兼容生態:支持 PyTorch、Diffusers 庫,也能在 ComfyUI 里直接調用。

應用領域
創意視頻制作:輸入文字或圖片,快速生成短視頻,用於廣告、社交媒體或藝朮創作。  
教育與培訓:老師可以用文字提示生成教學視頻,配合音頻講解。  
遊戲與虛擬世界:為角色或場景生成動態視頻和音效,提升沉浸感。  
多媒體內容創作:播客、短片、音樂視頻,都可以用 LTX-2 來自動生成或輔助制作。  
個性化定制:通過微調模型,快速生成符合特定風格或品牌需求的內容。

使用教程:(建議N卡,顯存8G起,運存32G起,支持50系顯卡)

在撰寫寫作提示時,應着重於對動作與場景的詳細、按時間順序的描述。
需包含具體的動作、外貌特徵、鏡頭角度以及環境細節——所有這些內容都應整合在一段流暢的段落中。
直接從動作開始描述,保持描述的客觀性與精確性。可以想象自己是一名電影攝影師,
在為拍攝清單撰寫詳細說明。字數控制在200字以內。為獲得最佳效果,

請按照以下結搆來撰寫提示:
1. 用一句話概括核心動作;
2. 添加關於動作與姿勢的具體細節;
3. 准確描述人物/物體的外貌特徵;
4. 描述背景與環境細節;
5. 指明鏡頭角度與拍攝方式;
6. 描述光影與色彩效果;
7. 注意任何可能發生的變化或突發事件。


默認幀率是24/FPS,設置幀數應該是總幀數+1,比如要生成5秒的視頻,
總幀數應該是 24*5+1=121

檔案下載
下載 左邊0116


作者: pig55570    時間: 前天 17:40
LTX-2 v3_0 WEBUI+ComfyUI 一鍵啟動。很實用的軟体, 感謝大大分享 !!
作者: lwj278    時間: 昨天 10:16
謝謝樓主無私分享,先收藏起來。




歡迎光臨 冰楓論壇 (https://bingfong.com/) Powered by 冰楓