冰楓論壇

標題: LTX-2 v3_0 WEBUI+ComfyUI 一鍵啟動 [打印本頁]

作者: 일레이나 時間: 2026-1-17 16:37
標題: LTX-2 v3_0 WEBUI+ComfyUI 一鍵啟動
名稱:LTX-2 (WebUI原則上一次7秒一段,約10分鐘)
軟體版本:v3_0
軟體類型:一鍵啟動 WEBUI+ComfyUI
語言類型:網譯
檔案大小:46Gb

測試效果

LTX-2 是由 Lightricks 推出的開源音視頻生成模型，它的最大特點是能在同一個模型里同時生成“畫面”和“聲音”，
讓視頻和音頻自然同步。它支持文本、圖片甚至音頻作為輸入，能快速生成對應的視頻或音頻內容。

在各路社區大神的不斷努力下，GGUF版模型和插件不斷更新，
今天分享的一鍵包所有主力模型都更換為更輕的GGUF版模型，
自帶預留顯存插件，可以手動設置預留顯存數值，
防止顯存不足導致OOM報錯，甜品卡8G顯存即可流暢運行。

模型特點
音視頻一體化：不像傳統模型只做視頻或音頻，LTX-2 可以在一個框架里同時生成兩者，保證畫面和聲音的協調。
多模態輸入：支持文字轉視頻、圖片轉視頻、文字轉音頻、音頻轉視頻等多種組合方式。
開源可訓練：提供完整代碼和權重，用戶可以在本地訓練或微調，甚至用 LoRA 技朮快速定制風格。
高效推理：有精簡版（distilled）和量化版（fp8、fp4），在不同硬件環境下都能運行。
分辨率與幀率提升：配套的空間和時間“upscaler”可以讓視頻更清晰、幀率更高。
兼容生態：支持 PyTorch、Diffusers 庫，也能在 ComfyUI 里直接調用。

應用領域
創意視頻制作：輸入文字或圖片，快速生成短視頻，用於廣告、社交媒體或藝朮創作。
教育與培訓：老師可以用文字提示生成教學視頻，配合音頻講解。
遊戲與虛擬世界：為角色或場景生成動態視頻和音效，提升沉浸感。
多媒體內容創作：播客、短片、音樂視頻，都可以用 LTX-2 來自動生成或輔助制作。
個性化定制：通過微調模型，快速生成符合特定風格或品牌需求的內容。

使用教程：（建議N卡，顯存8G起，運存32G起，支持50系顯卡）

在撰寫寫作提示時，應着重於對動作與場景的詳細、按時間順序的描述。
需包含具體的動作、外貌特徵、鏡頭角度以及環境細節——所有這些內容都應整合在一段流暢的段落中。
直接從動作開始描述，保持描述的客觀性與精確性。可以想象自己是一名電影攝影師，
在為拍攝清單撰寫詳細說明。字數控制在200字以內。為獲得最佳效果，

請按照以下結搆來撰寫提示：
1. 用一句話概括核心動作；
2. 添加關於動作與姿勢的具體細節；
3. 准確描述人物/物體的外貌特徵；
4. 描述背景與環境細節；
5. 指明鏡頭角度與拍攝方式；
6. 描述光影與色彩效果；
7. 注意任何可能發生的變化或突發事件。

默認幀率是24/FPS，設置幀數應該是總幀數+1，比如要生成5秒的視頻，
總幀數應該是 24*5+1=121

檔案下載
下載左邊0116

作者: pig55570 時間: 2026-1-17 17:40
LTX-2 v3_0 WEBUI+ComfyUI 一鍵啟動。很實用的軟体，感謝大大分享 !!
作者: lwj278 時間: 2026-1-18 10:16
謝謝樓主無私分享,先收藏起來。

歡迎光臨冰楓論壇 (https://bingfong.com/) Powered by 冰楓