|
軟體名稱:TIGER-audio-extraction(多用途語音分離模型)
軟體版本:New
軟體類型:一鍵啟動
軟體語言: 多語 簡
檔案大小:3.1Gb
TIGER 是一種羽量級語音分離模型,通過頻段分割、多尺度及全頻幀建模有效提取關鍵聲學特徵。 該專案由來自清華大學主導研發,通過頻率帶分割、多尺度以及全頻率幀建模的方式,有效地提取關鍵聲學特徵, 從而實現高效的語音分離。 TIGER 模型大小不到20M,即使CPU也可以流暢運行,且支援人聲伴奏分離(音訊檔中分離人聲和伴奏)、 音訊說話人分離(從多個說話人音訊中分離出每個說話人的聲音)、視頻降噪以及視頻語音分離等功能。
應用領域
語音通信:在多人語音通信場景中,TIGER可以有效分離出各個說話人的聲音,提高通話品質和清晰度。 智能語音辨識:在智慧家居、車載系統等智慧語音辨識應用中,TIGER能夠説明系統更準確地識別使用者的指令, 提升使用者體驗。 音訊處理軟體:作為音訊處理軟體中的一個元件,TIGER可以用於音訊編輯、混音等場景, 實現音訊信號的精細分離和處理。 遠端教育和會議:在遠端教育和 線上會議中,TIGER能夠分離出各個參與者的聲音, 減少背景雜音和干擾,提高溝通效率。
使用說明:
(CPU可流暢運行。建議N卡,顯存4G起。支援50系顯卡,基於CUDA12.8)
檔案下載
下載 (進門左下0529)
|