您的当前位置:首页 > 焦点 > 谷歌新技術可用AI模型為無聲視頻配音 圖為谷歌的新技型為logo 正文
时间:2025-01-18 13:09:46 来源:网络整理 编辑:焦点
谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的「video-to-audio」技術。圖為谷歌的logo。圖片來源:美聯社資料圖) 當前DeepMind 這款AI模型依然存在局限性
谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的谷歌「video-to-audio」技術。
當前DeepMind 這款AI模型依然存在局限性,術可視頻需要開發者使用提示詞為模型預先「介紹」視頻可能的無聲聲音,暫時不能直接根據視頻畫面添加具體音效。配音
據悉,谷歌該模型首先會將用戶輸入的新技型為視頻進行拆解,此後結合用戶的術可視頻用戶文字提示,利用擴散模型反覆運算,無聲最終以生成與視頻畫面協調的配音背景聲音,例如輸入一條「在黑暗中行走」的谷歌無聲視頻,再添加「電影、新技型為恐怖片、術可視頻音樂、無聲緊張、配音混凝土上的腳步聲」等文字提示,相關模型就能生成恐怖風格的背景音效。
DeepMind同時表示,該「video-to-audio」模型可以為任何視頻生成無限數量的音軌,還能夠通過提示詞內容判斷生成的音頻「正向性」或「反向性」,從而令生成的聲音更貼近某些特定場景。
(來源:第一財經)
責任編輯: 文劼《暗黑破坏神4》第六赛季“憎恨崛起”官网改动日志2025-01-18 13:04
歐元區9月綜合PMI初值低於預期 商業活動大幅萎縮2025-01-18 12:25
現場視頻!中國維和部隊營區外730米發生爆炸2025-01-18 11:47
新發現或有助治療急性紅白血病2025-01-18 11:43
史无前例!第三代Apple Watch SE将采用彩色塑料外壳:价格更亲民2025-01-18 10:42
以軍對黎巴嫩南部進行大規模打擊2025-01-18 10:41
我駐外使館舉辦系列活動 慶祝中華人民共和國成立75周年2025-01-18 10:36
捷克反對黨在地方選舉中獲勝2025-01-18 10:27
清晰版《王国》?2D横向策略《Monarchy》11月发售2025-01-18 10:25
阿塞拜疆稱亞美尼亞向阿軍隊陣地開火 亞方否認2025-01-18 10:24
首款真全白ITX小板!技嘉X870I AORUS PRO ICE迷你冰雕评测:性能强悍 不逊顶级大板2025-01-18 13:09
馬耳他總統表示期待進一步加強馬中兩國關係2025-01-18 12:48
美國旅行商沉浸式體驗「China Travel」2025-01-18 12:36
衝突加劇 以色列連續第二天對黎巴嫩發動「最猛烈空襲」2025-01-18 12:09
一天净赚超3400万元!长城汽车预计2024年净利润124亿至130亿元2025-01-18 12:06
美元指數26日下跌2025-01-18 12:06
美媒:哈里斯亞利桑那州競選辦公室遭槍擊損壞2025-01-18 11:59
魔芋胶的功效与作用及禁忌(魔芋胶)2025-01-18 11:52
玩家认为《漫威争锋》缺乏多样性 要求添加LGBT皮肤2025-01-18 11:50
以軍對黎巴嫩南部進行大規模打擊2025-01-18 10:49