您的当前位置:首页 > 焦点 > 谷歌新技術可用AI模型為無聲視頻配音 圖為谷歌的新技型為logo 正文
时间:2025-02-21 23:26:05 来源:网络整理 编辑:焦点
谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的「video-to-audio」技術。圖為谷歌的logo。圖片來源:美聯社資料圖) 當前DeepMind 這款AI模型依然存在局限性
谷歌DeepMind近日公布了一項利用AI為無聲視頻生成背景音樂的谷歌「video-to-audio」技術。
當前DeepMind 這款AI模型依然存在局限性,術可視頻需要開發者使用提示詞為模型預先「介紹」視頻可能的無聲聲音,暫時不能直接根據視頻畫面添加具體音效。配音
據悉,谷歌該模型首先會將用戶輸入的新技型為視頻進行拆解,此後結合用戶的術可視頻用戶文字提示,利用擴散模型反覆運算,無聲最終以生成與視頻畫面協調的配音背景聲音,例如輸入一條「在黑暗中行走」的谷歌無聲視頻,再添加「電影、新技型為恐怖片、術可視頻音樂、無聲緊張、配音混凝土上的腳步聲」等文字提示,相關模型就能生成恐怖風格的背景音效。
DeepMind同時表示,該「video-to-audio」模型可以為任何視頻生成無限數量的音軌,還能夠通過提示詞內容判斷生成的音頻「正向性」或「反向性」,從而令生成的聲音更貼近某些特定場景。
(來源:第一財經)
責任編輯: 文劼动作冒险游戏《永恒之链》主线剧情时长25小时 2025年发售2025-02-21 23:17
世嘉年度游戏销量报告:《索尼克》系列达16亿部2025-02-21 22:58
《炉石传说》国服为开服问题道歉 将补偿10个卡包2025-02-21 22:40
今晚20点!KK官方对战平台携手sky邀你来看war3年度大动作!2025-02-21 22:31
无双动作×Roguelite!无双新作《无双深渊》现已发售2025-02-21 22:30
看电视人多了!官方:电视已全面取消开机广告2025-02-21 21:56
ag99950g纪念币多少钱(纪念币上ag999是什么意思)2025-02-21 21:06
《黑神话:悟空》DLC确认开发中 游戏周边在考虑中2025-02-21 20:48
《夺宝奇兵:古老之圈》重玩功能曝光 现场演示欣赏2025-02-21 20:48
泄露指出《刺客信条:影》将拥有可自定义的房屋建造系统2025-02-21 20:40
捷豹终身保养才做一次4S店就关门了 车主:钱也没说退2025-02-21 23:15
企业计提职工教育经费会计核算(计提职工教育经费会计分录)2025-02-21 22:59
还有高手?《教父》导演新片《大都会》票房可能不如《无主之地》2025-02-21 22:16
《博德之门3》四号补丁上线 包含1000多项修复调整2025-02-21 22:12
《暗黑破坏神4:憎恨之躯》新职业灵巫科隆展12分钟试玩2025-02-21 22:10
国家广电总局:电视内置机顶盒有望年底前完成样机研制2025-02-21 22:08
安卓打电话软件开源(安卓打电话软件)2025-02-21 21:28
偶然误差有哪些(偶然误差)2025-02-21 21:23
《仙剑世界》预下载&预创角开启 2月19日早8点开服2025-02-21 21:09
东方之珠歌曲罗大佑演唱(东方之珠原唱罗大佑)2025-02-21 21:06