用于合成音頻的人工智能模型

發(fā)布:cyqdesign 2022-11-20 20:41 閱讀:598
11月20日消息,微軟近日在 WIPO 知識產(chǎn)權門戶網(wǎng)站上提交了一項專利,專利題為“用于合成音頻的人工智能模型”。 S09Xe_q  
+xYg<AFS  
專利說明微軟正在發(fā)明一種智能音頻合成技術,用于為各種媒體如電影、電視節(jié)目、游戲,甚至現(xiàn)場錄音創(chuàng)造聲音、音樂和其它音頻元素。該專利提到了游戲中的動態(tài)時刻,表明它可以創(chuàng)造出配合玩家行動的樂譜。該專利的摘要指出,可以使用視覺、音頻和文本特征及提示(統(tǒng)稱為“數(shù)據(jù)集”)來設置參數(shù),以指導眾多的人工智能模型構建音頻樂譜。 -e+im(2D=  
P@Pe5H"o  
據(jù)介紹,人工智能在視頻游戲中發(fā)揮著不可或缺的作用。從敵人的行為和戰(zhàn)斗遭遇到程序性關卡的生成以及與 NPC 和環(huán)境的互動,人工智能在游戲開發(fā)的各個層面都是不可或缺的。在聲音設計方面,自適應 / 動態(tài)配樂在許多視頻游戲中都有體現(xiàn),如現(xiàn)代《毀滅戰(zhàn)士》游戲、《合金裝備崛起》、《鬼泣 5》等。 EM'#'fBZ>Y  
\LM{.g zT  
微軟的新專利描述詳細介紹了眾多的人工智能引擎,這些引擎的任務是根據(jù)提供的數(shù)據(jù)集進行音頻播放。他們可以分析人類的表情和情緒,收集位置數(shù)據(jù),分析形勢的基調(diào)等等。人工智能可以學習圖片、視頻、電影、現(xiàn)場活動,并產(chǎn)生一組音頻文件,可以用適當?shù)穆曇粜Ч鸵魳窞橐曈X效果分層。這種高科技的人工智能可以為媒體創(chuàng)作開辟許多令人興奮的道路,人們可以用一個巨大的、不斷增長的音頻樂譜庫來制作電影、游戲等,例如為英雄的出場設計一首史詩般的管弦樂曲,為寵物的離去譜寫一首憂郁的曲子,為槍聲和爆炸開發(fā)音效,所有這些都可以委托給人工智能的算法。 ng[LSB*57Y  
~(.&nysZ-  
據(jù)了解,該技術將由云計算驅(qū)動。該系統(tǒng)何時能真正投入使用還有待觀察,但音頻設計的未來看起來很有希望,微軟可能會在這方面掌舵一場革命。
關鍵詞: 人工智能
分享到:

最新評論

我要發(fā)表 我要評論
限 50000 字節(jié)
關于我們
網(wǎng)站介紹
免責聲明
加入我們
贊助我們
服務項目
稿件投遞
廣告投放
人才招聘
團購天下
幫助中心
新手入門
發(fā)帖回帖
充值VIP
其它功能
站內(nèi)工具
清除Cookies
無圖版
手機瀏覽
網(wǎng)站統(tǒng)計
交流方式
聯(lián)系郵箱:廣告合作 站務處理
微信公眾號:opticsky 微信號:cyqdesign
新浪微博:光行天下OPTICSKY
QQ號:9652202
主辦方:成都光行天下科技有限公司
Copyright © 2005-2024 光行天下 蜀ICP備06003254號-1