一级A片线上/亚洲无人区电影完整版小视频/妻孝(改编版+续)/欧美涩涩

   中國(guó)金融網(wǎng) 加入收藏    設(shè)為首頁(yè)
首頁(yè)
國(guó)內(nèi)資訊社會(huì)財(cái)經(jīng)科技教育時(shí)尚娛樂(lè)房產(chǎn)家居汽車母嬰健康商業(yè)區(qū)塊鏈生活企業(yè)傳媒區(qū)域經(jīng)濟(jì)旅游體育
您現(xiàn)在的位置:首頁(yè) > 國(guó)內(nèi)資訊 > 正文
微軟發(fā)布AI聲音生成工具VALL-E,只需3秒音頻即可模仿人說(shuō)話
2023-01-10 12:56      來(lái)源:IT之家      編輯:葉知秋      閱讀量:17278   

感謝本站的朋友OC_Formula的線索傳遞!

,微軟最近發(fā)布了一款名為VALL—E的人工智能工具,它可以只用3秒鐘的音頻來(lái)模仿人類說(shuō)話。

這個(gè)工具由6萬(wàn)小時(shí)的英語(yǔ)語(yǔ)音數(shù)據(jù)訓(xùn)練,使用特定語(yǔ)音的3秒片段生成內(nèi)容與目前的許多人工智能工具不同,VALL—E可以復(fù)制說(shuō)話者的情緒和語(yǔ)氣,甚至說(shuō)話者自己從未說(shuō)過(guò)的話也可以模仿

本站了解到,康奈爾大學(xué)的一篇論文用VALL—E合成了幾種聲音,你可以在GitHub上聽(tīng)聽(tīng)AI合成的音頻。

研究人員指出,在許多情況下,Vall—E的性能優(yōu)于當(dāng)前的文本到語(yǔ)音轉(zhuǎn)換模型可是,該研究也寫道,目前人工智能模型存在幾個(gè)問(wèn)題例如,文本提示中的一些單詞可能發(fā)音不清楚,被完全省略或在輸出中出現(xiàn)兩次此外,這種模型目前很難模仿一些聲音,尤其是帶有口音的聲音

像其他新的人工智能技術(shù)一樣,VALL E也引起了安全和道德方面的擔(dān)憂微軟已經(jīng)發(fā)布了一份關(guān)于VALL—E使用的道德聲明,但是對(duì)于其未來(lái)的用途并沒(méi)有明確的解釋

目前微軟Vall—E并沒(méi)有開(kāi)源微軟在GitHub上創(chuàng)建了一個(gè)Vall—E資源庫(kù),但目前只包含一個(gè)描述文件

鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

 
上一篇: 抓住ChatGPT爆紅機(jī)遇,微軟計(jì)劃對(duì)其開(kāi)發(fā)商投資100億美元
下一篇:最后一頁(yè)
 
     欄目排行
  1. 抓住ChatGPT爆紅機(jī)遇,微軟計(jì)劃對(duì)其
  2. 興亦壟斷衰亦壟斷
  3. 投行人才流動(dòng)加快頭部券商強(qiáng)者恒強(qiáng)
  4. 微星新款泰坦GT77HX首發(fā)4K144H
  5. 創(chuàng)新·開(kāi)拓·堅(jiān)韌·篤行:記華安保險(xiǎn)創(chuàng)新業(yè)
  6. 三星預(yù)估2022Q4營(yíng)業(yè)利潤(rùn)暴跌69%,
  7. 預(yù)估第一季DRAM均價(jià)跌幅收斂至13%-
  8. 萊克天狼星吸塵洗地機(jī),功能全面更省心,引
  9. 樹(shù)莓派推出新一代相機(jī)模塊CameraMo
  10. Meta將停止初代Quest功能更新,取
     欄目推薦
二手房“帶押過(guò)戶”啟動(dòng)滿月 成功嘗鮮者寥寥無(wú)幾二手房“帶押過(guò)戶”啟動(dòng)滿月 成功嘗鮮者寥寥無(wú)幾
2022年?duì)I收78.61億,湯臣倍健迎來(lái)VDS行業(yè)新2022年?duì)I收78.61億,湯臣倍健迎來(lái)VDS行業(yè)新周期
大興國(guó)際氫能示范區(qū)兼顧產(chǎn)業(yè)發(fā)展和配套服務(wù)打造員工理想大興國(guó)際氫能示范區(qū)兼顧產(chǎn)業(yè)發(fā)展和配套服務(wù)打造員工理想生活藍(lán)本
迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒(méi)有年齡迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒(méi)有年齡
綠色塞罕壩 不朽的奇跡綠色塞罕壩 不朽的奇跡