一级A片线上/亚洲无人区电影完整版小视频/妻孝(改编版+续)/欧美涩涩

   中國金融網(wǎng) 加入收藏    設(shè)為首頁
首頁
國內(nèi)資訊社會(huì)財(cái)經(jīng)科技教育時(shí)尚娛樂房產(chǎn)家居汽車母嬰健康商業(yè)區(qū)塊鏈生活企業(yè)傳媒區(qū)域經(jīng)濟(jì)旅游體育
您現(xiàn)在的位置:首頁 > 聚焦 > 正文
OpenAI點(diǎn)燃AI魂,GPT-4o掀起端側(cè)革命
2024-05-15 03:20      來源:證券之星      編輯:安遠(yuǎn)      閱讀量:12765   

21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗 實(shí)習(xí)生鄧熙涵 北京報(bào)道 酷暑到來之前,OpenAI提前引爆了AI之夏。北京時(shí)間5月14日凌晨1點(diǎn),OpenAI舉行春季發(fā)布會(huì)。會(huì)上,重點(diǎn)推出新旗艦?zāi)P虶PT-4o,以及在ChatGPT中免費(fèi)提供更多功能。GPT-4o在多模態(tài)交互領(lǐng)域開始了現(xiàn)象級(jí)橫掃。

人類津津樂道的智能AI助手,面目逐漸清晰:除了尚未具身,無縫語音對話、精確到細(xì)節(jié)的視覺信息處理、情緒檢測技術(shù)及共情能力,幾乎都與真人無異。而比人類更強(qiáng)的是,這個(gè)AI情緒穩(wěn)定,天文地理無所不知,解決問題的能力也是一流。

業(yè)內(nèi)因GPT-4o沸騰起來,盛贊一如往常,“大模型從‘呆瓜’變‘真人’,交互能力革新帶來的可能是場景、用戶數(shù)的幾何級(jí)放大”;“OpenAI將蠶食情感類人工智能助手的市場,向更具情感、個(gè)性更強(qiáng)的人工智能邁進(jìn)”;“要重新理解機(jī)器視覺、聽覺了”……

不過,喧囂之下,也有一些客觀聲音,在審視OpenAI技術(shù)層面的進(jìn)展。GPT-4o的廣泛真實(shí)體驗(yàn),能否全部達(dá)到視頻演示中的極高水準(zhǔn),仍有待驗(yàn)證。

IDC中國研究總監(jiān)盧言霞告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,OpenAI本次發(fā)布會(huì)的現(xiàn)場演示中,視頻采用的還是抽幀處理技術(shù),即Image to text,語音交互還是之前的全雙工技術(shù),只是多模態(tài)對話的過程更順暢更自然。但確實(shí)進(jìn)一步提高了類GPT產(chǎn)品的智能化交互能力,弱化了背后的代碼,簡化了交互的流程。GPT-4o不會(huì)砸掉所有語音助手的飯碗,反而是大模型在端側(cè)的落地迎來雙贏可能。

科幻電影《Her》中所展現(xiàn)的圖景似乎成為可能,人類距離真正的AI Agent還有多遠(yuǎn)?是否會(huì)引發(fā)新一輪的AI Agent變革?可以肯定的是,GPT-4o已經(jīng)揭開AI行業(yè)變化與競爭的新篇章。

“AI背后藏了個(gè)真人”

GPT-4o的“o”代表“omni”,象征著全能。該模型多模態(tài)交互能力突出,能夠接受文本、音頻和圖像的“混搭”輸入,快速響應(yīng)完成推理,生成文本、音頻和圖像的組合輸出。

音頻輸入層面,GPT-4o擊穿了此前Siri等智能語音助手的延遲弊端,取得突破性進(jìn)展。其響應(yīng)速度之快,達(dá)到了人類級(jí)別,至短232毫秒,平均320毫秒。

此外,新模型展現(xiàn)出對人類交流習(xí)慣的高度理解力和適應(yīng)性。GPT-4o能以聽起來非常自然的人類聲音說話,并且發(fā)出多種語氣詞,表現(xiàn)了此前AI音頻所未能達(dá)到的張力和可塑性。

它能夠接受人類交談中的打斷習(xí)慣,及時(shí)停頓并給出無縫回復(fù),并且保持對上下文的記憶。這種自然的交互體驗(yàn),讓人幾乎感覺不到與機(jī)器的界限。

視頻輸入方面,GPT-4o可以及時(shí)響應(yīng)高管開啟攝像頭的視頻需求指令,實(shí)時(shí)解決一元方程的數(shù)學(xué)計(jì)算,整個(gè)過程同樣絲滑迅速。

市面上已有一部分情感型人工智能機(jī)器人,比普通人工智能助手更能準(zhǔn)確識(shí)別人類情緒。然而,上述功能多停留在文本中,GPT-4o的情緒檢測功能則擴(kuò)展至視頻領(lǐng)域。

發(fā)布會(huì)現(xiàn)場,研究人員將手機(jī)攝像頭對準(zhǔn)自己的臉,向GPT-4o發(fā)起了頗具挑戰(zhàn)性的問題:“我看起來怎么樣?”,GPT-4o初次回答將提問者的臉界定為“木質(zhì)表面”。隨后,GPT-4o在引導(dǎo)性提問下修正結(jié)果,準(zhǔn)確分析出提問者的情緒狀態(tài)是愉悅的、笑容滿面的。

從底層技術(shù)分析,GPT-4o的先進(jìn)之處在于,它革新了傳統(tǒng)的多模型串聯(lián)處理方式,能夠通過單一的神經(jīng)網(wǎng)絡(luò)統(tǒng)一處理所有的輸入和輸出,無論是文本、視覺圖像還是音頻信息,都能得到精準(zhǔn)高效的解析和回應(yīng)。

OpenAI并不是首家運(yùn)用情感智能技術(shù)的公司。Inflection AI發(fā)布的Pi已能成熟運(yùn)用大語言模型的對話共情回復(fù)技術(shù),實(shí)現(xiàn)人類“嘴替”的效果,提供沉浸式的虛擬情感陪伴。

英偉達(dá)高級(jí)研究科學(xué)家兼人工智能代理負(fù)責(zé)人Jim Fan發(fā)文稱贊GPT-4o的情感能力,令人聯(lián)想到 2013 年的科幻電影《Her》。這部電影講述了人機(jī)親密關(guān)系——遭遇離婚風(fēng)波的男主角西奧多與人工智能系統(tǒng)薩曼莎成為靈魂伴侶。

Jim Fan認(rèn)為,OpenAI將蠶食Character.AI等情感類人工智能助手的市場,向更具情感、個(gè)性更強(qiáng)的人工智能邁進(jìn)。

繼發(fā)布文生視頻大模型Sora后,GPT-4o有望成為邁向多模態(tài)智能體的又一座里程碑。

巨頭焦慮與端側(cè)革命

OpenAI的大模型庫再添GPT-4o一員猛將,預(yù)示著AI Agent已至新賽點(diǎn),再次撥快了人類循序漸進(jìn)邁向GAI的時(shí)針。

從技術(shù)定義來看,AI Agent是通用人工智能的終極目標(biāo),以大語言模型為大腦驅(qū)動(dòng),不需要人類的指揮,具有自主性,能獨(dú)立思考并運(yùn)行相應(yīng)程序。

市場嗅到了技術(shù)帶來的機(jī)會(huì)風(fēng)口,AI Agent成為科技巨頭競相追逐的前沿方向。目前,已經(jīng)出現(xiàn)不少泛化的Agent概念產(chǎn)品,微軟的Copilot,谷歌的Gemini都是這一隊(duì)列中曾被寄予厚望的數(shù)字助手。

如今,GPT-4o的加速推出革新了智能交互的表現(xiàn)。前DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心創(chuàng)始人胡延平認(rèn)為,GPT-4o重新定義了機(jī)器視覺、聽覺和攝像頭的交互模式,應(yīng)用爆發(fā)力不可估量。

新技術(shù)進(jìn)展為巨頭們的錯(cuò)失恐懼又添一把火。據(jù)悉,谷歌計(jì)劃在2024年I/O開發(fā)者大會(huì)上推出個(gè)性化數(shù)字助手“Pixie”,由Gemini驅(qū)動(dòng),有望整合多模態(tài)功能。

微軟也在蓄力開拓AI Agent的新場景。為了打造個(gè)性化聊天機(jī)器人,3月19日,微軟已與Inflection AI達(dá)成協(xié)議,獲得其核心技術(shù)授權(quán);針對現(xiàn)有最接近AI Agent的Copilot,微軟正努力解決如何為生成式AI提供良好提示詞,為Copilot for Micorosft 365提供Prompt補(bǔ)全功能。

AI Agent的爆發(fā)之年,蘋果同樣意圖升級(jí)被詬病“古老過時(shí)”的Siri。有知情人士稱,蘋果或?qū)⒃趇OS 18中引入由ChatGPT 提供支持的聊天機(jī)器人。

更自然、更“類人”的GPT-4o掀起的巨大波瀾,不僅影響上游廠商,還將波及產(chǎn)業(yè)鏈下游的終端廠商。OpenAI此次發(fā)布會(huì)呈現(xiàn)的新模型多基于手機(jī)端場景,為處于產(chǎn)業(yè)爆發(fā)前夜的AI手機(jī)產(chǎn)業(yè)帶來新想象。

市面上AI手機(jī)等端側(cè)智能體的生態(tài)離不開大模型技術(shù)底座,智能終端廠家需要重新審視底層大模型能力。

相較于單個(gè)AI應(yīng)用,AI手機(jī)的賣點(diǎn)一直是人格化、記憶、感知和管理能力,跨APP交互能力。而具備情緒價(jià)值和自然交互能力的GPT-4o走入市場,要么會(huì)顛覆一眾AI手機(jī),要么會(huì)讓留下來的AI手機(jī)“如虎添翼”。

盧言霞告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,“GPT-4o意味著大模型在端側(cè)的落地更進(jìn)一步。短時(shí)間內(nèi),肯定是誰的端側(cè)交互能力強(qiáng),誰就會(huì)贏得用戶。在中長周期內(nèi),后來者也會(huì)迎頭趕上。應(yīng)該說,這是端側(cè)與AI助手的雙贏,畢竟上游廠商沒有精力面向每個(gè)場景做優(yōu)化與工程化,還是需要產(chǎn)業(yè)鏈的協(xié)作。”

鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場無關(guān)。僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。

 
上一篇: 實(shí)拍紅旗EH7:最高續(xù)航820km+軸距3000mm,能否打動(dòng)你?
下一篇:最后一頁
 
     欄目排行
  1. 實(shí)拍紅旗EH7:最高續(xù)航820km+軸距
  2. 領(lǐng)略小鵬G6智能駕駛的卓越技術(shù),盡享春日
  3. 寶駿悅也2024款正式上市售價(jià)8.08萬
  4. 九牧集團(tuán)攜六大品牌實(shí)力亮相中國國際廚衛(wèi)展
  5. 預(yù)售30萬起,四缸比六缸的坦克330還貴
  6. 顏值碾壓飛度,寶駿悅也Plus外觀公布,
  7. 今年銷量突漲800多倍悍馬變純電版突然受
  8. 平安產(chǎn)險(xiǎn)南平中心支公司:同掃一條街 共建
  9. 平安產(chǎn)險(xiǎn)莆田中心支公司:關(guān)愛老人 與愛同
  10. 平安產(chǎn)險(xiǎn)南平中心支公司:關(guān)愛老人 溫暖相
     欄目推薦
二手房“帶押過戶”啟動(dòng)滿月 成功嘗鮮者寥寥無幾二手房“帶押過戶”啟動(dòng)滿月 成功嘗鮮者寥寥無幾
2022年?duì)I收78.61億,湯臣倍健迎來VDS行業(yè)新2022年?duì)I收78.61億,湯臣倍健迎來VDS行業(yè)新周期
大興國際氫能示范區(qū)兼顧產(chǎn)業(yè)發(fā)展和配套服務(wù)打造員工理想大興國際氫能示范區(qū)兼顧產(chǎn)業(yè)發(fā)展和配套服務(wù)打造員工理想生活藍(lán)本
迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡
綠色塞罕壩 不朽的奇跡綠色塞罕壩 不朽的奇跡