一级A片线上/亚洲无人区电影完整版小视频/妻孝(改编版+续)/欧美涩涩

   中國金融網 加入收藏    設為首頁
首頁
國內資訊社會財經科技教育時尚娛樂房產家居汽車母嬰健康商業區塊鏈生活企業傳媒區域經濟旅游體育
您現在的位置:首頁 > 社會 > 正文
神經網絡為何越大越好?NeurIPS論文證明:魯棒性是泛化的基礎
2022-02-23 04:41      來源:TechWeb      編輯:牧曉      閱讀量:8112   

當神經網絡的研究方向逐漸轉為超大規模預訓練模型,研究人員的目標似乎變成了讓網絡擁有更大的參數量,更多的訓練數據,更多樣化的訓練任務。

神經網絡為何越大越好?NeurIPS論文證明:魯棒性是泛化的基礎

當然,這個措施確實很有效,伴隨著神經網絡越來越大,模型了解和掌握的數據也更多,在部分特定任務上已經超越人類。

但在數學上,現代神經網絡的規模實際上有些過于臃腫了,參數量通常遠遠超過了預測任務的需求,這種情況也被稱為過度參數化。

NeurIPS上的一篇論文中最近就這一現象提出了一種全新的解釋他們認為這種比預期規模更大的神經網絡是完全有必要的,只有這樣才能避免某些基本問題,這篇論文中的發現也為這一問題提供一種更通用的見解

神經網絡就該這么大

神經網絡的一項常見任務是識別圖像中的目標對象。。

為了創建一個能夠完成該任務的網絡,研究人員首先為其提供許多圖像和對應目標標簽,對其進行訓練以學習它們之間的相關性之后,網絡將正確識別它已經看到的圖像中的目標

換句話說,訓練過程使得神經網絡記住了這些數據。

并且,一旦網絡記住了足夠多的訓練數據,它還能夠以不同程度的準確度預測它從未見過的物體的標簽,這個過程稱為泛化。

網絡的大小決定了它能記憶多少東西。

可以用圖形化的空間來理解假設有兩個數據點,把它們放在一個XY平面上,可以用一條由兩個參數描述的線來連接這些點:線的斜率和它與縱軸相交時的高度如果其他人也知道這條直線的參數,以及其中一個原始數據點的X坐標,他們可以通過觀察這條直線來計算出相應的Y坐標

也就是說,這條線已經記住了這兩個數據點,神經網絡做的就是差不多類似的事情。

例如,圖像是由成百上千的數值描述的,每個像素都有一個對應的值可以把這個由許多自由值組成的集合在數學上相當于高維空間中一個點的坐標,坐標的數量也稱為維度

傳統的數學結論認為,要用一條曲線擬合n個數據點,你需要一個有n個參數的函數例如,在直線的例子中,兩個點是由一條有兩個參數的曲線描述的

當神經網絡在20世紀80年代首次作為一種新模型出現時,研究人員也這么認為,應該只需要n個參數來適應n個數據點,而跟數據的維度無關。

德克薩斯大學奧斯汀分校的Alex Dimakis表示,現在實際情況已經不是這樣了,神經網絡的參數數量遠遠超過了訓練樣本的數量,這說明了教科書上的內容必須得重寫進行修正。本次團隊設計的這個芯片因為要植入體內,普通的AI芯片材料在重量,體積和散熱方面的限制肯定不行。

研究人員正在研究神經網絡的魯棒性,即網絡處理小變化的能力例如,一個不魯棒的網絡可能已經學會了識別長頸鹿,但它會把一個幾乎沒有修改的版本誤標為沙鼠

2019年,Bubeck和同事們正在尋求證明關于這個問題的定理,當時他們就意識到這個問題與網絡的規模有關。

在他們的新證明中,研究人員表明,過度參數化對于網絡的魯棒性是必要的他們提出平滑性,來指出需要多少個參數才能用一條具有等同于魯棒性的數學特性的曲線來擬合數據點

要想理解這一點,可以再次想象平面上的一條曲線,其中x坐標代表一個像素的顏色,y坐標代表一個圖像標簽。

由于曲線是平滑的,如果你稍微修改一下像素的顏色,沿著曲線移動一小段距離,相應的預測值只會有少量的變化另一方面,對于一條鋸齒狀的曲線,X坐標的微小變化會導致Y坐標的巨大變化,長頸鹿可以變成沙鼠

Bubeck和Sellke在論文中證明,平滑擬合高維數據點不僅需要n個參數,而且需要ntimes,d個參數,其中d是輸入的維度。

換句話說,如果你想讓一個網絡穩健地記住它的訓練數據,過度參數化不僅是有幫助的,而且是必須的該證明依賴于一個關于高維幾何的事實,即隨機分布在球體表面的點幾乎都是彼此相距一個直徑的距離,點與點之間的巨大間隔意味著用一條光滑的曲線來擬合它們需要許多額外的參數

耶魯大學的Amin Karbasi稱贊論文中的證明是非常簡潔的,沒有大量的數學公式,而且它說的是非常通用的內容。

這一證明結果也為理解為什么擴大神經網絡的簡單策略如此有效提供了一個新的途徑。

其他研究揭示了過量參數化有幫助的其他原因例如,它可以提高訓練過程的效率,也可以提高網絡的泛化能力

雖然我們現在知道過量參數化對魯棒性是必要的,但還不清楚魯棒性對其他事情有多大必要但通過將其與過度參數化聯系起來,新的證明暗示魯棒性可能比人們想象的更重要,這也可能為其他解釋大模型的益處研究做鋪墊

魯棒性確實是泛化的一個先決條件,如果你建立了一個系統,只是輕微地擾動它,然后它就失控了,那是什么樣的系統顯然是不合理的

所以,Bubeck認為這是一個非常基礎和基本的要求。

鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。

 
上一篇: 李斌掉進了用戶陷阱
下一篇:最后一頁
 
     欄目排行
  1. 李斌掉進了用戶陷阱
  2. 向比亞迪等供貨勝藍股份2021年新能源連
  3. 消息稱蘋果AR/VR頭顯將在8-9月量產
  4. 廣佛高速要免費了曾年入4.7億元車流量超
  5. 七高校獲批市級工程研究中心
  6. 新華人壽去年第四季度疾病保險糾紛投訴量位
  7. 龍源電力:可再生能源補貼發放的計算標準是
  8. 消息稱英飛凌發信函暗示芯片將漲價產能吃緊
  9. 2020路虎攬勝極光第一版P250首測:
  10. 焦點訪談:精彩冬奧群星閃耀國之榮光
     欄目推薦
二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾
2022年營收78.61億,湯臣倍健迎來VDS行業新2022年營收78.61億,湯臣倍健迎來VDS行業新周期
大興國際氫能示范區兼顧產業發展和配套服務打造員工理想大興國際氫能示范區兼顧產業發展和配套服務打造員工理想生活藍本
迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡
綠色塞罕壩 不朽的奇跡綠色塞罕壩 不朽的奇跡