一级A片线上/亚洲无人区电影完整版小视频/妻孝(改编版+续)/欧美涩涩

   中國金融網 加入收藏    設為首頁
首頁
國內資訊社會財經科技教育時尚娛樂房產家居汽車母嬰健康商業區塊鏈生活企業傳媒區域經濟旅游體育
您現在的位置:首頁 > 國內資訊 > 正文
雖然不是完全一樣AI的改法大大提高了代碼的可讀性
2021-08-03 12:25      來源:IT之家      編輯:樊華      閱讀量:11804   

有的人能把代碼寫成推理小說需要一個臨時變量的時候就叫 temp,需要多個就叫 var1,var2甚至用拼音縮寫當函數名,比如查詢訂單就叫 cxdd

要想看懂這樣的代碼,得聯系上下文反復推敲,還原每個部分的真實作用。

這個過程叫做反混淆 麻煩,著實麻煩就沒有省事兒點的辦法嗎

讓 AI 來啊!

最近,Facebook 就出了這樣一個語言模型 DOBF,專治代碼混淆像下圖這種,所有不影響運行的變量名,函數名,類名,都被替換成無意義的符號,AI 都能作出猜測并嘗試還原

來看看和正確答案的對比,雖然不是完全一樣,但 AI 的改法也大大提高了代碼的可讀性。

像 FUNC_0,源代碼中是重置參數,AI 改成初始化權重,也完全說得通。

DOBF 模型目前除了 Python 還支持 C++ 和 Java。

編碼不規范的人畢竟是少數,這個模型更廣泛的用途是恢復故意做混淆以保護知識產權的代碼,比如這種:

代碼寫好后,把不影響編譯運行的部分,批量替換成人類難以分辨的符號,給破譯增加難度。

在這之前也有掩碼語言模型 用于恢復被遮蔽的文本。

用于恢復代碼的有哈工大 amp, 微軟開發的 CodeBERT 和 Facebook 之前開發的 TransCoder,但效果都不如最新的 DOBF。

DOBF 超過它們靠的不是模型架構上的創新或數據集的完善,而是提出了新的預訓練任務。

合理的任務指導 AI 學習

之前的掩碼語言模型多是隨機選擇要掩蔽的部分,經常會選到括號逗號這種對 AI 來說沒什么難度的。

DOBF 的做法是指定遮蔽變量名,函數名和類名并讓 AI 去恢復,這個任務難度更大,能迫使 AI 學到更深層的規律。

另外還用相同的符號替代多次出現的同一名稱,這樣可以防止 AI 發現有的名字可以復制粘貼之后學會偷懶走捷徑。

像上圖中的變量 V3,AI 從第 3 行的定義可以看出這個變量是 List 類型,再一看第 5 行調用的是 pop 。

這不是先進先出嘛,AI 就會命名成 queue 而不是 stack 了。

更厲害的還在后面,DOBF 通過代碼內容甚至能判斷出相應函數是生成斐波那契數列和做向量點積的。

DOBF 在架構上其實沒有特別的設計,只是為了公平對比分別訓練了兩個和 CodeBERT,TransCoder 層數一樣的模型。

成功的關鍵之處就在于合理的訓練任務。

微調一下能完成更多任務

驗證了這個方法有效后,Facebook 把這個訓練任務提取出來稱為 DOBF 任務,還可以用于訓練其他語言模型。

比如在 TransCoder 模型上把 DOBF 作為預訓練任務,再用 CodeXGLUE 基準測試中的下游任務進行微調。

結果在代碼抄襲檢測,總結代碼生成文檔,和自然語言搜索代碼片段這 3 個任務上,使用 DOBF 或 MLM+DOBF 預訓練都取得了更好的成績。

Facebook 下一步還要以 DOBF 作為指導,看看能不能為自然語言設計更好的預訓練目標。

不過代碼上的事還不算完,人類在混淆代碼上可是無所不用其極的。

期待著有一天,AI 連國際 C 語言混亂代碼大賽上的變態代碼也能看懂。

Github 地址:

論文地址:

國際 C 語言混亂代碼大賽:

鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。

 
上一篇: 這次榮耀平板V7Pro將在AI技術的加持下全面升級這對于粉絲來說無疑是一
下一篇:最后一頁
 
     欄目排行
  1. 這次榮耀平板V7Pro將在AI技術的加持
  2. 新A股總市值達134.69億元累計換手率
  3. 微軟近一直在大力推動Teams在企業和消
  4. 海昏侯文物令外賓大開眼界歷史的厚重感便撲
  5. 中國科大郭光燦院士團隊在基于離子阱系統尋
  6. 酒類股發力走高三大黃酒股集體拉升金楓酒業
  7. 0x00什么是漏斗分析它一定有數據作為支
  8. 和在售歐尚X5相比青春版外觀設計年輕時尚
  9. 這已是股東戶數連續第4期下降累計降幅達1
  10. 蔚來Gemini車型竟然是蔚來ES7并非
     欄目推薦
二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾
2022年營收78.61億,湯臣倍健迎來VDS行業新2022年營收78.61億,湯臣倍健迎來VDS行業新周期
大興國際氫能示范區兼顧產業發展和配套服務打造員工理想大興國際氫能示范區兼顧產業發展和配套服務打造員工理想生活藍本
迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡
綠色塞罕壩 不朽的奇跡綠色塞罕壩 不朽的奇跡