一级A片线上/亚洲无人区电影完整版小视频/妻孝(改编版+续)/欧美涩涩

   中國金融網 加入收藏    設為首頁
首頁
國內資訊社會財經科技教育時尚娛樂房產家居汽車母嬰健康商業區塊鏈生活企業傳媒區域經濟旅游體育
您現在的位置:首頁 > 財經 > 正文
意味著谷歌Tensor是探索新工作負載的起點現有芯片解決方案無法實現既定目標
2021-11-05 08:39      來源:IT之家      編輯:文輝      閱讀量:15494   

因為最后一款替代品驍龍765G的騷操作,在大家的心目中,谷歌Pixel系列被視為下一代Pixel 6系列就不一樣了,包括谷歌自研的SoC——Google Tensor,與時俱進的相機硬件,相對大方的價格

意味著谷歌Tensor是探索新工作負載的起點現有芯片解決方案無法實現既定目標

重回旗艦市場的計算攝影巨頭終于愿意用現代CMOS了!機器立即跑去告訴對方,直到國外用戶拿到真機,Anandtech才公布了對Google Tensor的測試結果和分析.

自學還是魔改。

意味著谷歌Tensor是探索新工作負載的起點,現有芯片解決方案無法實現既定目標憑借多年的機器學習研究經驗,谷歌將Tensor打造成了一款以機器學習為差異化的SoC,據說能讓Pixel實現很多獨特的新功能

關于谷歌張量的第一個爭議是它是自研還是魔改這是你對自我研究的定義谷歌和三星看似緊密的合作模糊了傳統自研和半定制的界限

在谷歌內部,谷歌Tensor的代號是GS101,可能是谷歌SoC或者谷歌Silicon的意思至于之前爆料的Whitechapel,沒有證據表明是真的芯片

Google Tensor基本遵循三星Exynos的命名規則,其ID為0x09845000,拆解后可以看到絲印為S5P9845作為參考,三星Exynos 2100的ID為S5E9840,Exynos 1080為S5E9815

幾年前,有消息稱三星開始提供半定制芯片服務當時有三星,思科,谷歌合作的消息ETNews在2020年8月的文章中提到,三星將根據客戶需求提供定制化的技術和功能,甚至從芯片設計階段就開始提供

三星不再是單純的芯片制造商,而是全面參與芯片設計,可以和ASIC設計服務相提并論但這是一個非常特殊的情況畢竟三星不僅有TSMC那樣的芯片代工業務,還有自己的自研SoC

谷歌Tensor和三星Exynos高度同源除了CPU,GPU,NPU等高級結構外,芯片中的很多基本結構都是同源的雖然在紙面上,三星,聯發科,海思甚至高通都使用arm的Cortex CPU和Mali GPU公共架構,但它們的底層架構還是有很大的不同

谷歌Tensor采用的是三星Exynos的框架,不僅時鐘和電源管理架構相同,而且它們的存儲控制器,外接接口PHY IP等高級塊,甚至更大的ISP,媒體編解碼等IP功能塊都非常相似有趣的是,Github上已經有了GS101的公開信息,可以和1:1中的Exynos進行對比

但是,雖然使用了Exynos的基本模塊和框架,但SoC的定義確實是由谷歌控制的在IP塊之間的結構和連接設計上,谷歌Tensor和三星Exynos有所不同

例如,在Exynos上,CPU通過總線連接,而谷歌Tensor的CPU集群集成在一個更大的CCI從外部看,可能是不同的總線設計,也可能是完全不同的IP另外,和內存控制器的連接方式一樣,它們也是不同的

技術性能分析

單看CPU就知道谷歌Tensor的特別之處,2x1x2xa76 4xA55這種2 2 4的結構已經出現在三星Exynos 9820和Exynos 990上但在如今的安卓旗艦SoC中,1 3 4才是絕對的主流而且只有谷歌敢堆2 X1

理論上有兩個X1超級核心,其CPU多核性能會比單個X1產品更強另一方面,谷歌Tensor的X1為2.8GHz,略低于驍龍888的2.84GHz和Exynos 2100的2.91Hhz另外,和驍龍888一樣,谷歌也給了1MB的L2緩存,比Exynos 2100的512KB殘血X1更猛

在大核心方面,谷歌選擇了古老的A76架構,這是一個非常有爭議的問題畢竟這是不合理的,因為A77和A78的性能和能效比更高即使是Anandtech也沒有得到谷歌的明確解釋

他們猜測可能是幾年前設計芯片的時候,三星沒有更新的ip供谷歌選擇也可能是超大核換成X1的時候,連大核都來不及換但是谷歌不應該故意選擇A76,因為下面的測試顯示A76真的跟不上時代

小核這邊,4個1.8GHz的A55s,谷歌選擇了128KB的L2緩存,而不是三星Exynos本身使用的64KB,這讓這款CPU更像驍龍888可是,奇怪的是,谷歌將集群的L3緩存頻率綁定到A55,這將導致延遲和功耗問題此外,這與Exynos 2100的L3頻率不同

Google Tensor 的 GPU 是 Mali— G78 MP20,規模僅次于麒麟 9000 的 G78 MP24大家最開始以為 Google 會用低點的頻率來提升能效比但結果 Google 竟然把著色器頻率推到 845MHz,把 tiler 和 L2 頻率推到 996MHz,簡直癲狂另外,它也是第一個用上 G78 分離頻率特性的產品

作為參考,Exynos 2100 的 G78 MP14 也只是854MHz,后者的峰值功耗已經很高了結果 Google 增加 42% 的核心,卻依然維持高頻因此它的峰值性能很讓人期待,但峰值功耗也會很猛而內存控制器似乎和 Exynos 2100 相同,支持 4x16bit 的 LPDDR5,理論帶寬 51.2 GB/s

它也用了 8MB 的系統緩存,但還不清楚是否用了和三星 Exynos 2100 一樣的 IP,因為它們的架構和行為方式都不太一樣Google 大量使用 SLC 來提升 SoC 性能這個 SLC 允許自分區,將 SRAM 專門分給 SoC 上特定的 IP 塊,使它們在不同用例下,能對全部或部分緩存進行獨占訪問

ISP 與 TPU

大家說 SoC 集成的 ISP 時,經常把它們描述為單個 IP但實際上,ISP 是不同的專業 IP 塊的組合,每個 IP 塊處理成像管線中的不同任務而 Google Tensor 非常有趣,因為它將三星用在 Exynos 芯片上的一些片段整合到了一起,同時還將自己開發的定制模塊整合到了流水線中 —— 正如 Google 在展示 SoC 時所說的那樣

成像系統部分和 Exynos 是一樣的,如相位檢測處理單元,反差對焦處理單元,圖像縮放器,畸變校正處理塊和紋理遮擋函數處理塊等比 Exynos 少的部分,可能是三星的一些圖像后處理模塊

谷歌在 ISP 中加入自己的 3AA 模塊 ,以及一對自己的時域降噪 IP 模塊這些很可能就是谷歌所說的那些有助于加速圖像處理的模塊,這些是 Pixel 系列計算攝影的一部分,毋容置疑地地代表了圖像處理流水線中非常重要的部分

當年的 Edge TPU 宣稱在 2W 功耗下可以提供 4TOPS 的算力,但 Google 并未公布 Tensor 的 TPU 性能指標,但是在一些測試中可以看到它的最大功率是 5W 左右因此如果它們確實是有關聯的,考慮到這幾年的制程和 IP 上的進步,Google Tensor 的 TPU 性能應該有明顯提升了

這個 TPU 是谷歌芯片團隊的驕傲,它正在使用最新的機器學習處理架構,這個架構針對 Google 內部運行機器學習的方式進行過優化,并且表示它可以允許開發新的,獨特的用例,這是 Google 做定制 SoC 的主要目標和出發點之一在后面的測試中,這個 TPU 的性能指標確實也是令人印象深刻的因為 TPU 的信息不多,我們只能基于它的驅動程序做簡單猜測,它可能包含四核心的 Cortex—A32 CPU

其他模塊

在媒體編碼器方面,Google Tensor 使用了三星的多功能編解碼器,還有一個看起來像是用于 AV1 解碼的自研 IP 塊這有點奇怪,因為三星的宣傳中,Exynos 2100 是有 AV1 解碼功能的,而且這個功能貌似也在內核驅動程序里面但在 Galaxy S21 系列中,這個 AV1 解碼功能從未在 Android 的層面實現過

谷歌加入的這個專用的 AV1 解碼器被他們稱做BigOcean,它能讓 Android 系統具備 AV1 硬解能力但非常奇怪的是,它真的就只負責 AV1,其他格式編解碼還是由三星的 MFC 負責

Google Tensor 的音頻子系統也不同,Google 用自己設計的 IP 塊代替了三星的低功耗音頻解碼子系統,它們可以在無需全部喚醒 SoC 的情況下進行低功耗的音頻播放我們認為這部分也是當協處理器用的,這也是 Google Tensor 和 Exynos 不同的地方

Google 還用了一種稱為 Emerald Hill 的硬件內存壓縮器,對內存頁面進行 LZ77 壓縮加速,反過來也可以用來加速交換中的 ZRAM 的卸載過程現在還不確定 Pixel 系列是否已經啟用這個模塊,但能確認在/sys/block/zram0/comp_algorithm目錄中有lz77eh作為課外資料,三星早在 5 年前,就在 SoC 里集成了類似的硬件壓縮 IP 模塊但出于某些原因,這些模塊從未被啟用過,也許是能效比并沒有他們預想中的高

圖源 PBKreviews

另外,Google 還用三星的 Exynos 基帶,做出了第一臺非高通的毫米波手機Pixel 6 系列用的是三星的 Exynos 5123 基帶三星在 2019 年就提到自己的毫米波射頻和天線模塊,說 2020 年會出現在量產機上Pixel 6 系列的峰值速度可以達到 3200Mbps,但很多測試中,它的網速只有高通產品的一半左右

雖然是同一個基帶,但它不是像 Exynos 2100 那樣集成在 SoC 里,而是外掛的可能是因為 Google Tensor 的 GPU 和 CPU 規模太大了,而且 TPU 的規模也是未知數畢竟就算是把基帶外掛出去,Google Tensor 的規模也是相當大了,即便是和對比 Exynos 2100 的情況下

總的來看,Google 確實設計和定義了 Tensor ,同時有很多 Google 特有的設計,是整體的芯片上的差異化但從更底層的角度看,Tensor 和 Exynos 有很多共通之處,用了很多三星特有的基礎模塊,因此叫它半定制或許會更合適

實際性能表現:不盡如人意

測試中,Google Tensor 的 DRAM 延遲較高,還不如 Exynos 2100,和驍龍 888 比就更差了Google 改過了內存控制器,它會根據負載和內核的內存失速百分比來控制 MC 和 DRAM 速度,這部分是和三星不同的,其實際利用率也不如三星的內存控制器高現在不知道是 CPU 的問題,還是整個 SoC 內部的問題,但這確切地影響了下面的測試

它的 L3 延遲也相當高,比 Exynos 2100 和驍龍 888 高得多Google 沒有給 DSU 和 CPU L3 緩存設定特定的頻率,而是把它和 A55 小核的頻率關聯奇怪的是,即便 X1 或 A76 滿載,A55 和 L3 卻在低頻摸魚同樣情況下 Exynos 2100 和驍龍 888 都是會提高 L3 頻率的

在系統緩存測試中,能看到 11—13MB 的延遲情況 ,在正常的內存訪問中,Tensor 也是比 Exynos 要慢的,可能和被改過的個別緩存管線有關。。

因為 L3 和 A55 的頻率捆綁,且頻率高,所以 Google Tensor 的 A55 小核是幾個 SoC 里 L3 延遲最低的,彷如沒有異步時鐘橋一般。報告指出,美國是該游戲收入最高的市場,貢獻了6700萬美元,占該游戲總收入的66%。英國和日本市場位列第2和第3,分別占8%和6%。

CPU 部分,Google Tensor 更像是驍龍 888,而不是 Exynos 2100雖然 Google Tensor 的 L2 緩存是 Exynos 2100 的 2 倍,但頻率低了 3.7%

Tensor 的弱點是內存延遲,導致 SPEC 測試中很多子項目都比 驍龍 888 和 Exynos 2100 慢,但能耗卻更高SPEC 總分上,Tensor 的表現比 Exynos 2100 略差,對比驍龍 888 的落后幅度達到 12.2% ,由于跑完測試的時間更長,最終耗電還多了 13.8% 折算回來,相對驍龍 888 的差距應該是 1.4% 左右

它也有和 Exynos 2100 一樣的降頻問題,只是相對沒有那么嚴重如果冷卻得當,性能會高 5%—9% 左右

可憐的 A76 大核,驍龍 888 的 A78 比它強 46%,還更省電,實際 IPC 差距在 34%,這倒符合兩個構架之間的差距如果真是為了省電,完全可以做個低頻的 A78,但結果 Google 放了兩顆頻率又高,又耗電,性能還不行的 A76,只能推斷 Google 是沒得選,而不是有意而為之

越接近右下角,能效比越低,越接近左上角,能效比越高

A55 小核這邊也不行,性能只是比同頻的驍龍 888 的 A55 高 11%,但卻幾乎是 2 倍的功耗,儼然就是繼承了 Exynos 高功耗 A55 的血統,能效比甚至比自己的 A76 大核還拉胯看看聯發科天璣 1200 的 A55,再看看 A14 的能效核心,這真是個殘酷的世界

Google Tensor 因為拉胯的 A76 性能表現,就算有 2 顆 X2 都無力回天,拖低了整體分數X1 本身也比對手稍慢一些,大部分時間的能效比都和 Exynos 2100 的 X1 一致但 A76 實在落后時代太多了,而 A55 又繼承三星低能效的傳統,一言難盡就是了

GPU 這邊規模大,頻率高,但 3DMark Wild Life 測試的峰值性能只比 Exynos 2100 高 21%在 GFX Bench 的 Aztec 場景測試中,領先 Exynos 2100 14%,小幅領先驍龍 888雖然采用了分頻設計,但貌似瓶頸在 GPU 的其他地方

Tensor 的 GPU 峰值功率高達 9—10W,手機一跑就降頻,拖低了整體功耗,所以才會有 7.28 W 的平均功耗Pixel 6 系列沒有熱管,散熱配置和機身結構更像是 iPhone,而不是猛堆散熱的安卓旗艦它跑起來時,左側的 SoC 45 度,但右側只有 30—33 度,散熱確實是弱

讓人不解的是,今年這批 SoC 都設定了高得不切實際的 GPU 頻率,一跑就降頻可能是為了應對突發的 GPU 負載或者是其他什么原因但無論怎么樣,實際能效比是受累了

TPU:極強的推理性能

這是 Google Tensor 挽回顏面的地方MLPerf 測試中,Pixel 是在 NNAPI 跑的,其他廠商是各自的庫,高通是 SNPE,三星是 EDEN,聯發科是 Neuron,而蘋果沒有 coreML 加速,所以吃虧

在圖像分類,目標檢測和圖像分割工作負載中,Tensor 成績低于高通,但強于三星而在語言處理,Google Tensor 提供了驍龍 888 3 倍的性能,推理部分強得很Google 在宣傳里,確實也提到過實時轉錄,翻譯等使用場景是其差異化所在

還沒發布的 GeekBench ML 測試,用是 TensorFlow 模型,代表的是 GPU 的機器學習性能這時候 Google Tensor 就弱于 Exynos 2100如果用 NNAPI 模型,此時是 CPU+GPU+NPU 的混合工作,Google Tensor 就可以大幅領先驍龍 888

除了絕對性能,跑 AI 測試時,Pixel 6 Pro 的整機功耗和 Exynos 2100 的 Galaxy S21 Ultra 接近單獨進行推理任務時,Exynos 2100 的爆發功率達到 14W,驍龍 888 也有 12W但因為 Google Tensor 的 AI 性能更高,所以最終能效比要更高一些

不過 Google 還沒有計劃推出相關的 SDK 讓開發者去更好地利用這顆強大的 TPU 但再看看三星,它的 NPU 發布都 2 年了,現在都沒有 SDK 現在 TPU 的強大性能,主要集中體現在官方 App 里,像是給攝像頭加入更多的機器學習功能,以及各種翻譯功能

總結

Google 表示,他們搞自研 SoC 的主要原因是現有的 SoC 在機器學習上的性能和能效比太低而 Tensor 的機器學習性能和能效,被用來支撐新的用例和體驗,例如我們在 Pixel 6 系列上看到的很多機器學習特性像是實時轉錄,實時翻譯和圖像處理等算法,所有這些都是運行在 Tensor 的 TPU 上的

雖然 Google 可能不想承認或者談論,但 Google Tensor 確實就是和三星合作的產物,大部分都源自 Exynos,并繼承了三星在能效比方面的弱點CPU 被古老的 A76 拖后腿,規模龐大的 GPU 被散熱拖后腿,但 TPU 確實表現很好,特別是自然語言處理方面,遠遠拋離所有競品

但總的來說,我們認為 Google 已經通過 Tensor 實現了最初的目標我們不知道 Google 下一代的 SoC 會走什么樣的路線,但我們很有興趣等等看

鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。

 
上一篇: 三星今日在俄羅斯發布了GalaxyA22s5G手機
下一篇:最后一頁
 
     欄目排行
  1. 三星今日在俄羅斯發布了GalaxyA22
  2. 雙碳目標下商業模式如何轉型不能只靠道德召
  3. 何新儀器大宗交易清單成交價66.72元
  4. 為滿足市民日益多樣化的保險需求中國人壽保
  5. 極致超頻大師Hocayo成功實現了DDR
  6. 伴隨著這次拍賣的成功一夜之間變成了價值超
  7. 第十九屆亞運會將于2022年9月10日至
  8. 恒力石化發布《關于以集中競價交易方式回購
  9. 年底消費“旺”這些生活必需品價格變化你感
  10. 杭州植物園菊花精品展上參觀者被編織
     欄目推薦
二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾
2022年營收78.61億,湯臣倍健迎來VDS行業新2022年營收78.61億,湯臣倍健迎來VDS行業新周期
大興國際氫能示范區兼顧產業發展和配套服務打造員工理想大興國際氫能示范區兼顧產業發展和配套服務打造員工理想生活藍本
迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡
綠色塞罕壩 不朽的奇跡綠色塞罕壩 不朽的奇跡