NVIDIA次代Tegra的vSMP架構，宛如應用處理器界的油電混合車（製程錯誤修正）

作者：Chevelle.fu

2011-09-22 13:30:00

tegra 3

project kal-el

nvidia

kal-el

新聞板

188187

這幾天NVIDIA悄悄在Tegra官方網站釋出Kal-El相關的兩份白皮書，其中一份令人眼睛為之一亮的，就是關於全新技術理架構vSMP（Variable Symmetric Multiprocessing）的介紹；所謂的vSMP是採用4+1核心概念，由4個Cortex-A9主要核心搭配一個時脈僅500MHz、依舊為Cortex-A9的Companion（伴隨）核心，有點類似TI以Cortex-A8搭配Cortex-M3的作法，但不同的是，TI搭配的Cortex-M是屬於工業控制核心，無法涉入系統運算的層級。

先簡單介紹一下ARM目前的核心種類，依照應用，可以分為Cortex-A運算核心、Cortex-M工業控制核心以及Cortex-R即時運算核心；而唯有Cortex-A具備作業系統執行能力，像是Cortex-M以及Cortex-R都不是針對作業系統運算，主要針對簡易的底層控制例如汽車引擎轉速調節以及硬碟運轉控制等。

資料參考來源：NVIDIA

跳轉繼續：

vSMP架構利用兩套獨立但共用記憶體的Cortex-A9核心為基礎

從最新發布的白皮書來看，NVIDIA最新的vSMP架構是避開了Cortex-A9架構先天上的限制，這顆Companion Core與其他四顆主要運算核心分屬不同的群組，所以能避開A9多核必須時脈同步的限制（備註，目前ARM多核架構中，僅有獨立修改的高通雙核具備核心時脈獨立控制的特性），vSMP像是獨立運作的兩套核心，僅在系統低負載出面，高負載狀況下就會切回另一套多核架構。

比喻來說會有點像是油電混合車，Companion核心像是電樞馬達的部份，而多核架構則是汽油引擎，低速平路用馬達帶動，而需要爬坡以及高速巡航則讓汽油引擎代勞。如果要以Intel的處理器形容，可以說是把Atom跟Core i同時封印在同一套系統，網頁瀏覽這類就靠Atom，而重度遊戲還有繪圖靠Core i。

Kal-El架構圖

而以架構來說vSMP最大的優點就是它的兩套核心架構都屬於相同的Cortex-A9架構，僅在於一套為低時脈單核心、另一套為高時脈多核心，系統在兩套核心架構切換低於2ms，理論上使用者感受不出兩套核心相互切換的遲滯。

結構上，vSMP不允許Companion Core與主要核心同時運作，不過兩套架構仍共享L2快取；NVIDIA特別強調，雖然兩架構是獨立的，但並不會因為架構切換造成系統遲滯，當然如果真的發生這種事情大概NVIDIA會被合作客戶罵死吧，應該是有十足的自信否則不會寫在白皮書上。

綠線與紅線分別代表低時脈、低功耗與高時脈、高功耗核心，右圖是vSMP融合兩者達到效能與功耗的平衡

也由於預設時脈更低，待機以及輕度運算時的功耗遠比上一代的Tegra 2更理想，至於高效能遊戲，也由於處理能力更強大，反而對CPU架構的負擔變小，~~並在28nm新製程加持下~~（Kal-El仍為40nm，直到再下一代Tegra才是28nm），NVIDIA給了一份漂亮的功耗表。

白皮書中的功耗與效能比較表

在效能方面，拜4核架構之賜，Kal-El僅以480MHz的時脈，就可與如OMAP4、Qualcomm MSM8660擁有相近的效能、但一半的功耗；反之，相同功耗下，1GHz的Kal-El核心運算能力也是上述對手的兩倍。

當然在四核心加持下，Kal-El在網路瀏覽體驗將會更接近傳統桌上型電腦。由於效能影響，即便到雙核手機，由於運算能力關係，即便以同樣網路的頻寬下，由於需要加載網頁中的元素，雙核智慧手機與平板雖有長足的進步，但仍需要耗費相當的處理器資源以及處理時間，導致平板與智慧手機瀏覽網路遠不及傳統桌上型電腦。

Companion核心無法與四核心高效能核心同時運算

其實按照目前使用者對智慧手機的需求，Companion核心執行效能雖僅有500MHz，但已經滿足一般影片、音樂播放（因為在ARM的應用處理器架構中，多媒體多半由專屬的核心進行硬體解碼，不太耗費系統資源，當然RMVB是個特例）、收發電子郵件、上上社群網路等需求；而多核架構則是滿足遊戲、Flash、網頁瀏覽等耗費運算資源的應用。

圖形架構方面，Kal-El也加入即時物理運算能力以及即時動態渲染技術，滿足傳統遊戲主機等級的遊戲圖形表現。

Kal-El擁有與對手同功耗雙倍效能、同效能一半功耗的優點

在GPU架構方面，一樣採用沿自Tegra家族傳統的ULP GeForce架構，但從Tegra 2的8核心（4頂點著色器與4像素著色器）架構升級到12核心架構（6頂點著色器與6像素著色器），遊戲效能在處理核心以及GPU核心增加後，也有大幅的提昇。

至於Tegra 2最被詬病的多媒體解碼，則在Tegra 3採用正統的ARM NEON以後一掃而空，也不至於再遇上無法使用一些通用影像播放軟體進行硬體解碼的困境。

相較起來，Tegra 3又比Tegra2進化更多，而在收購法國ICERA後，也已經宣佈未來將把基頻部份整合到Tegra家族中，目前來看，早在2011年初就陸續放出消息的Tegra 3已經來不及，至於Tegra 4是否有可能呢？無論如何，NVIDIA已經從一個ARM架構的新加入者，搖身一變成為可與傳統ARM應用處理器大廠抗衡的新星，接下來其他廠商將會怎拆招解招，會相當值得關注。

f 分享到Facebook

網友愛搜: