注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Crayon

只想做自己

 
 
 

日志

 
 
 
 

四核处理核心-Tegra 3 详细解析  

2011-11-02 21:34:22|  分类: 手机 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
    双核心手机到底有什么用?相信这个问题99%的人都会答不出来。但这并没有挡住双核心手机滚滚前进的车轮。自2011年下半年开始,双核浪潮终于席卷了整个移动行业,虽然大家都说不出双核心手机到底能带来什么好处,但凡高端必双核已经成了厂家和消费者的共识。

  看到大多数人都被核心把戏蒙住双眼,而无法真正关注自己需要的东西,始作俑者Nvidia此时应该是笑而不语把。2009年,NV拿出了业内第一款针对手机和平板电脑而设计的双核心ARM处理器Tegra 2,挑起了Android厂商之间的硬件战争。如今,他们又引入了新的弹药,这就是四核心Tegra 3。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

Nvidia在Windows 8 Bulid大会上展示的Tegra 3平板电脑样机

  上周,nVIDIA再次如愿以偿,抢在高通、TI等一帮巨头前面推出了代号Kal-El的四核心手机处理器Tegra 3,将硬件军备竞赛带到了新的高度。

  和大多数习惯呆在暗处的硬件厂商不同,NV是一家喜欢大鸣大放的半导体厂商,在Tegra 3公布的同时,我们就能从NV官网上方便的下载到它的详细规格资料。四核心性能究竟有多强?四个核心的处理器会不会成为一只吃电怪兽?相信很多人和小编一样,抱有类似疑问,
那么就让我们根据白皮书,来解析一下这片nVIDIA画出的“大饼”吧。

  扼住功耗的咽喉:Tegra 3其实是5个核心?

  在开始之前,我们首先温习一下Tegra 3的几个关键词:台积电40nm 工艺,四核心Cortex A9,12单元全新GeForce ULP,LPDDR2 1066MHz内存,Neon指令集,3D立体支持。OK,下面进入正题。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

NV公布的Tegra 3架构图

  就像开头提到的,谈及四核心,几乎所有人的第一个问题问就是功耗。现在高端的双核心手机已经可以在几小时内把一块1500毫安的电池榨干,那么四核心的Tegra 3又会如何呢?NV表示Tegra 3在大多数情况下都不会比双核心处理器更耗电,秘密就在于大胆的设计。翻开nVIDIA提供的框图,赫然映入眼帘的核心不是四颗,而是五颗。多出来的一颗是怎么回事?

  其实,它是NV专门准备的第五颗处理器核心,名为vSMP,即“可变对称多处理器”架构。这是nVIDIA自创的新名词,具体而言就是在系统内部集成两组处理器,一组高性能但高功耗,另一组则低性能低功耗。根据不同应用,如果可以恰当切换不同处理器组,系统整体的功耗就会降低。具体到Tegra 3里, Cortex A9四核心是“性能”部分,而多出来的那颗——nVIDIA称之为Companion(伴星)核心——则是“功耗”部分。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

    虽然伴星核心专注于功耗,但它和主核心一样也是Cortex A9架构的,性能上并没有缩水。不过如果仅仅是引入一颗低频核心,能做到的只是降低待机功耗,对运行是无能为力的,所以,nVIDIA还别出心裁的使用不同工艺来打造这两组处理器,具体如上表。这有什么影响呢?

  在半导体代工厂台积电(TSMC)的工艺列表上,制造Tegra这种SoC处理器的半导体工艺基本分两种:高性能和低功耗。高性能工艺在低频率下功耗较大,随着频率的提升,功耗上升的速度也比较慢;而低功耗工艺则正好相反。Tegra 3将这两者结合起来,意在取长补短,既降低总体功耗的同时实现极致的性能。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

     例如,就是在系统不需要处理复杂任务,比如待机、数据同步、后台任务时,关闭主处理器,而在正常使用时,关闭伴星处理器,再根据任务的负载开启不同数量的主核心,就能在性能和功耗中取得理想的平衡,具体情况见下图:

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

    通过这种灵活的切换与搭配,Tegra 3在核心翻倍的情况下反而降低了功耗,效果看起来的确很不错。但是这个设计也不是天衣无缝。从nVIDIA的白皮书上看,伴星处理器是比较受限的,它不能和主处理器同时开启,因此实际应用环境——而不仅仅是待机——下它有多大几率能被利用上,目前还是未知数。实际上伴星处理器和主处理器之间的切换耗时需要几个毫秒,这意味着一旦发生切换,会浪费数百万个处理器周期。

  vSMP的设计还引发了另一个问题,那就是缓存。为了让主处理器组和伴星处理器可以顺利切换,Tegra 3的L2缓存会被全部五个核心集体共享,这一方面会造成缓存带宽的吃紧影响性能,另一方面由于伴星处理器的频率远低于主处理器,因此L2缓存也会被迫运行在低速下,这会不会影响到主处理器的性能也需要更多观察。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

   增加数量绝不浪费:火力全开的强劲四核

  之前我们提到了,工艺的不同可以导致功耗的不同,但纯靠工艺,可以抵消核心数量翻倍的影响吗?nVIDIA给出了下面的数据。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

    低功耗工艺的产品,双核1GHz的功耗都在1500毫瓦左右,而高性能工艺的Tegra 3却在1300毫瓦不到的功耗下做出了四核1GHz,也做到了两倍的性能。这无疑是非常令人震惊的,工艺的不同带来的差距竟然如此巨大。而当我们将性能调至同级水准时,Tegra 3的四核心功耗甚至只有双核心处理器的40%。换句话说,Tegra 3能做到同等功率双倍以上性能,或是同等性能40%耗电。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

 

    那么双倍的性能在实际应用中有什么意义呢?我们看下图:

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

这是NV提供的3D性能对比,4核心Tegra 3在10秒内就完成了渲染,比Tegra 2快一倍以上

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

视频转码速度,Tegra 3差不多也要比Tegra 2快100%

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

CPU性能理论测试,Tegra 3同样获得了大幅领先

  可以看到,由于多核心在PC领域的普及,目前的应用环境下针对多核心优化的应用已经越来越多,多核心带来的收益也非常明显。与IOS不同,Android作为一个多任务操作系统,系统中同时运行的程序可能有几个甚至十几个,在这种情况下,具备更多核心处理器的设备,系统可以将任务更多的分配给不同核心,让每个核心都工作在更为节能的低频状态,提高性能的同时降低功耗。而在需要绝对性能的应用诸如网页浏览和3D游戏中,两倍于双核的绝对性能又可以把体验带入一个全新的领域,因此核心数的增加绝不是浪费,当然这一切都要归功于伴星处理器的引入帮主处理器解决了后顾之忧,让后者得以火力全开。

  两手都要硬:性能强大的新GeForce ULP显卡

  除了CPU的改进以外,Tegra 3引入的新架构GeForce ULP也是一个看点。3D和图形渲染算是NV的老本行了,这次当然不会放松。NV宣称Tegra 3的图形性能至少可以达到Tegra 2的两倍,下面让我们来看看nVIDIA官方提供的数据。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

NV测试了3款游戏,Tegra 3的速度提升都在100%以上

  我们知道Tegra2的GeForce ULP包含8个处理单元,而Tegra 3则提升到了12个,数量仅仅提升了50%,性能却提升了100%以上,这说明了Tegra 3 GPU的架构可能发生了变化。当然具体情况我们不得而知,但从Tegra 3支持诸如PhysX、CUDA等高级功能来看,在Tegra 3上可以实现各种复杂的眩目特效,诸如实时光照、纹理生成、甚至物理效果,这在以前都是难以想象的。


这是NV专门为Tegra 3开发的演示软件,效果相当惊人

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

Tegra 3内置显卡所支持的一些处理特效

  来自GLBenchmark的第三方测试也证实了Tegra 3 GPU性能的提升。在Egypt项目,分辨率为720p的离屏测试中,Tegra 3跑出了超过50FPS的成绩,而目前Android平台最强双核三星猎户座则为41.7FPS。在单项测试中,涉及复杂Shader特效时,Tegra 3的性能甚至可以达到猎户座的8倍之多,可见Tegra 3的3D性能和特性是值得让人期待的。

   豪赌工艺的成功:四核VS双核

  根据nVIDIA的规划,搭载Tegra 3的设备最早可以在明年一季度到达用户手中。而诸如三星、德州仪器、高通等,下一代产品则均锁定了28nm工艺与Cortex A15,在A9架构下并没有规划四核心产品。这就意味着在明年上半年,很可能出现四核对双核的情况。Tegra 3选择了TSMC 40nm工艺而不是新一代28nm,这本来应当是一个劣势,但由于全球经济的疲软,导致TSMC在28nm工艺上的进程被大大延误,不知道一直以来和TSMC合作紧密的nVIDIA是不是提前悉知了这样的情况,才作出了这样的决定,结果为Tegra 3换回了这宝贵的半年时间。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

德州仪器OMAP5平台要到明年下半年才能面世

  性能方面,面对如今市面上广泛存在的A9双核心处理器,Tegra 3无疑是遥遥领先的。那么面对明年的A15双核呢?我们知道Tegra 3能实现四核是因为vSMP架构,而竞争对手即便采用28nm工艺,由于仍然要兼顾待机功耗,因此高频方面还是会受到限制,只能做到1.5GHz左右。这样的双核心A15处理器,性能要达到四核A9的水平是有一定难度的。而随着工艺的持续进步,当Tegra 3被赶超时,nVIDIA也将推出同样基于A15的下一代产品,因此不得不说nVIDIA着实是下了一招好棋。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

NV提供的处理器理论性能测试,成绩仅作参考

  但是Tegra 3面前依然还有很多困难。例如,vSMP中伴星处理器到底能在日常使用中起到多大的作用?如果轻负载下不能切换到伴星处理器,那么功耗表现就会大大降低。多媒体性能是否有改进?我们知道Tegra2在这方面表现就非常不理想,而目前nVIDIA并没有披露Tegra 3在这方面的相关特性。GPU方面,虽然在复杂特效上Tegra 3可以超越竞争对手8倍,但实际环境中并没有同等的提升,在落后的应用水平下,Tegra 3很可能陷入英雄无用武之地的境地,空有长处却无从发挥。

四核处理核心-Tegra 3 详细解析 - Crayon - Crayon

    内存则依然是NV一个短板,在竞争对手纷纷采用双通道内存的时候,Tegra 3作为一颗四核芯片却依然只支持单通道内存。最后则是Tegra2上饱受诟病的软件稳定性。可以说虽然看起来Tegra 3前路光明,但这场四核对双核的战争中Tegra 3是否能成为赢家还得看nVIDIA自己的实力。

  评论这张
 
阅读(699)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017