gpu和显卡有什么区别(显卡和cpu的区别)

2014-08-13 05:47:00作者：喜悦的故事

自2006年进入酷睿时代以来，英特尔坚持每年交替升级CPU体系结构和制造技术。也就是众所周知的Tick-Tock。

Broadwell是其中的Tick，也就是流程的升级，体系结构几乎没有变化。明年的Skylake是另一个Tock，流程不变，架构创新。

从这个角度来看，Broadwell CPU体系结构其实没什么好说的。也就是说，在一些微调中，看不到明显的变化。不要太期待性能的提高。

事实上，这几年连托克都不是“能干”的。去年的Haswell CPU性能也提高了不到10%，让很多人失望。

据Intel称，Broadwell IPC (每时钟周期的命令数)比Haswell上升约5%，与lkdmf Bridge 4-6% )非常相似。当然，这只是理论上的同一频率比较，实际性能还取决于频率的变化和不同的APP环境。

架构方面其实也在加强，首先是更大的调度程序和缓冲器，可以更好地满足CPU核心的需求。例如，可以扩大混乱的调度窗口，以记录更多的指令，从而改善IPC。

同时，L2 TLB入口也从1K提升到1.5K，减少了地址转换错误。 TLB的功能也得到了扩展，有助于提高性能。

分支预测器通过例子被带出，人们一直认为它可以减少预测错误和不必要的内存操作。

在数学性能方面，乘法和除法通过各自的硬件改进得到了加强，其中浮点乘法的指令延迟从5周期下降到3周期，除法使用了更大的Radix-1024 10位除法器。

此外，还有进行解密的深入改进，但不知道是否使用了AES-NI或其他指令集这一术语。

英特尔目前在能源效率方面非常受重视。以前每提高1%的性能，耗电量就增加1%，为1:1，现在据说Intel达到了2:1。这意味着，如果性能提高5%，功耗只会增加2.5%。

所有世代都需要硬体基础能源效率最佳化，包括电源闸、设计最佳化等，不仅是酷睿m，未来所有的布罗德韦尔都有。

【酷睿GPU架构预览】如果说这几年Intel CPU架构备受关注，GPU一直在大跃进，已经达到威胁AMD APU的地位，而且是巨大的市场份额(天下的三分之二)，

lkdmf Bridge、Haswell的GPU分别是第七代、第七代半，Broadwell在它们的基础上不断改进，但不足以称为第八代(Intel自己并没有这么说)。因为，基础体系结构几乎完全相同，只是在规模、性能、功能、技术方面得到了深入的加强。

API支持已经与NVIDIA、AMD处于同一级别，完全支持DX11.2 (和OpenGL 4.3 )，准确地说是direct 3d功能级别11_0，甚至是NVIDIA，也可以说是开普勒11_2没有太大的改善，只有块资源、预编译着色器等细节，但至少名义上，Intel到了NVIDIA重要的泥猴桃！

其次，英特尔还支持DX12。

关于计算，确认了支持尚未公布的OpenCL 2.0，大幅提高计算性能，包括共享虚拟内存。虽然Intel没有像AMD HSA那样的可编程异构体系结构，但至少可以在Broadwell CPU/GPU之间直接共享复杂的数据，而无需重新复制。

如果再深入一点，Intel实际上在调整架构，加强不同执行单元之间的平衡。

Haswell-Y的核表示为GT2，是单个块(Slice )，另外可以细分为两个子块(Sub-Slice )。后者是Intel核显的最小功能单元，包括10个执行单元(着色器)、缓存、纹理/数据/媒体采样器等。

Broadwell-Y将每个子块中的执行单元减少到8个，但每个块由3个子块(即总共24个执行单元)组成，比上一代增加了20%。

但是，影响并不那么简单，相关的初级缓存、采样器也增加了。由于各执行单元的采样器增加了25%，在同一频率下的采样输出能力提高了50%。

事实上，现代的PC GPU减少了每个执行单元配备采样器的比例，而Intel则相反地增加了，这表明在以往的体系结构方面存在不足。

包括ROP、光栅化器和某些l3缓存的后端具有改善像素和z轴填充率的微体系结构，前端增强了几何单元，从而提高了几何输出能力。

Intel这次没有宣传GPU的性能提高了多少(很少见)。结合上述变化，考虑到14nm新工艺发热、功耗剩余的更大空间，有望实现以下目标。

iaoimg.com/origin/1183/492259015?from=pc">

说起功耗改进，新工艺并不是唯一，还有个杀招“Duty Cycle Control”(DCC)，占空比控制。——占空比是电子技术术语，大意是脉冲中信号激活的时间比例，又称工作周期。

这些年，Intel一直在努力改进待机功耗，但是晶体管运行需要一个最低电压，也就是阈值，所有到了一定程度，常规方法再怎么努力也是不可能继续降低的。

Intel的解决方法很天才：既然不能继续降压，索性就直接关闭GPU。通过将GPU置于工作周期中，可以大大缩短运行时间，只有原先所需的1/8，这就完全绕过了电压阈值的问题。

这一技术对应用、用户是透明的，无需干预。显示控制器与GPU时钟域分离并始终保持开启，因此无论GPU本身是否否关闭，都不影响显示输出。工作周期的控制通过GPU硬件、驱动程序联合进行。

目前还不知道该技术是仅限于Broadwell-Y，还是整个Broadwell家族都有。

最后说说多媒体与显示方面。因为架构方面的变化，视频质量引擎的输出能力也提升了一倍，QuickSync转码引擎同样有增强和改进。

H.265会有一个混合解码器，支持硬件解码，但是能效没有H.264的高。这主要是因为开发完全固定功能的编码器需要很长时间，Broadwell上有些来不及，只能上这样的临时方案。事实上，NVIDIA麦克斯韦架构的H.265解码也与此类似。

输出规格支持HDMI 1.4、DisplayPort 1.2、eDP 1.3a，最激动的是原生支持4K。其实呢，Haswell就已经支持4K，但是超低压的Haswell-Y上给砍掉了，这次Broadwell-Y没有再落伍，也给了苹果MacBook Air上视网膜屏的机会。