首页 > 编程知识 正文

gpu和显卡有什么区别(显卡和cpu的区别)

时间:2023-05-05 19:06:55 阅读:91427 作者:4122

2014-08-13 05:47:00作者:喜悦的故事

自2006年进入酷睿时代以来,英特尔坚持每年交替升级CPU体系结构和制造技术。 也就是众所周知的Tick-Tock。

Broadwell是其中的Tick,也就是流程的升级,体系结构几乎没有变化。 明年的Skylake是另一个Tock,流程不变,架构创新。

从这个角度来看,Broadwell CPU体系结构其实没什么好说的。 也就是说,在一些微调中,看不到明显的变化。 不要太期待性能的提高。

事实上,这几年连托克都不是“能干”的。 去年的Haswell CPU性能也提高了不到10%,让很多人失望。

据Intel称,Broadwell IPC (每时钟周期的命令数)比Haswell上升约5%,与lkdmf Bridge 4-6% )非常相似。 当然,这只是理论上的同一频率比较,实际性能还取决于频率的变化和不同的APP环境。

架构方面其实也在加强,首先是更大的调度程序和缓冲器,可以更好地满足CPU核心的需求。 例如,可以扩大混乱的调度窗口,以记录更多的指令,从而改善IPC。

同时,L2 TLB入口也从1K提升到1.5K,减少了地址转换错误。 TLB的功能也得到了扩展,有助于提高性能。

分支预测器通过例子被带出,人们一直认为它可以减少预测错误和不必要的内存操作。

在数学性能方面,乘法和除法通过各自的硬件改进得到了加强,其中浮点乘法的指令延迟从5周期下降到3周期,除法使用了更大的Radix-1024 10位除法器。

此外,还有进行解密的深入改进,但不知道是否使用了AES-NI或其他指令集这一术语。

英特尔目前在能源效率方面非常受重视。 以前每提高1%的性能,耗电量就增加1%,为1:1,现在据说Intel达到了2:1。 这意味着,如果性能提高5%,功耗只会增加2.5%。

所有世代都需要硬体基础能源效率最佳化,包括电源闸、设计最佳化等,不仅是酷睿m,未来所有的布罗德韦尔都有。

【酷睿GPU架构预览】如果说这几年Intel CPU架构备受关注,GPU一直在大跃进,已经达到威胁AMD APU的地位,而且是巨大的市场份额(天下的三分之二),

lkdmf Bridge、Haswell的GPU分别是第七代、第七代半,Broadwell在它们的基础上不断改进,但不足以称为第八代(Intel自己并没有这么说)。 因为,基础体系结构几乎完全相同,只是在规模、性能、功能、技术方面得到了深入的加强。

API支持已经与NVIDIA、AMD处于同一级别,完全支持DX11.2 (和OpenGL 4.3 ),准确地说是direct 3d功能级别11_0,甚至是NVIDIA,也可以说是开普勒11_2没有太大的改善,只有块资源、预编译着色器等细节,但至少名义上,Intel到了NVIDIA重要的泥猴桃!

其次,英特尔还支持DX12。

关于计算,确认了支持尚未公布的OpenCL 2.0,大幅提高计算性能,包括共享虚拟内存。 虽然Intel没有像AMD HSA那样的可编程异构体系结构,但至少可以在Broadwell CPU/GPU之间直接共享复杂的数据,而无需重新复制。

如果再深入一点,Intel实际上在调整架构,加强不同执行单元之间的平衡。

Haswell-Y的核表示为GT2,是单个块(Slice ),另外可以细分为两个子块(Sub-Slice )。 后者是Intel核显的最小功能单元,包括10个执行单元(着色器)、缓存、纹理/数据/媒体采样器等。

Broadwell-Y将每个子块中的执行单元减少到8个,但每个块由3个子块(即总共24个执行单元)组成,比上一代增加了20%。

但是,影响并不那么简单,相关的初级缓存、采样器也增加了。 由于各执行单元的采样器增加了25%,在同一频率下的采样输出能力提高了50%。

事实上,现代的PC GPU减少了每个执行单元配备采样器的比例,而Intel则相反地增加了,这表明在以往的体系结构方面存在不足。

包括ROP、光栅化器和某些l3缓存的后端具有改善像素和z轴填充率的微体系结构,前端增强了几何单元,从而提高了几何输出能力。

Intel这次没有宣传GPU的性能提高了多少(很少见)。 结合上述变化,考虑到14nm新工艺发热、功耗剩余的更大空间,有望实现以下目标。

iaoimg.com/origin/1183/492259015?from=pc">

说起功耗改进,新工艺并不是唯一,还有个杀招“Duty Cycle Control”(DCC),占空比控制。——占空比是电子技术术语,大意是脉冲中信号激活的时间比例,又称工作周期。

这些年,Intel一直在努力改进待机功耗,但是晶体管运行需要一个最低电压,也就是阈值,所有到了一定程度,常规方法再怎么努力也是不可能继续降低的。

Intel的解决方法很天才:既然不能继续降压,索性就直接关闭GPU。通过将GPU置于工作周期中,可以大大缩短运行时间,只有原先所需的1/8,这就完全绕过了电压阈值的问题。

这一技术对应用、用户是透明的,无需干预。显示控制器与GPU时钟域分离并始终保持开启,因此无论GPU本身是否否关闭,都不影响显示输出。工作周期的控制通过GPU硬件、驱动程序联合进行。

目前还不知道该技术是仅限于Broadwell-Y,还是整个Broadwell家族都有。

最后说说多媒体与显示方面。因为架构方面的变化,视频质量引擎的输出能力也提升了一倍,QuickSync转码引擎同样有增强和改进。

H.265会有一个混合解码器,支持硬件解码,但是能效没有H.264的高。这主要是因为开发完全固定功能的编码器需要很长时间,Broadwell上有些来不及,只能上这样的临时方案。事实上,NVIDIA麦克斯韦架构的H.265解码也与此类似。

输出规格支持HDMI 1.4、DisplayPort 1.2、eDP 1.3a,最激动的是原生支持4K。其实呢,Haswell就已经支持4K,但是超低压的Haswell-Y上给砍掉了,这次Broadwell-Y没有再落伍,也给了苹果MacBook Air上视网膜屏的机会。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。