咨询热线

400-007-6266

010-86223221

2017年我国图形处理器(GPU)性能分析及发展方向预测(图)

        GPU(GraphicsProcessingUnit)是图形处理单元。是个人电脑、工作站以及移动设备等用来进行图像处理的微处理器。显卡是连接计算机主板和显示器的重要元件,可以接受主板的控制信号,转换成显示器能够识别的命令,控制显示器正确显示图像信息。而GPU就是显卡的处理器,是显卡的“大脑”,专门用来处理图形计算任务。


图:显卡的内部构造

资料来源:观研天下整理

        1、GPU架构特点。

        GPU架构特点与其需要处理的任务相关,其处理和显示的计算机图形本质上都是二维数据矩阵。计算机图形显示的基本单元是像素点,众多像素点构成各种线段、平面和形状,通常我们说的320*215的显示屏是指像素点行数是320个,列数是215个,构成一个320*215的矩阵,布满整个屏幕。由于图像信息都是以这种矩阵像素点形式存储和呈现的,因此处理图片的GPU需要以矩阵形式存在的基本处理单元,来分块处理这些矩阵数据。

        2、GPU与CPU区别。

        从GPU与CPU架构对比图可以看出,CPU的逻辑运算单元(ALU)较少,控制器(control)占比较大;GPU的逻辑运算单元(ALU)小而多,控制器功能简单,缓存(cache)也较少。GPU的众多逻辑运算单元呈矩阵排列,可以并行处理数量众多但较为简单的处理任务,图像运算处理就可以进行这样的拆解。GPU单个运算单元处理(ALU)能力弱于CPU,但是数量众多的运算单元可以同时工作,当面对高强度并行计算时,其性能要优于CPU。


图:CPU与GPU逻辑结构对比

资料来源:观研天下整理

        以英伟达Maxwell架构的GM200处理器说明GPU的内部结构。该处理器由4个图形处理集群(GPC)和16个流处理集群(SMM)组成。每个流处理集群又由4个调度器组成,每个调度器控制着32个逻辑计算内核(core),这些计算内核就是实现逻辑运算的基本单元。相对于CPU的“多核”,GPU算得上是“众核”。


图:英伟达GM200处理器结构

资料来源:观研天下整理

        3、GPU处理流程。

        在电脑中,GPU被集成在显卡中进行图形处理。整个计算机运行时,CPU将图形处理任务交给GPU进行处理。GPU从CPU获得指令后,把大规模、无结构化的图像数据分解成许多独立的块,分配给各个流处理集群(SMM)。每个流处理集群再次把数据分解,分配给调度器,调度器将任务放入自身所控制的32个计算内核(core)中完成最终的数据处理任务。如果将一个core的运算过程记为一个线程,那么该显卡就有32*4*16=2048个线程同时进行。而当前英特尔最强大的酷睿X系列处理器顶配也只能做到18核、36线程。这些任务单一、数量众多同时进行的线程可以大大缩短计算机运算时间,这即是GPU在图形处理方面的优势所在。

        4、GPU“众核”使其在并行处理占优势。

        参考中国报告网发布《2016-2022年中国图形处理器(GPU)行业现状调查及竞争策略分析报告

        从GPU与CPU架构来看,GPU处理核心数量众多,主要用来快速处理图像像素矩阵和显示控制。当前,GPU也被用作图形以外的数据处理,其架构决定了其适合于数据之间关联性不高,可分块处理的大规模并行计算。打个比方直观地解释一下GPU和CPU的区别,如果将CPU比作一个从加减乘除到微积分样样精通的博士生,那么GPU就是数以千计的小学生。如果任务是几千道十以内的加减法题目,当然还是小学生们每人一道题所耗费的时间较短。计算机图形处理这一领域需要多线程并行化处理,为了迎合这一需求,GPU在图形处理及通用并行化计算方面取得了快速发展。GPU主要处理高度可并行的任务,具有更高的运算电路密度、更密集的处理内核,更高的时钟频率。GPU具有很高的浮点运算能力。以英伟达专为游戏玩家设计的GEFORCEGTX1080Ti显卡为例,其核心数达3584个,时钟频率达1582MHz,显存速率达11Gbps。具有超强性能的通用A.I加速卡—TeslaP100,能够为HPC和超大规模工作负载提供每秒超过20万亿次的FP16浮点运算性能,最大功耗为300W。


表:GEFORCEGTX1080Ti显卡参数
 
资料来源:观研天下整理

        5、GPU向通用计算方向发展

        GPU在并行计算、浮点以及矩阵运算方面的强大性能,使其获得了需要大量并行计算的深度学习等高性能运算市场的青睐。与传统的CPU服务器相比,采用GPU加速的服务器在达到相同计算精度条件下,可将训练速度提高5~10倍。

        2011年,谷歌大脑项目(GoogleBrain)通过观看YouTube上的电影学会了识别猫脸。识别过程(推理阶段)需要用到2000颗服务器CPU。随后在英伟达与斯坦福大学的合作项目中,将GPU用于深度学习,经测试12颗GPU的性能与谷歌2000颗服务器CPU的性能相当。

        2015年在ImageNet1000挑战中,微软亚洲研究院视觉神经组采用GPU为其冠军系统(基于深度卷积神经网络(CNN)的计算机视觉系统)加速。该系统首次超越了人类对图形识别和分辨的能力,识图错误率4.94%,低于人眼的5.1%。


图:谷歌猫脸识别和ImageNet图像识别
 
资料来源:观研天下整理

        6、GPU耗能较大。

        集成在游戏PC中,用于图形处理的GEFORCEGTX1080Ti显卡功耗达到了250W,专用于A.I数据中心的Tesla系列加速卡功率也基本都在300W左右。用于PC的英特尔酷睿i系列CPU功耗一般在50-70W之间;用于服务器端的英特尔XeonE系列CPU功耗也只在90-130W之间。配备英伟达GEFORCEGTX1080Ti游戏显卡的PC机功率一般为600W,显卡占据整个系统能耗的42%,而CPU只占系统的10%左右。而在数据中心中,至少支持4片GPU,高性能HPC可以支持多达16片GPU。若搭载4片GPU,光是GPU加速器的功率就达到了1,200W;16片则要4,800W,这相当于3.2个家用两匹空调同时工作,功率非常大。


表:英伟达游戏显卡价

资料来源:观研天下整理

        7、GPU价格昂贵。

        从英伟达用于游戏PC的GPU显卡价格表上可以看出,当前国内市场上还在出售的游戏显卡价格从2千元到1万元不等。这还是以京东商城上低配版的最低价格计算。新推出的显卡基本在5千到1万左右,价格较为昂贵。英伟达应用于A.I数据中心和超级计算的特斯拉(Tesla)系列计算卡价格都在万元以上。在数据中心中,GPU加速卡不止一个,其在数据中心中成本所占比重较高。


表:英伟达Tesla系列加速卡价格
 
资料来源:观研天下整理,转载请注明出处(GSL)

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

我国光储行业供给能力持续提升,政策与经济性双轮驱动市场发展

我国光储行业供给能力持续提升,政策与经济性双轮驱动市场发展

从产业链供给端看,2025年上半年国内储能电池出货量更是达到265GWh,同比增长128%。头部企业表现尤为突出,宁德时代2024年储能电池出货93GWh;亿纬锂能、海辰储能分别为50.45GWh和35.1GWh,行业产能与供给能力持续提升。

2025年12月05日
我国海底数据中心行业已正式进入到商业化阶段 市场或将迎来高速增长

我国海底数据中心行业已正式进入到商业化阶段 市场或将迎来高速增长

2025年是我国海底数据中心元年,2025年2月我国首个海底智算中心在海南正式启用,标志着行业正式进入到商业化阶段,海底数据中心行业也进入到成长初期,预计未来几年有望迎来更多的发展。

2025年11月12日
我国工业软件国产化率有待提升,大模型赋能下行业走向工业AI

我国工业软件国产化率有待提升,大模型赋能下行业走向工业AI

近年来,我国工业软件企业研发进度加快,国内工业软件行业步入高速发展期,截止2024年,我国工业软件市场规模约为3172亿元,预计2025年市场规模约为3395亿元,维持高速增长态势。

2025年11月12日
人工智能发展驱动大模型一体机爆发式增长,多领域落地大模型一体机应用

人工智能发展驱动大模型一体机爆发式增长,多领域落地大模型一体机应用

目前产业落地大模型一体机还是以推理一体机为主导。这是由于一方面模型推理是当前AI落地应用的主战场,许多企业不再自己训练模型,而是直接调用或部署现有模型进行应用开发,这也催生了对高性能、低成本、易部署的推理专用设备的巨大需求。

2025年11月11日
中国人体工学椅行业蓬勃发展 “国际巨头引领、本土头部突围、中小厂商混战”格局凸显

中国人体工学椅行业蓬勃发展 “国际巨头引领、本土头部突围、中小厂商混战”格局凸显

全球范围内,人体工学椅市场规模持续增长,而中国作为全球最大的办公椅生产国和出口国,在其中占据了举足轻重的地位。截止2024年,我国人体工学椅行业市场规模达到了208.81亿元,2020至2024年复合增长率为11.42%。

2025年11月07日
国内外量子技术取得突破,产业化持续加速

国内外量子技术取得突破,产业化持续加速

全球主要科技强国均将量子计算视为战略制高点,并通过国家战略引导与资本投入等方式展开激烈角逐。量子计算作为未来技术革命的关键领域之一,已形成多国竞争博弈的格局。随着各国持续加大投入,以及技术研发与产业应用的不断推进,未来几年全球量子计算领域的竞争态势预计将愈发激烈。

2025年11月07日
技术愈发成熟下中国人工智能行业应用广度深度正不断拓展

技术愈发成熟下中国人工智能行业应用广度深度正不断拓展

AI已广泛渗透至各行各业随着AI技术的成熟,AI已经不再局限于实验性应用,而是广泛渗透到各行各业,推动行业数字化转型。尤其在医疗健康、制造业、金融业、零售与电商等领域,AI技术正成为企业核心竞争力的一部分。

2025年11月03日
政策持续加码,中国智能家居行业加速发展

政策持续加码,中国智能家居行业加速发展

在细分市场方面,智能家电和智能娱乐占据主要市场。智能家电和智能娱乐占据了智能家居81%的市场规模,构成了行业的主体部分。其次是智能连接控制设备(10%)、智能安防(5%)、智能光感(3%)和智能能源管理(1%)等细分领域。

2025年09月12日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部