咨询热线

400-007-6266

010-86223221

2017年我国图形处理器(GPU)性能分析及发展方向预测(图)

        GPU(GraphicsProcessingUnit)是图形处理单元。是个人电脑、工作站以及移动设备等用来进行图像处理的微处理器。显卡是连接计算机主板和显示器的重要元件,可以接受主板的控制信号,转换成显示器能够识别的命令,控制显示器正确显示图像信息。而GPU就是显卡的处理器,是显卡的“大脑”,专门用来处理图形计算任务。


图:显卡的内部构造

资料来源:观研天下整理

        1、GPU架构特点。

        GPU架构特点与其需要处理的任务相关,其处理和显示的计算机图形本质上都是二维数据矩阵。计算机图形显示的基本单元是像素点,众多像素点构成各种线段、平面和形状,通常我们说的320*215的显示屏是指像素点行数是320个,列数是215个,构成一个320*215的矩阵,布满整个屏幕。由于图像信息都是以这种矩阵像素点形式存储和呈现的,因此处理图片的GPU需要以矩阵形式存在的基本处理单元,来分块处理这些矩阵数据。

        2、GPU与CPU区别。

        从GPU与CPU架构对比图可以看出,CPU的逻辑运算单元(ALU)较少,控制器(control)占比较大;GPU的逻辑运算单元(ALU)小而多,控制器功能简单,缓存(cache)也较少。GPU的众多逻辑运算单元呈矩阵排列,可以并行处理数量众多但较为简单的处理任务,图像运算处理就可以进行这样的拆解。GPU单个运算单元处理(ALU)能力弱于CPU,但是数量众多的运算单元可以同时工作,当面对高强度并行计算时,其性能要优于CPU。


图:CPU与GPU逻辑结构对比

资料来源:观研天下整理

        以英伟达Maxwell架构的GM200处理器说明GPU的内部结构。该处理器由4个图形处理集群(GPC)和16个流处理集群(SMM)组成。每个流处理集群又由4个调度器组成,每个调度器控制着32个逻辑计算内核(core),这些计算内核就是实现逻辑运算的基本单元。相对于CPU的“多核”,GPU算得上是“众核”。


图:英伟达GM200处理器结构

资料来源:观研天下整理

        3、GPU处理流程。

        在电脑中,GPU被集成在显卡中进行图形处理。整个计算机运行时,CPU将图形处理任务交给GPU进行处理。GPU从CPU获得指令后,把大规模、无结构化的图像数据分解成许多独立的块,分配给各个流处理集群(SMM)。每个流处理集群再次把数据分解,分配给调度器,调度器将任务放入自身所控制的32个计算内核(core)中完成最终的数据处理任务。如果将一个core的运算过程记为一个线程,那么该显卡就有32*4*16=2048个线程同时进行。而当前英特尔最强大的酷睿X系列处理器顶配也只能做到18核、36线程。这些任务单一、数量众多同时进行的线程可以大大缩短计算机运算时间,这即是GPU在图形处理方面的优势所在。

        4、GPU“众核”使其在并行处理占优势。

        参考中国报告网发布《2016-2022年中国图形处理器(GPU)行业现状调查及竞争策略分析报告

        从GPU与CPU架构来看,GPU处理核心数量众多,主要用来快速处理图像像素矩阵和显示控制。当前,GPU也被用作图形以外的数据处理,其架构决定了其适合于数据之间关联性不高,可分块处理的大规模并行计算。打个比方直观地解释一下GPU和CPU的区别,如果将CPU比作一个从加减乘除到微积分样样精通的博士生,那么GPU就是数以千计的小学生。如果任务是几千道十以内的加减法题目,当然还是小学生们每人一道题所耗费的时间较短。计算机图形处理这一领域需要多线程并行化处理,为了迎合这一需求,GPU在图形处理及通用并行化计算方面取得了快速发展。GPU主要处理高度可并行的任务,具有更高的运算电路密度、更密集的处理内核,更高的时钟频率。GPU具有很高的浮点运算能力。以英伟达专为游戏玩家设计的GEFORCEGTX1080Ti显卡为例,其核心数达3584个,时钟频率达1582MHz,显存速率达11Gbps。具有超强性能的通用A.I加速卡—TeslaP100,能够为HPC和超大规模工作负载提供每秒超过20万亿次的FP16浮点运算性能,最大功耗为300W。


表:GEFORCEGTX1080Ti显卡参数
 
资料来源:观研天下整理

        5、GPU向通用计算方向发展

        GPU在并行计算、浮点以及矩阵运算方面的强大性能,使其获得了需要大量并行计算的深度学习等高性能运算市场的青睐。与传统的CPU服务器相比,采用GPU加速的服务器在达到相同计算精度条件下,可将训练速度提高5~10倍。

        2011年,谷歌大脑项目(GoogleBrain)通过观看YouTube上的电影学会了识别猫脸。识别过程(推理阶段)需要用到2000颗服务器CPU。随后在英伟达与斯坦福大学的合作项目中,将GPU用于深度学习,经测试12颗GPU的性能与谷歌2000颗服务器CPU的性能相当。

        2015年在ImageNet1000挑战中,微软亚洲研究院视觉神经组采用GPU为其冠军系统(基于深度卷积神经网络(CNN)的计算机视觉系统)加速。该系统首次超越了人类对图形识别和分辨的能力,识图错误率4.94%,低于人眼的5.1%。


图:谷歌猫脸识别和ImageNet图像识别
 
资料来源:观研天下整理

        6、GPU耗能较大。

        集成在游戏PC中,用于图形处理的GEFORCEGTX1080Ti显卡功耗达到了250W,专用于A.I数据中心的Tesla系列加速卡功率也基本都在300W左右。用于PC的英特尔酷睿i系列CPU功耗一般在50-70W之间;用于服务器端的英特尔XeonE系列CPU功耗也只在90-130W之间。配备英伟达GEFORCEGTX1080Ti游戏显卡的PC机功率一般为600W,显卡占据整个系统能耗的42%,而CPU只占系统的10%左右。而在数据中心中,至少支持4片GPU,高性能HPC可以支持多达16片GPU。若搭载4片GPU,光是GPU加速器的功率就达到了1,200W;16片则要4,800W,这相当于3.2个家用两匹空调同时工作,功率非常大。


表:英伟达游戏显卡价

资料来源:观研天下整理

        7、GPU价格昂贵。

        从英伟达用于游戏PC的GPU显卡价格表上可以看出,当前国内市场上还在出售的游戏显卡价格从2千元到1万元不等。这还是以京东商城上低配版的最低价格计算。新推出的显卡基本在5千到1万左右,价格较为昂贵。英伟达应用于A.I数据中心和超级计算的特斯拉(Tesla)系列计算卡价格都在万元以上。在数据中心中,GPU加速卡不止一个,其在数据中心中成本所占比重较高。


表:英伟达Tesla系列加速卡价格
 
资料来源:观研天下整理,转载请注明出处(GSL)

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

我国算力行业现状及前景分析:供需匹配度提升空间大 大数据市场价值有待挖掘

我国算力行业现状及前景分析:供需匹配度提升空间大 大数据市场价值有待挖掘

从区域市场来看,受我国数据中心建设投资的影响,我国算力行业区域市场主要集中在华东、华南和华北地区。2024年上半年我国算力行业区域市场规模分布华东地区占比37.63%,华中占比9.18%,华南占比16.81%,华北地区占比18.53%,东北地区占比2.56%,西南地区占比11.67%,西北地区占比3.62%。

2024年11月04日
小游戏异军突起成为手游细分新贵 蓝海市场下行业尚未出现垄断性龙头公司

小游戏异军突起成为手游细分新贵 蓝海市场下行业尚未出现垄断性龙头公司

国内小游戏平台最大的当属微信小程序游戏平台。微信小游戏平台诞生于2017年的《跳一跳》,并在2018年开放接入,目前已有接近40万开发者,2023年小游戏规模同比增长超50%,超100个团队季度流水超千万元。

2024年09月13日
我国智算中心建设加速 目前市场正面临应用多元化、供需不平衡挑战

我国智算中心建设加速 目前市场正面临应用多元化、供需不平衡挑战

目前政府、运营商、互联网企业等积极布局智算中心,中国移动正在规划建设亚洲最大的智算中心。各级政府、运营商、互联网企业也纷纷开启智算中心建设计划,目前已有超过40座城市布局智算中心。在行业下游需求驱动和政策持续引领下,智算中心行业市场规模持续扩大,2023年达到1466亿元。

2024年08月09日
新兴技术带来新增长点 技术创新成我国互联网软件开发行业发展核心驱动力

新兴技术带来新增长点 技术创新成我国互联网软件开发行业发展核心驱动力

随着云计算、人工智能、物联网等技术的不断发展,软件开发行业将面临更多的市场机遇,推动互联网软件开发行业市场规模不断扩大。截至2023年,我国互联网软件开发行业市场规模已经达到27805亿元,并且仍在不断增长。

2024年06月27日
我国光存储行业:产品优势逐步凸显 市场需求日益旺盛

我国光存储行业:产品优势逐步凸显 市场需求日益旺盛

根据《中国存力白皮书(2023年)》的统计数据,2022年我国的存储总规模继续增长,增速达到25%,总规模已经达到1000EB。2023年发布的《算力基础设施高质量发展行动计划》,也对存力规划给出目标,至2025年存储总量需超过1800EB, 其中先进存储容量占比超过30%,重点行业核心数据、重要数据灾备覆盖率达到10

2024年05月14日
我国数据标注行业:下游持续扩张带来可观发展前景 未来市场有望快速增长

我国数据标注行业:下游持续扩张带来可观发展前景 未来市场有望快速增长

近年来数据标注行业发展迅速,行业内涌现了大批量的中小企业,据统计截止2023年数据标准行业相关企业数达到1123家,呈现出井喷的趋势。未来,在大数据产业的不断发展下,预计数据标注相关企业数量将呈现不断增长趋势。

2024年03月08日
我国智算中心行业市场规模稳增长 政府、运营商、互联网企业等积极布局

我国智算中心行业市场规模稳增长 政府、运营商、互联网企业等积极布局

AI服务器能够提供人工智能数据服务,是算力基础设施之一。智能算力规模以AI服务器为基础,全球AI服务器市场规模不断上升,据IDC数据,2022年全球AI服务器销售额为183亿美元,同比增长17.3%。我国AI服务器销售额持续增长,2022年AI服务器销售额为523.5亿元,2018-2022年均复合增长率达17.7%。

2024年02月27日
我国数字经济行业:发展活力持续释放 产业数字化探索更加丰富多样

我国数字经济行业:发展活力持续释放 产业数字化探索更加丰富多样

2022 年我国数据产量达 8.1ZB,同比增长 22.7%,占全球数据总产量 10.5%,位居世界第二。截至 2022 年底,我国存力总规模超 1000EB,数据存储量达 724.5EB,同比增长 21.1%,占全球数据总存储量的 14.4%。

2024年02月27日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部