CL传媒头像

CL传媒

客服VX:coolfensi,客服QQ:2451468936(QQ/微信客服只做引导和站点通知,不闲聊。有站点内业务疑问以及订单问题的话,请点击【CL-在线售后客服窗口】进行会话)

  • 文章103020
  • 阅读8884626

人生倒计时

  • 今日已经过去小时
  • 这周已经过去
  • 本月已经过去
  • 今年已经过去个月
首页 最新知识 正文内容

国产化服务器芯片对比(国产 服务器 芯片)

客服VX(coolfensi) 最新知识 2023-04-10 23:04:08 53

CPU性能大乱斗!国产CPU实力揭露

一直一来,缺芯少魂一直是中国信息产业的心病,中国的CPU市场也一直被Intel、ARM等国外厂商垄断,龙芯、申威、飞腾等国产CPU在社会上也往往遭到别有用心之徒诸如“打磨芯片”、“骗经费”、“政绩工程”等舆论抨击。不久前,采用申威26010的神威太湖之光在TOP500刷榜,飞腾也公布了采用ARM指令集的飞腾1500A和飞腾2000,龙芯的3A3000也顺利完成流片,那么这些国产CPU的性能到底如何呢?

联系方式:微信:coolfensi
(使用浏览器扫码进入在线客服窗口)
复制联系方式

如何评价CPU

如何评价CPU的性能呢?从体系结构的角度来看,有个指标叫MIPS,即每分钟执行多少条指令,执行指令数量越多,性能就越好,但这存在一个问题,当CPU指令集不同的时候,比较MIPS就意义不大了——比如A一条指令只算一个加法,B一条指令能做一个1024点的FFT。特别是在不同指令集的情况下,如何评价CPU的性能呢?

评价CPU性能必须考虑应用的多样性,比如科学运算重视双精浮点性能,但是如果数据供不上,运算能力再强也没用;比如PC日常使用更偏重于定点性能;再比如计算中心多任务环境关注的是吞吐率......因此单纯用某一个指标来衡量CPU性能是不科学的,必须综合考量。

业界也推出了很多基准测试程序,比如针对CPU的SPEC,针对嵌入式应用的EEMBC等。SPEC测试是比较权威的测试程序。和一些黑箱测试程序调整计分方式和计分权重后测试结果就发生变化不同,SPEC测试到底跑了什么程序,以及各项程序跑分和计分方式全部公开透明,而且覆盖范围广——SPEC2000有12个定点程序,14个浮点程序,而且有比较强的代表性,比如gzip、vpr、gcc、mef、eon等。而SPEC2006则把定点程序扩展到14个定点程序和16个浮点程序。

在计分方法上,SPEC在计分上采用归一化的几何平均方法来进行综合性能评估——将不同CPU的执行时间与参照对象相比较后得到一个相对值。SEPC2000的参照对象是Ultra SPARC 2工作站的主频为300Mhz的CPU。如果运行测试程序1的时间是参照对象的十分之一的话,测试就是1000分,测试程序2的耗时是参照对象的八分之一的话,则为800分.....最后再算几何平均——比如SEPC2000有12个定点测试,就将12个测试成绩相乘再开12次方,SPEC2006相对于SPEC2000而言仅仅是扩展了几项测试程序,使测试更加科学合理。这里,我们以三星猎户座7420和华为麒麟950为例计算SPEC测试成绩。

以上为两款芯片的跑分成绩,由于两款SOC均是购买ARM的IP授权做集成的产物,猎户座7420的成绩其实是ARM Crotex A57的成绩,华为麒麟950则是ARM Crotex A72的成绩,将12个子项相乘再开12次方后,得到ARM Crotex A57在2.1G主频时定点测试成绩为1376分,换算一下就是655/G,ARM Crotex A72的定点成绩则为749/G。

不过SPEC也非尽善尽美,测试存在容易受编译器影响的问题。举例来说,SUN曾经通过编译器优化提升SPEC跑分50%,龙芯的某一代产品也曾用自主研发的LCC编译器,比使用GCC定点跑分提升了60%。另外,即便同样是GCC编译器,不同版本的GCC编译器下,测试成绩也会有很大差异。笔者认为,出现这种现象的根源并非SPEC测试的缺陷,反而用事实说明了,最后的用户体验是软件+硬件的结果,充分说明了软硬件磨合的重要性。

可能有的读者对不明白什么是编译器,在此说明一下,程序员在编程的时候写的是编程语言,但是计算机运行的时候是机器语言,编译器就是将程序员的编程语言翻译成机器语言的工具。

龙芯、飞腾、申威和Intel的比较

现在,我们先就龙芯和飞腾的桌面芯片与Intel的CPU做比较。由于桌面芯片更加注重单线程性能——单核性能是基础,很多程序都依赖单进程的处理速度,如果单核性能上不去,核心数再多也没用,这也是AMD 六核、八核芯片打不赢Intel 四核芯片的原因。另外,对于桌面芯片来说,日常使用中更加倚重定点性能。因此,在这里我们以单线程实际测试的定点成绩做比较。

在编译器为GCC5.2的情况下,Intel I5 4460在3.2G主频下SPEC2006的定点成绩为32分;在编译器为GCC4.4.7的情况下,龙芯3A3000在1.5G主频下的定点成绩为11分;在编译器为GCC4.8的情况下,飞腾1500A在1.8G主频的定点成绩为10分。诚然Intel在编译器上占有一定优势,这里为了方便比较就忽略编译器带来的差异了,就定点性能而已,龙芯3A3000和飞腾1500A的单线程性能大约为Intel I5 4460的三分之一。

差距在哪里呢?主要是在主频上,其次在微结构。龙芯3A3000的主频只有1.5G,飞腾1500A的主频只有1.8G,而Intel I5 4460的主频达3.2G,而且如果需要的话,还能睿频到3.4G,很显然,在主频上龙芯3A3000只有Intel I5 4460的一半不到,而飞腾1500A也只有Intel I5 4460的一半多一点。

微结构也就是常说的CPU核,在主频相同的情况下,两款CPU的性能差异取决于微结构的差异,像龙芯GS464E、Intel的Haswell、ARM的Crotex A72都是微结构。龙芯3A3000在1G主频时,SPEC2006测试定点成绩为7.3,飞腾1500A主频为1G时,SPEC2006测试定点成绩为5.5,而I5 4460在1G主频时的定点成绩为10。可以说,龙芯的GS464E大约有Intel的Haswell性能的73%,而飞腾的FTC660大约是Intel的Haswell性能的55%。

那么如何提升主频和微结构呢?提升微结构需要在指令分支预测,寄存器重命名,多指令通路,乱序发射,功能部件,访存性能等方面做文章,目的是使整个的指令流水的效率尽可能高,因为如果有一个环节设计不好或不匹配的话,整个系统效率就发挥不出来,这是CPU的核心技术。提升主频很大程度上要依赖后端设计能力,也就是要指物理层电路的具体优化,包括单元布局、时序优化等放方面下苦功。

接下来就国产服务器CPU与Intel的服务器CPU做比较,以国产服务器CPU中多线程性能最强的飞腾2000为例。在编译器为GCC4.8的情况下,飞腾2000在2G主频的单线程SPEC2006测试成绩为定点12.4,浮点11.3,换算一下飞腾2000的CPU核FTC661的定点成绩为6.2/G,和Intel Haswell 10/G的成绩依旧有不小的差距,由于飞腾2000为64核芯片,在单线程性能相对有限的情况下,依靠核心数量的优势,FT2000的多线程SPEC2006测试成绩为定点570,浮点482,全芯片性能与Intel Xeon E5-2695v3相当,这是非常了不起的成绩。

由于科学计算倚重双精浮点性能,超算芯片的比较中就以双精浮点性能为指标进行,申威26010的双精浮点性能为3T,和Intel目前最好的超算芯片KNL相当,更难人可贵的是这是在制造工艺与Intel相差2代的情况下取得的成绩,这充分体现出申威26010在设计思想上的先进性。

结语

在桌面芯片上,龙芯和飞腾目前最好的桌面四核芯片的单线程定点测试成绩大约为Intel I5 4460的三分之一,虽然和Intel的差距依旧比较大,但目前龙芯和飞腾还没有大型游戏等对CPU性能要求较高的软件应用,现在的性能对于绝大多数应用来说都是够用的,特别是对党政军办公电脑和一体机,龙芯3A3000和飞腾1500A的性能已经属于性能过剩了,只要软件跟得上,在党政军领域能替换Intel的CPU。

在服务器CPU上,飞腾2000虽然在单线程性能上和Intel有一定差距,但其全芯片性能颇为不俗,能与Intel Xeon E5-2695v3相当,已经是全球全芯片性能最强的ARM服务器CPU,如果ARM等国外厂商能完善其服务器CPU的软件生态,飞腾则有可能借着ARM的生态一飞冲天。

在超算芯片上,申威26010完全可以和Intel最好的加速器KNL硬碰硬的较量。

出品:科普中国

制作:铁流

监制:中国科学院计算机网络信息中心

“科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。

本文由科普中国融合创作出品,转载请注明出处。

国产化服务器芯片对比(国产 服务器 芯片) 第1张

国产cpu芯片如何选择,选哪个公司的产品更好?

选择芯片要看你主要的使用场景是什么,个人建议还是可以考虑飞腾的,飞腾的产品谱系非常全面,服务器、桌面和工控的CPU都有在做,在单位办公、通信、轨道交通、重点行业业务系统、云计算、大数据等方面都有着很广泛的应用,且飞腾在生态建设方面做的比较不错,与国内伙伴单位展开合作,形成了基于飞腾平台的云计算全栈、边缘计算全栈、终端全栈、嵌入式全栈生态,让更多的集成商和客户有了更多的选择空间。

跑步前进!三款国产芯片破冰,魏少军:高端芯片不再全面依赖国外

前段时间,美哈佛大学出了一份报告,表示我国在多个尖端技术领域已经取得巨大进步。尤其是在5G、人工智能、量子计算等已取得全球领先,并开始占主导地位。

国内有专家说得很好,就是近十年来,我们跟美同时起步的技术,我们都能做到领先。现在某些方面落后的,大都是人家起步早的领域,像现在有差距的半导体方面。

不过,哈佛报告还预测,我国将成为全球成熟技术节点上最大的半导体生产国,并且未来十年我国将在半导体等核心技术上实现领先。果不其然,好消息很快传来。

第一,浙大超导量子芯片取得突破成果。 量子技术是未来 科技 竞争的一大重点,目前各国都在大力投入研发,可以说是已经展开竞赛,都希望在量子领域中占先机。

从之前的相关报道,我们也都可以看到量子计算机的优势已经非常明显,尤其是在计算速度方面更是快到惊人。而要实现稳定的量子计算机,量子芯片是其中的关键。

近日,我国在量子芯片方面又取得了突破,浙江大学发布了两款超导量子芯片。

其中,“莫干1号”采用全连通架构,包含32个超导量子比特,是目前超导量子芯片中比特数目最多的,主要是针对量子态的精确调控,以及多体物理的量子模拟。

“天目1号”芯片面向通用量子计算,采用了较易扩展的近邻连通架构,平均退相干时间为50微秒,处于世界前列。相比于“莫干1号”具备更高的编程灵活度。

浙大公布的两款量子芯片成果,充分证明我国在这方面已处于世界第一梯队水平。

第二,纯国产龙芯服务器芯片研发成功。 一直以来,在CPU上我们主要依赖国外,不管是日常工作生活用的电脑,还是服务器领域,CPU基本被英特尔和AMD垄断。

然而,随着国内对数据保密等方面的要求越来越高,对国产CPU的需求就越来越大。尤其是纯国产CPU更加期待,在这方面做得最好的就是中科院旗下龙芯中科。

在龙芯CPU首席科学家胡伟武的带领下,已推出了自主研发的三代龙芯国产CPU。

前段时间,龙芯3A5000系列通用CPU正式亮相,性能达到国际主流CPU水准。近日,中科院再次公布,面向服务器领域的纯国产CPU龙芯3C5000已经研发成功。

这款芯片有两个重要特点:其一是采用了自主架构LoongArch指令集,从内到外全纯国产设计,不再担心国外架构授权限制,之前都是使用国外X86或ARM架构。

其二是芯片性能很强大,综合性能表现不落后目前市场的主流服务器CPU,内部集成16个高性能的龙芯LA464处理器核。应用后,将大大提高我们数据的安全性。

第三,碳基芯片关键工艺课题通过验收 。 我们现在的芯片是硅基芯片,现在5nm正在量产,3nm预计明年下半年实现量产,接下来再往下发展就是2nm、1nm。

然而,由于硅基芯片技术由于受加工技术、器件物理极限等方面限制,已经接受物理极限,且成本高到已经不合适。因此,就需要寻找更加合适的下一代替代产品。

碳基芯片具有加工温度低、工作速度快、功耗低等优势,最有可能成为后摩尔时代集成电路的颠覆性技术之一。在这方面,我国也早就开始研发,并且还非常领先。

近日,好消息传来,多个部门组成的验收组,对“90 纳米碳基集成电路关键工艺研究”课题进行评审,在听取汇报、查看资料和样品实物后,一致通过了该课题研究。

并且,碳基芯片90 纳米工艺先导线正在建设中。别小看这个90纳米,根据研究成果估算,90纳米碳基芯片性能相当于28纳米硅基芯片,60纳米就相当于10纳米。

重点是,这个碳基芯片可以不用EUV光刻机,国产光刻机就可以。并且该课题开展过程,在 90 纳米材料制备、关键工艺及器件性能、应用 探索 等均取得了可喜成果,并且都处于世界领先水平。这次验收通过,表示碳基芯片距离商用又近了一大步。

以上的三个国产芯片突破,龙芯很快就可以应用,碳基芯片和量子芯片是在为未来打基础,这两种芯片将为我国未来芯片行业领先、不受限制奠定一个坚实的基础。

近日,我国半导体行业协会集成电路设计分会理事长魏少军,就芯片发展发表意见。

他表示,我国已经成为全球最为完整的芯片产品体系之一,不仅在中低端芯片领域具备较强的竞争力,在高端芯片领域也摆脱了全面依赖国外产品的被动局面。

魏少军所说的高端芯片不再全面依赖国外情况非常振奋人心,不过他主要是侧重设计方面,高端芯片设计的确已经达到全球领先,但在制造方面我们还有不小差距。

不过,从近期国内芯片行业的不断突破来看,我们在进步,问题终究会解决。

文章目录
    搜索