努力加载中
  • 推荐
  • 要闻
  • 财经
  • 娱乐
  • 时尚
  • 情感

热点推荐

热门图文

龙芯3C6000系列发布:对标英特尔第三代至强!全新GPGPU芯片曝光
芯智讯

6月26日,“2025龙芯产品发布暨用户大会”在北京中关村国际创新中心举行。国产处理器厂商龙芯中科重磅发布了基于国产自主指令集龙架构(LoongArchTM)研发的服务器处理器龙芯3C6000系列芯片,最高支持128核256线程,性能对标英特尔第三代至强可扩展处理器。目前,已有超过40家厂商推出了基于龙芯3C6000系列的整机和解决方案。同时,龙芯中科还发布了工控领域及移动终端处理器龙芯2K3000/3B6000M芯片,以及相关整机和解决方案。

龙芯中科董事长胡伟武在发布会上非常骄傲地指出:“本次大会发布的龙芯3C6000和2K3000龙芯CPU完全自主可控,不依赖任何国外技术授权和境外供应链。”

龙芯3C6000系列发布:性能对标英特尔第三代至强可扩展处理器

本次大会发布的龙芯3C6000系列服务器CPU采用自主指令系统龙架构,于2024年上半年流片成功。3C6000单硅片16核32线程,可通过自研的龙链接口通过多硅片封装形成32核64线程的3C6000/D(又称3D6000)及60/64核120/128线程的3C6000/Q(又称3E6000)。

根据中国电子技术标准化研究院测试报告,单路3C6000/S服务器在2.2GHz运行SPEC CPU 2017单核单线程定/浮点分值为5.56/6.93分,多核定/浮点分值为73.2/58.5分。相同工艺下,性能相比上代3C5000系列成倍提升!并且性能达到了英特尔2021年推出的至强 Silver 4314水平。

双路32核3C6000/D服务器在2.1GHz运行SPEC CPU 2017多核定/浮点分值为284/261分。性能已经达到了同样32核心2.0GHz的英特尔第三代至强可扩展处理器Xeon Gold 6338的水平。

双路64核3C6000/Q服务器在2.1GHz运行SPEC CPU 2017多核定/浮点分值为450/283分。这个性能超过了双路40核心2.3GHz的英特尔Xeon Platinum 8380的水平。

四路128核心的3C6000/D服务器在2.1GHz运行SPEC CPU 2017多核定/浮点分值为547/412分。

龙芯中科董事长胡伟武表示,结合英特尔公司第三代至强可扩展架构服务器芯片出货情况,龙芯3C6000系列服务器CPU综合性能达到2023年市场主流产品水平(2023年第三代至强的出货占比仍高达68%),产品代差缩小至两代。

随后,龙芯中科副总裁张戈还介绍了龙芯3C6000高性能自主服务器解决方案。由于3C6000系列处理器具有高性能、高可靠、高安全、全自主等特点,可满足通算、智算、存储、工控、工作站等多场景的计算需求。目前,3C6000系列处理器已获《安全可靠测评公告》当前最高等级二级认证,可确保关键领域应用安全。部分央企、金融客户已基于3C6000服务器开始上线核心业务系统。

在本次发布会上,浪潮计算机、中兴通讯、联想开天、软通计算机、航天706所、超越科技、超云、诚迈科技、云尖、国鑫、国光、宝德、网安、207所、中核华辉、升腾、大唐科研总院、太初元碁、华清同创、航天龙梦、联硕、黄河信产、航天联诚、天融信、上海宽域、雷神、腾凌科技、鲸鲨软件、百代存储、上海芮宣、铵泰克、众达科技、湖南兴天、深圳芯创、原基科技、湖南博匠、万数科技、储迹、恒生数字、北联国芯、攀升科技、派能信创、通明智云、国建大数据、擎毅科技、天安星控、中博数智、天创者、云晓科技等48家企业发布了基于龙芯3C6000系列处理器的通用服务器、存储服务器、工业服务器、网络安全设备等主板、整机及解决方案产品,在党政、国防、金融、能源、电信、云计算、AI等关键领域具有广阔应用前景,其中部分主板和整机强调核心元器件100%国产化。

3B6000M/2K3000终端/工控CPU

在本次大会上,龙芯中科还发布了基于自主指令系统龙架构3B6000M/2K3000终端/工控CPU,主要面向终端(笔记本、云终端等)和工控应用,这两款芯片都于2024年底流片成功。

3B6000M/2K3000主要区别在于封装形式和主频的不同,其他方面基本一致,都集成8个LA364E处理器核,主频2.5GHz时实测SPEC CPU2006 Base单核定点分值达到30分;集成了龙芯第二代自研GPGPU核心LG200,单精度浮点峰值230.4GFLOPS@900MHz,8bit定点峰值7.2TOPS@90OMHz;集成了独立硬件编解码模块,4K高清视频处理性能达到每秒60帧;集成安全处理器提供可信支持和密码服务,包括SM2/3/4硬件算法模块以及可供软件编程使用的可重构密码模块。



胡伟武表示,2K3000/3B6000M的研制成功,标志着龙芯已经系统掌握了通用处理器、图形处理器、 Al处理器及其基础软件设计的关键核心技术,在巩固通用处理器、图形处理器的基础上,进入大力发展AI处理器的新时期。

在此次发布会上,华龙讯达、盛博科技、道莅智远科技、众达科技、米联客、湖南兴天、国科亿道、北方星空、航宇创通、航力安太、新松佳和、眺望电子、嘉擎信息、中嵌科技、上海宽域、中科云、中邦自控、吉斯凯达、赛飞特、上海合亿、瑞腾信息、国科鸿飞、研域、迅龙软件、艾宝科技、升腾、航天龙梦、卓怡恒通、创智成、六联智能、宝新创、智微智能、高能计算机、麒麟信安、艾讯云等35家企业现场发布了基于龙芯2K3000/3B6000M处理器的板卡、工业控制器、工控一体机、工业平板、笔记本、云终端等工控及终端产品,具有高性能、高可靠、强安全等特点,适用于复杂工业环境、推理场景,可广泛应用于能源、交通、制造等领域,守护能源安全、助力交通智行、赋能新型工业化。

第五代微架构LA864曝光:同频性能提升30%

据胡伟武介绍,龙芯接下来的第五代微架构LA864相比上代的LA664在同样主频下,性能可以提升30%以上,每GHz性能(SPEC CPU分值)处于世界领先地位。虽然LA864的硅片面积比上代增加了3%,但是相同工艺下主频提高了5-10%,并且还增加对于二进制翻译指令的支持,通过二进制翻译可流畅运行主流桌面应用。


龙芯下一代的桌面/服务器CPU都将会采用最新的LA864微架构。其中,面向桌面的3B6600配备了8个通用核心+4个专用核心,单核SPEC INT 2006分值可达60-70分,相比之下2.5GHz的3A6000得分只有48分;面向桌面的3A6600则配备了4个通用核心+4个专用核心,属于3B6600的低成本版;面向服务器的3D7000将会采用Xnm先进工艺,配备32核心以上,支持多硅片封装。


胡伟武强调,第五代的LA864微架构内核通过设计优化在1Xnm工艺下就能够达到7nm工艺的X86内核性能,如果能够抹平制程工艺上的差距,那么龙芯的自研微架构将有望得到更大的性能提升,可进一步缩小与X86厂商高端产品的代差。

龙芯GPGPU芯片9A1000和9A2000曝光

“凡是做GPU的企业都必须要有自己的GPU。”龙芯中科首席工程师、通用GPU处理器研发负责人苏孟豪表示,龙芯中科自2016年完全是从零开始研发自主图形处理器核心,经过5年时间才完成了第一代GPU核心LG100的研发,目前该GPU核心已在龙芯独显桥片7A2000和SOC芯片2K2000中批量应用,出货量已经达到了百万颗的规模。



此次龙芯中科最新发布的3B6000M/2K3000则集成了第二代GPGPU核心LG200,完成了功能补课(支持高版本图形API和计算API),实现了性能扩展,兼具图形处理和AI处理功能。


苏孟豪指出,龙芯中科从GPU转型到GPGPU的难度不亚于从第一代的从零起步,花了三年时间才推出了第一版设计。设计思路也从以图形为中心转变成了以计算为中心,使得计算资源通用化,图形处理以各种计算任务形式的存在。这也带来了设计复杂度的大幅提升,比如RTL代码规模翻倍。

根据胡伟武的披露的龙芯中科GPGPU架构资料显示,其每个GPGPU硅片当中包含了X个GPC计算单元,通过多层次互联;每个GPC当中则将集成1个GP单元(Graphics Pipeline, 16pixel cycle)+ Y个SP单元(Stream Processor);每个SP单元当中又包括1个纹理单元+Z个Vector Unit;每个Vector Unit当中则包含了16个单季度浮点ALU(32FLOP/cycle)、1个双精度浮点ALU(2FLOP/cycle)、1个张量单元(1024OP+512BF16/cycle)。因此,整个GPGPU的算力扩展路径就是X*Y*Z*F(F为频率)。此次发布的2K3000集成了1个GPC计算单元,2个SP单元,每个SP单元当中包含了4个Vector Unit。

随着第二代GPGPU核心LG200的成功商用,龙芯中科也开展了专用GPGPU芯片9A1000和9A2000的研发。

龙芯中科对于9A1000的定位是低成本的GPGPU,这也是龙芯中科首款GPGPU专用芯片,主要面向显卡/AI加速卡。其中,显卡性能对标AMD RX550,支持OpenGL 4.0;在终端AI计算性能方面,INT8性能大于32TOPS。同时,9A1000还将集成视频处理模块,支持H.264/H.265编解码。

苏孟豪则进一步指出,9A1000相比2K3000集成的第二代GPGPU核心LG200带来了5倍以上的性能提升,AI算力更是达到了40TOPS。这主要得益于9A1000的GPU内核进行了全面升级,图形流水线翻倍,主频也提升了25%,同时流处理器面积减小了20%,轻负载功耗降低了70%。并且,9A1000的GPU规模提高到LG200的4倍。该芯片将会在2026年推出。



至于9A2000则将是龙芯面向中高端市场的独立显卡芯片,其主要是将四颗9A1000集成在了一起,图形API升级到OpenGL 4.6,并加入了对于虚拟化的支持,张量单元也支持更多数据类型。算力方面,但精度浮点算力达5TFLOPS,INT8 AI算力达160TOPS,内存带宽256GB/s。并且,9A2000还支持双片互联,使得整体性能还可再提升一倍,达到同等工艺下国际先进水平。该芯片将会在2027年推出。


此外,胡伟武还透露,后续的9A3000则是一款更高性能的GPGPU,如果采用先进的Xnm工艺,性能可能会带来3-5倍的提升。

“接下来,龙芯AI处理器将坚持融合图形计算和AI计算的GPGPU技术路线,聚焦推理类应用,从端侧应用做起,坚持自主研发、迭代发展,不断提高性能并完善软件生态。”苏孟豪说道。

龙芯“三剑客”性价比是上代3倍

本次大会发布的龙芯3C6000系列服务器CPU、3B6000M终端CPU,加上2023年底发布的龙芯3A6000桌面CPU,形成了龙芯在桌面、服务器和终端三条线路产品的完整系列,能够为不同领域提供高性能及高性价比的CPU芯片产品。

胡伟武在发布会上宣布:“以龙芯3A6000、龙芯3C6000、龙芯2K3000为代表的龙芯‘三剑客性价比是龙芯上一代产品的3倍以上,具有开放市场的性价比竞争力。”

那么龙芯“三剑客”性价比之所以能够得到这么大的提升的关键在哪里呢?

胡伟武指出,经过从2001年以来二十多年的持续努力,龙芯CPU开始从自力更生到自力更省(成本)、自力更生到自力更高(性能)、自力更生到自力更好(生态)的转变。

具体来说,在成本方面,相同工艺下,3A6000相比3A5000硅面积减少了20%,3C6000比3C5000也缩小了20%,硅片面积的大幅减少则意味着制造成本的大幅降低;在性能方面,相同工艺下,3A6000相比3A5000性能成倍提高,3C6000相比3C5000性能也有成倍的提高。


3A6000/3C6000之所以能够在同等工艺下,实现相比上代更高的性能和更低的成本的关键则在于前面提到的龙芯自主设计的微架构的提升。此外,软件生态方面的持续建设和优化也是一个重要的助力。


对此,龙芯不仅自研了一系列的软件,同时也与国产操作系统和应用软件厂商合作来共建生态。与此同时,龙芯还通过增加对于二进制翻译指令的支持,通过二进制翻译运行X86应用。



基于此,龙架构的桌面Linux软件生态在打印机驱动、浏览器插件等方面形成了独有的自主特色,在基于Linux桌面系统的包括国家大剧院的票务系统国产化等项目中,只有龙架构处理器满足兼容性和应用要求。


要将自主进行到底

“在以计算机为代表的信息产业里,CPU非常引人注目,指令集是CPU里边的根技术。应该说过去我们的指令级长期依赖国外授权,是典型的‘卡脖子’短板问题。”工业和信息化部电子信息司副司长史惠康在致辞当中指出:“国内很多优秀的企业为解决指令集问题,有的引进消化吸收,有的掌握精髓以后自主创新,有的在积极参与开源开放。……但不管是哪条路径,要想解决问题,最重要的一条就是要坚持自主创新的信念。龙芯公司是这方面的优秀代表,在自主创新的道路上信念坚定、不懈追求。”

目前,全球信息产业主要构建在美西方主导的x86体系和Arm体系之上。2024年我国规上工业企业利润率5.4%,其中电子工业利润仅4.0%,即2024年我国电子工业利润总额6408亿元,这甚至低于苹果公司2024年的利润高达937亿美元,约合人民6715.6亿元。这也足见我国电子工业利润之低。在胡伟武看来,这一切的根源在于缺乏自主的指令集体系和生态。

胡伟武在《今日长缨在手》主题报告中指出,指令集系统是信息产业最主要的根技术,虽然IP和制程工艺都是根,但是指令系统是主根。因为,指令集系统是计算机软硬件之间的语言,计算机硬件只认指令集系统,目前我国信息产业主要CPU、操作系统、应用,都是基于x86和Arm这两种指令语言写出来的。中国人可以用英文写文章,但不可能用英文发展民族文化。同样我们可以用国外的指令系统做产品,但不可能基于国外的指令系统做自己的信息技术体系,而且指令系统拥有者还决定产业的商业模式和产业结构。

“我国信息产业的根本出路在于构建独立于x86和Arm体系之外的第三套生态体系。因此,龙芯中科坚持自力更生、将自主进行到底,从基于自主IP的芯片研发、基于自主工艺的芯片生产、基于自主指令系统的软件生态三方面打牢自主信息技术体系底座。龙芯是国内唯一一个坚持三自主路线的CPU企业。”胡伟武说道。

据介绍,龙芯中科自成立以来,经过多年积累,自主研发了很多IP核,包括CPU、GPU、密码IP、高速接口、内存接口、音视频接口、其他接口IP,龙芯的绝大多数的IP都是自己做,不买第三方IP,这是龙芯的基因。在此基础之上,从2023年龙芯中科提自主的龙架构指令系统,经过了三年的时间,目前已经建成了与X86、Arm并列的Linux基础软件体系,成为国际开源社区最活跃的四大指令系统之一。

“我们的目标构建第三套信息技术体系,改造中国和世界的信息化格局,形成与X86、Arm三足鼎立的信息技术体系。基于自主指令系统构,建自主可控的信息技术体系和产业生态是一条不容易走通的路,但是走通后前途最光明,对国家和人民的好处最大。”胡伟武最后总结说道。

编辑:芯智讯-浪客剑


相关推荐
x