继AI芯片之后,DPU(数据处理器)成为半导体新热点。
全球芯片巨头的英伟达、英特尔相继走到了尽头,国内涌现出了中科玉树、鲍云智能、大禹智信、云脉新联、星运智联、边缘智信等一系列创业公司。下游云计算龙头AWS、阿里巴巴云等厂商已经布局DPU产业,迎来百家争鸣期。
12月21日,中科玉树宣布完成数亿元的A系列融资,由迈星投资和昆仑资本共同牵头。这是继7月底完成A轮融资后,公司今年获得的第二笔数亿元融资。5月成立的云脉核心联盟,10月获得IDG、字节跳动、碧筠科技的投资。
DPU也在搅动二级市场。21日,左江科技回复投资者称,公司自主研发的可编程网络安全处理芯片在功能定义和架构设计上满足DPU相关特性要求后,股价连续三日上涨。
国内DPU厂商在这个全新的舞台上有多少机会?谁能脱颖而出?
下一个黄金赛道?
在数据中心时代,CPU的主导地位将一去不复返。
DPU被认为是继CPU、GPU之后的第三大芯片,负责“CPU做不好,GPU做不好”的数据任务。在NVIDIA等厂商的包围下,英特尔在数据中心的市场将继续被蚕食。
DPU的概念最早是由硅谷初创公司“可替代”提出的。在英伟达收购了网络解决方案制造商Mellanox,并将其重新包装以定义DPU之后,它成为了热门。目前市场还处于发展初期,各厂商的定义不一。DPU的主流定义是由NVIDIA提出的,即DPU是一个将数据中心基础设施集成在一个芯片中的通用处理器。
赛迪咨询发布的《2021中国DPU行业发展白皮书》将DPU方案分为三种:一是基于通用众核处理器,以多核ARM为核心,被他人制胜,具有更好的可编程灵活性,但应用针对性不够,对特殊算法和应用的支持相比通用CPU没有明显优势;第二,基于专用核的异构核阵列针对性强,性能好,但牺牲了一定的灵活性。第三条路线结合了前两条的优点,即将通用处理器的可编程灵活性与专用加速引擎相结合,正在成为最新的产品趋势。
目前由于DPU的理念和技术标准不统一,各家基于自身优势输出相应的解决方案,形成百家争鸣的竞争格局。
一方面,英伟达、英特尔、Marvell、博通等全球芯片龙头积极布局,制定自己的标准;另一方面,许多创业公司加入了这片蓝色的海洋。与此同时,包括AWS和阿里巴巴云在内的主要云服务提供商正在布局自己的数据处理器。
据CBN报道,全球最大的云服务提供商AWS采用了基于Arm内核的解决方案。2015年,AWS收购了安纳普尔纳
Labs,是一家为超大规模数据中心和边缘计算设计基于Arm的芯片的制造商;2017年,AWS正式推出Nitro,将网络、存储和安全任务卸载到基于Arm架构的特殊设备上。
还有阿里巴巴云提出的X
MOC卡是Dragon系统架构的核心,采用FPGA CPU的形式。据业内人士透露,微软早期采用的是纯FPGA解决方案,现在正在转向FPGA CPU。
除了自研,云厂商还通过投资等方式寻求合适的解决方案。比如腾讯投资云豹智能,字节跳动投资云脉新联。
大宇智信CEO李爽告诉CBN,目前DPU市场主流的解决方案包括基于Arm的架构、FPGA CPU架构和SoC架构。前两者已经被云计算厂商批量部署,整体的SoC解决方案是未来的趋势。“我们自己的产品线也是基于此。与第一代Arm内核相比,CPU方案的接口丰富度和处理性能要好得多,但FPGA的功耗更高,价格也更高。同时,我们的SoC项目已经启动。”
途宝研究院预测,全球DPU市场
赛迪咨询的数据更乐观。该机构预测,全球DPU市场将在2023-2024年出现爆发式增长,中国将在2022-2023年先于全球市场出现爆发式增长。预计到2025年,全球DPU产业市场规模将超过245.3亿美元,中国DPU产业市场规模将超过565.9亿元人民币。
有业内人士认为,DPU的数量将与服务器数量持平,每台服务器需要一台甚至更多的DPU产品。
DPU的产生源于应用驱动。摩尔定律的放缓使得一般CPU性能的边际成本快速增加。中科玉树CEO颜桂海表示,2010年之前,网络带宽每年增长30%左右,近几年达到45%;而CPU的性能增长从10年前的23%下降到了近几年的3%。当网络带宽增长率与CPU性能增长率之比达到10倍时,CPU很难直接应对网络带宽增长率。
“这个时代的核心变化是CPU性能的提升跟不上数据生成的速度。2018年之前,如果我买一个24核的CPU,有2个核心处理流量,22个核心处理上层应用。2018年后,流量迅速增加,需要16个内核处理流量,处理其他任务只需要8个内核,几乎有2/3被废除。”边缘智信总建筑师李福告诉CBN。
在大型数据中心,流量处理占计算资源的30%,而AWS还没有向行业发货。
务程序,先接入网络数据就要占去的计算资源称为“数据中心税(Datacenter
Tax)”。
DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池化等基础设施层服务,从而释放宝贵的CPU资源来运行上层应用,实现了以数据为中心的业务和基础设施操作的分离。
芯片巨头 争霸
2020年10月,在收购Mellanox后,英伟达发布了首款DPU产品――BlueField2系列。英伟达创始人兼CEO黄仁勋表示:“现代超大规模云正在推动数据中心的新架构。需要一种旨在处理数据中心基础设施软件的新型处理器来卸载和加速虚拟化、网络、存储、安全和其它云原生AI服务的巨大计算负载。BlueField
DPU的时代已经到来。”
英伟达规划了多代产品,计划在2022年推出性能更强的BlueField3,2024年推出集成其GPU模块的BlueField4。
从战略上,英伟达收购Mellanox推出DPU,并试图收购Arm,加上其传统强项GPU,将侵蚀英特尔的市场份额,直接威胁后者在数据中心的霸主地位。
股市上的表现更加直接。2020年7月,英伟达市值超过英特尔,成为全球第三大半导体企业;一年多后的今天,英伟达成为全球市值最高的半导体企业。截至北京时间12月28日,英伟达市值7736亿美元,几乎是英特尔(市值2112亿美元)的4倍。
不过,英伟达是否能成功复制GPU的成功仍有待观察。多位业内人士告诉第一财经,此前Mellanox产品在云服务厂商的认可度并不高,“它的劣势是它确实不太懂(云),包括客户对它产品的测试和设计都有吐槽。在Mellanox尚未被收购前,我们有测过很多功能,一些功能的改变也是我们提的。”
不少人认为,英伟达对DPU市场的教育和推动概念的作用要大于其产品的实际应用。
在英伟达的步步紧逼下,英特尔自然也不甘落后。2021年6月,英特尔发布了IPU(Infrastructure Processing
Unit,基础设施处理器),对标英伟达的DPU,并推出了基于FPGA和ASIC的两种方案。
英特尔公司数据平台事业部首席技术官Guido
Appenzeller介绍称,在美国和中国,六大云服务厂商目前使用基于FPGA的IPU。“随着带宽变高,我们看到他们缓慢地转向专用ASIC
IPU。因为存在很多专利协议,所以不会发生快速转变。”
通过使用IPU,可以从服务器卸载与运行基础设施任务相关的开销。云服务厂商的软件在IPU本身上运行,而租户的应用程序在服务器CPU上运行。这不仅释放了服务器上的资源,同时优化了整体性能,而且为云厂商提供了一个单独且安全的控制点。
值得一提的是,ASIC版本IPU采用的CPU核是ARM架构,而非英特尔自身的X86架构,这意味着英特尔的话语权正在减弱,为了迎合客户需求选用了竞争对手的架构。
第一财经了解到,英特尔ASIC版本IPU主要与谷歌合作,谷歌提出相应需求,英特尔为其“定制”。
李甫认为,IPU侧重多个CPU的管理,努力融合IaaS模块,降低集群管理成本,更多像是一个协处理器。“类似在CPU中的大小核,变成了双路服务器中的双路大小CPU架构。为了应对不同客户需求,英特尔可能会采用FPGA
+小CPU +大CPU的超异构计算模型,复杂化DPU/IPU市场。我们推出基于PCIe
Switch总线交换技术的XPU芯片,正是为了这种超异构计算架构准备的通用数据分发芯片。”
除此之外,赛灵思、Marvell、博通等老牌芯片厂商也都在推出针对数据中心的解决方案。
国内创业公司遍地开花
国内初创企业也陆续推出相应的解决方案。中科驭数自主研发KPU芯片架构,落地于金融计算、数据中心、云原生、5G边缘计算等场景。该公司正在研发的第二代DPU芯片K2已经完成设计和验证工作,预计将于2022年第一季度投产流片。
12月4日,大禹智芯第一代DPU产品Paratus
V1.0正式亮相。根据该公司规划,2021年,大禹智芯完成第一代产品的研发、客户测试和商业化交付;2021年年底,第二代产品即将成功研发,并实现对应商业合同的签署;2021年年底,大禹智芯启动自有芯片(SoC方案)的研发。
12月15日,云豹智能发布全功能云霄DPU网卡,全面支持裸金属、虚拟机和容器服务资源一体化和性能加速,主要基于FPGA方案。据悉,下一代软件定义DPU芯片也正在按计划研发中。
专注PCIe技术栈的边缘智芯则提供了另一种视角,数据从网卡进入其设计的XPU后,分发给CPU、GPU、SSD。按其架构,在XPU为中心的架构中,网卡无需智能,只需要提供基本的网络协议功能即可,适用于低成本、低延迟的应用场景。
与CPU和GPU不同,DPU目前在技术标准和生态方面都处于早期阶段,并未出现绝对的领先者。接受采访的多位业内人士认为,中国具备丰富的数据资产,有强大的互联网产业,在这一赛道中,中国芯片厂商或许有望脱颖而出。