昆仑芯有很多标签:十年研发、100%自研核心架构、工程落地和学术并重,以及大规模落地、用技术创造产业价值。作为一家非常年轻的公司,昆仑芯科技于2021年6月份才刚刚成立,但整个团队的研发历史却不止这一年的时间。
2011年,昆仑芯核心团队就慢慢的开始基于FPGA做人工智能加速,这样的一个过程经过了几年的迭代。2017年,自研的昆仑芯XPU架构已经很成熟,同年在Hot Chips大会上发布。结合当时业务发展状况,以及周围产业环境的变化,昆仑芯团队决定把技术路线从FPGA转向AI芯片。于是,2018年,昆仑芯(当时还叫百度昆仑)项目真正开始启动。从2018年到2021年这三年时间,是昆仑芯AI芯片经过两代的迭代达到量产的过程。2022年6月1日是昆仑芯从百度主体分拆之后,作为一家独立公司的第一个周年。
这一点是昆仑芯在市场上取得领头羊的最核心优势之一。我们从始至终强调技术赋能、产业价值,昆仑芯经过两代芯片万片部署,证明了技术的确可以通过大规模落地和验证,以及这个工程化的经验积累,切切实实地服务于国计民生和千行百业。
芯片本质不是硬件产品,而是软件产品,或者更确切来说是一个软硬结合的产品。昆仑芯团队一直有非常均衡的软硬件团队,而且在工程落地之外也有非常深厚的技术积累和学术积累。稳定的团队、全面的技术也是推动昆仑芯实现大规模落地、赋能产业的一个很重要的业务基础。
昆仑芯来自于百度,这在某种程度上预示着团队是来自于场景。AI发展非常快,而且整个应用场景千变万化,场景很复杂。昆仑芯团队在十年之前就在真实的业务场景中开始做人工智能加速。深刻的场景理解,全方位的产品视角,是昆仑芯团队来自于互联网场景的这个基因,也是跟其他团队很大的区别。
昆仑芯这款芯片的设计从一开始在核心架构上便是100%自研,也体现了前三点的理念,都深深地刻在了昆仑芯的基因里面,也被深刻地融合到了自研的昆仑芯XPU架构中去。
同时,软硬协同也是非常很重要的。我们来自于百度、来自于顶尖网络公司的团队,具备非常强的软件水准。在此基础上,软硬结合在非常大的程度上实现了我们芯片设计的跨层优化,也增强了技术壁垒。
这三点其实不完全是从技术视角出发,更多的还是站在产业的视角。如果想让计算这个新的经济下的水、电、煤赋能千行百业、到社会经济的毛孔中去,计算本身一定要具备更快、更强、更省的特征,才能真真正正地被产业用起来。就使命来讲,有了更快、更强、更省的算力,就可以让计算更智能、让产业更智能、让整个经济发展更智能。
昆仑芯此公司其实比较年轻,今年六月一号儿童节一周年。公司虽然年轻,但愿景却很宏伟,我们大家都希望“成为划时代、全球领先的智能计算公司”。计算有不同的周期、各个时代,AI是一个新的时代。我们大家都希望在AI时代占有一席之地、获得领军地位。
CEO欧阳剑,曾是百度首席架构师。昆仑芯的十年研发,从2011年开始,跟AI加速相关的一系列研发项目,包括技术和研发都是由欧阳剑来领衔的。以欧阳剑为首的整个团队均经历了一线业务场景历练,能够全方位理解客户的真实需求特征,具备非常雄厚的研发实力。500)this.width=500 align=center hspace=10 vspace=10 rel=nofollow/>
昆仑芯科技CEO 欧阳剑
昆仑芯团队作为从网络公司出来的一个工业界团队,在学术界也一直有非常大的影响力,能够说是著作等身。
昆仑芯团队有非常顶尖的学术水平,发表了国内工业界首篇在国际计算机系统及体系结构的论文,另外在Hot Chips上有四篇论文。Hot Chips是级别非常高的国际议会,昆仑芯团队应该是AI芯片领域在Hot Chips上发文最多的。
昆仑芯目前的两代产品,均获得了中国芯“优秀技术创新产品奖”。这是业界对昆仑芯非常大的认可。
昆仑芯作为中国芯在科学技术创新方面非常关注。昆仑芯有比较完整的国产化解决方案,通过端到端的整个国产化、从硬件到软件,包括在上层应用和相关软件配套的技术体系下,推动了国产人工智能有关技术的应用落地。过程中也受到了各界的关注。
去年十月份国家举办“十三五”科学技术创新成就展,这是国家层面该领域内顶配水平的科技成就展览。昆仑芯亮相并成为中国企业AI技术自主创新的有力注脚。同年,昆仑芯也亮相中关村论坛,成为了科学技术创新的代表。
面向未来,我们已启动昆仑芯3代的研发。昆仑芯2代采用了7nm的制程,昆仑芯3代计划采用4nm制程,这也是一个非常先进的纳米制程。昆仑芯的全部的产品都是希望可以立足中国,放眼世界,从技术上达到先进水平。
500)this.width=500 align=center hspace=10 vspace=10 rel=nofollow/>
昆仑芯2代芯片采用7nm制程,也是当前业界能够稳定量产的、比较大型的云端AI芯片最先进的纳米制程。同时也搭载了第二代的昆仑芯架构XPU-R架构,保持了整个技术的独创性、创新性和先进性。除了计算的技术指标,昆仑芯2代在产品设计上也在通用计算能力、硬件虚拟化以及高性能分布系统这样一些方面有自己的独特技术创新。
软件算法和应用开发者在构建业务的过程中,其实是需要一套很成熟的编程语言和比较完善的工具链或叫工具集来快速迭代和开发任务的。昆仑芯的软件架构本身是有很完善的软件架构设计和模块。另外向上、向下有很多延伸的可能性。
向上,昆仑芯跟百度飞桨很有深入的合作,同时也支持国际主流的其他框架,比如PyTorch、TensorFlow、ONNX,生态完备。向下,昆仑芯AI加速卡在公有云、私有云和不同的IDC环境里面,包括边缘,都可以做比较灵活的部署。
500)this.width=500 align=center hspace=10 vspace=10 rel=nofollow/>
经过昆仑芯对芯片架构、指令集,包括软硬件等等各种核心技术的联合优化,昆仑芯的通用性和性能已达到了非常高的水平。目前昆仑芯2代的推理板卡R200跟业界主流150W的GPU相比能达到平均1.5到2倍的性能提升。这在实际的业务应用和场景中为客户切切实实地实现了降本增效,促进了产业的发展。
500)this.width=500 align=center hspace=10 vspace=10 rel=nofollow/>
互联网:昆仑芯在百度的核心业务,比如搜索、小度等业务场景实现了两万片的规模落地。尤其大家每天在使用的,无论是pc端还是手机端,或者百度APP中的搜索功能,背后的算力支撑来自大量昆仑芯AI芯片,实际做到了服务千家万户。百度搜索是国民级的产品,它每天对于背后的IT基础架构、IT基础设施要求非常高,从实时性、稳定性到鲁棒性都有很严格的要求。目前,昆仑芯是业界唯一一款经过了互联网大规模核心算法淬炼的国产人工智能芯片。
智慧城市:昆仑芯在多个城市的城市大脑或智慧城市相关的案例中均有落地。举个例子,昆仑芯AI芯片被应用于宜昌的城市大脑中,在宜昌当地的禁渔环保和安全方面,通过算力的形式贡献了自己的力量。
生物计算:这是一个非常新兴的场景,尤其是最近一段时间的AI for science,包括AI生物计算或者通用AI制药等,都是新兴的浪潮。昆仑芯XPU架构有非常灵活的设计,这使得这款产品不仅仅可以计算典型的AI场景的算法,也可以有非常好的扩展性。昆仑芯结合自己的硬件特征,在生物计算上有所探索,包括蛋白质结构、基因检测,目前都取得了很明显的研发进展。
智慧工业:智慧工业有各种各样的场景,包括质检、互联、巡查等一系列的工业落地场景,昆仑芯也有很丰富的落地经验。以工业质检为例,昆仑芯的落地案例中,投资回报率实现了传统机型的6.5倍,也切切实实地在工业4.0智能化转型的过程中,为工厂和当地的公司实现了降本增效。
除此之外,智慧金融、智慧交通、智算中心、智慧应急以及这样一些方面的组合也都有相关案例。
回顾昆仑芯的落地场景和技术研发,能够正常的看到,昆仑芯的出发点是希望技术能够创造产业价值,在各个落地案例中通过技术降本增效,实现国产化的自主创新,打造 “中国芯”。