说起半导体行业面临的难题,人们第一时间想到的是什么?是光刻机?是5nm?是一块方方正正的芯片,我们造不出来?
是,但也不完全是。
人们往往将芯片半导体划分为硬件产业,但事实上,这是一个高度软硬件集成的产业——软件甚至更多时候占了大头。
所以,即便我们在20年前就研发出了CPU,现在仍会面对如此局面。同样,如今更受人关注的GPU产业也遇到了同样困局,因为我们面临的真正难题,不是硬件,而是软件。
01. 当我们说芯片困局时,我们在说什么?
芯片的硬件指的是运行指令的物理平台,包括处理器、内存、存储设备等等。芯片数据中常出现的“晶体管数量”、“7nm制程”、“存储”等,往往指的就是硬件参数。
软件则包括固件、驱动程序、操作系统、应用程序、算子、编译器和开发工具、模型优化和部署工具、应用生态等等。这些软件指导硬件如何响应用户指令、处理数据和任务,同时通过特定的算法和策略优化硬件资源的使用。芯片数据中常出现的“x86指令集”、“深度学习算子”、“CUDA平台”等,往往指的就是芯片软件。
没有硬件,软件就无法执行;可没有软件,硬件就只是一堆毫无意义的硅片。
以英伟达的CUDA平台为例。
2012年,随着深度学习+GPU的组合在ImageNet大赛上一炮打响,人工智能一夜之间火遍全球,全球科技界都将目光转向了这一领域。多年深耕CUDA人工智能计算平台的英伟达股价自然是一路走红,成为了新时代的霸主。
软件,成为了人工智能时代的核心技术壁垒。
为了打破英伟达一家独大的局面,前任全球芯片老大英特尔和多年老对手AMD对标CUDA都分别推出了OneAPI和ROCm,Linux基金会更是联合英特尔、谷歌、高通、ARM、三星等公司联合成立了民间号称“反CUDA联盟”的UXL基金会,以开发全新的开源软件套件,让AI开发者能够在基金会成员的任何芯片上进行编程,试图让其取代CUDA,成为AI开发者的首选开发平台。
反过来,英伟达也在不断深挖CUDA的护城河。
早在2021年,英伟达就曾公开表示过“禁止使用转换层在其他硬件平台上运行基于CUDA的软件”,2024年3月,英伟达更是将其升级为“CUDA禁令”,直接添加在了CUDA的最终用户许可协议中,已禁止用转译层在其他GPU上运行CUDA软件
对于中国用户而言,这一禁令的打击面要更大。
早在2022年,英伟达就已被要求对中国市场断供高端GPU芯片,死死地卡住中国GPU芯片购买渠道。
如今连在其他芯片上运行CUDA软件都被英伟达禁止了,中国人工智能公司们,怎么办?
02. 国内AI芯片全面崛起
其实,在这条禁令下发之前很久,中国芯片公司们就已经有所准备了。
2015年,国内人工智能产业如火如荼,“AI四小龙”崛起,连带着整个产业步入发展快车道。
在这波由CNN(卷积神经网络)技术引领的人工智能行业热潮之中,就有大量中国企业看到了打造国内AI芯片的重要性。
在此期间,国内陆续涌现出了近百家国内AI芯片公司,其中既有如寒武纪、地平线、壁仞科技、后摩智能等的明星创业公司,也有如华为、阿里、百度等的科技巨头,还有传统芯片厂商与矿机厂商。
各家纷纷入局,产业如烈火烹油、鲜花着锦,大家的共同目标只有一个,打造自主可控的国内AI芯片生态。
国内AI芯片玩家们早早就意识到了软件、工具、生态对于芯片的重要性,因此在不断升级迭代硬件产品之余,也投入了大量的时间、精力,试图解决软件生态建设中存在的问题。
CUDA是一个封闭的软件平台,因此,从底层开始打造原创的软件栈是打破CUDA生态壁垒的关键路线。