天数智芯首席科学家 郑金山
2020年8月4日,国务院公布《新时期促进集成电路产业和软件产业高质量发展的若干政策》,开篇指出,集成电路产业和软件产业是信息产业的核心,是引领新一轮科技革命和产业变革的关键力量。2020年的国际环境,让全社会越来越认识到中国集成电路和软件产业的薄弱,越来越坚定要把集成电路和软件产业搞上去的决心。
今天,我们来谈一谈GPGPU市场。
纵观整个IT系统,从CPU、操作系统、办公套件、整机到服务器,我们都已经初步具有一些商用化的可替代产品。唯独在GPGPU领域,目前还是一片空白。如下图所示:
GPGPU是什么
GPGPU全称是通用图形处理器(General-Purpose computing on Graphics Processing Units)。它是用专门处理图形任务的处理器,执行原本由中央处理器处理(CPU)完成的通用计算任务。这些通用计算常常与图形处理没有任何关系。图形处理器的特点是,并行处理能力特别强,计算能效比高,并且有很大的存储带宽。有些应用,例如人工智能(机器学习)模型训练与推理、高性能计算,它们往往是大数据流应用,这时,用GPGPU解决这类问题就比CPU效率更高。虽然目前机器学习会有迁移到专用硬件的可能,但在编程模型上GPU是图灵完备的,且对于用传统语言编写的、软件形式的计算有较好的支持,具有高度的灵活性。
因此,GPGPU目前广泛应用于高性能计算、行业AI应用、安防与政府项目、互联网及云数据中心等。其主要应用场景:一是人工智能模型训练与推理;二是高性能计算。
根据有关数据预测,到2025年,中国GPGPU芯片板卡的市场规模将达到458亿元,是2019年86亿元的5倍多,2019年到2025年的年复合增长率高达32%。按行业来分,互联网及云数据中心为228亿元,安防与政府数据中心为142亿元,行业AI应用为37亿元,高性能计算为28亿元。按应用场景来分,到2025年的预测数据是,人工智能推理286亿元,人工智能训练144亿元,高性能计算28亿元。
可以看出,GPGPU在中国的未来需求量很大,对国民经济的发展至关重要。
GPGPU国产替代的市场呼唤
一般人对GPGPU没有什么概念。某头部供应商的一块高端GPGPU板卡,其售价接近一辆普通轿车的价格。
当前,人工智能应用的闸门打开了,很多企业、研究机构、研究者希望利用人工智能。首先是要做的是人工智能训练,根据现有数据,反复训练,得出一个模型。将这个模型部署到业务应用中,当对这个模型输入一个新的数据时,根据模型计算出一个结果,这一过程称为人工智能推理。例如,一个游戏网站接收到一个新用户注册,它想判断这个用户是正常用户,还是竞争对手注册进来拉人的恶意用户。它就可以利用过去大量的用户行为数据,训练出一个人工智能模型。这个模型能够计算出,什么样的用户行为就有可能是恶意用户,从而自动地对这些用户限制权限,或者交给人工客服来处理。类似的应用特别多,可以训练机器做很多以前由人工来完成的事情,例如,安防领域的视频分析,媒体领域的内容生产、字幕生成、内容审核、分类与标签,医疗健康领域的药物发现与探索、医学影像自动识别、辅助医疗、自动诊疗,电商领域的个性化推荐、信用评级,金融交易领域的交易算法、服务管理与推荐、潜在用户挖掘,客服领域的语音服务、聊天机器人、呼叫中心优化,等等。
高性能计算则是国之重器,计算机学科中的明珠,广泛应用于勘探、天气、海洋、气候变化、核能、发动机、航空航天等领域。
面对日益增长的需求来说,GPGPU的供应是没有很好地满足的。当前,全球GPGPU市场供应处于一家独大的局面,价格昂贵,产品种类单一。以中国的云端AI训练芯片市场为例,最大的供应商市场份额达到90%,其中,某一款产品就占整个市场的50%,另一款产品占25%。
这样的局面虽然源自该供应商的技术和实力,但是客户还是需要更多的选择。例如在2017年,因为人工智能训练和数字货币挖矿的需求猛增,GPGPU供不应求,价格高涨,一部分用户尝试将原本用作独立显卡的消费级GPGPU,替代用于数据中心,但是被供应商在软件驱动上禁用,当时引起一阵热议。
从国家的供应链安全角度,这两年,一些重要的企业和机构陆续被美国列入禁售实体名单。这些用户除了国产替代,别无选择。
GPGPU国产替代如何突围
看到这里,很多人一定会问。第一位的供应商占据90%的市场,这个市场一定很难攻下,不然全球有那么多芯片公司,早就有别的公司来制衡了。
一方面,前面分析了目前的国际环境下,我们实现国产替代的必要性和紧迫性。国家也出台了《若干政策》这样的鼓励措施,从财税、投融资、研究开发、进出口、人才培养、知识产权、市场应用、国际合作等多个方面,支持相关的企业发展壮大。另一方面,从技术难度看,GPGPU也不是可望不可及的。改革开放四十多年来,中国有一大批芯片人才,在国际公司积累了深厚的经验。现在恰逢中国经济实力增长、下决心发展半导体产业的良好时机,他们希望抓住这一机遇,一显身手,为中国半导体产业发展做出一份贡献。
天数智芯就是这样一家公司。天数智芯的芯片研发团队于2018年初组建,数十名创始团队主要来自世界知名芯片公司AMD的GPU部门和企业软件翘楚Oracle、IBM、英伟达等公司。完整的芯片设计团队在芯片设计领域平均积累了近十年经验,可以说,这是一支在世界范围内都不可多得的、完善的高端芯片设计队伍。
公司正在积极研发针对云端算力提升的训练及推理芯片。其中,面向人工智能训练的GPGPU芯片计划在今年实现批量生产,2021年初商业化投向市场,这将是国内首款自研的GPGPU芯片;面向人工智能推理的GPGPU芯片也在研发之中。
天数智芯在芯片设计初始,就与服务器厂商合作共同对产品设计进行定义,以实现未来在数据中心中的国产替代。目前,天数智芯已经与浪潮、新华三等服务器厂商签署战略合作,共同推动服务器领域人工智能和HPC的计算芯片及硬件解决方案发展。天数智芯还与国产CPU龙头中科龙芯等密切对接技术及业务合作,打造天数GPGPU+国产CPU的自主可控超算解决方案。
展望未来,我们深知任务艰巨,但我们也有信心、决心和耐力,为国产GPGPU闯出一片天地。也希望有更多的人才、合作伙伴、行业应用单位加入我们的征程。
作者简介:
郑金山,上海天数智芯半导体有限公司首席科学家,拥有21年芯片设计工作经验,曾先后供职于Trident、XGI、ATI Technologies、AMD超微半导体上海有限公司和酷芯微电子(Artosyn),任高级经理、PMTS和架构师等职位。专注于GPU IP设计多年,对GPU架构与设计有深厚的造诣。他建立与带领上海芯片设计团队参与过多个显卡(从Radeon HD2000到R400)芯片的研发与产品化。在酷芯微电子参与了机器视觉芯片9201的研发并成功量产。郑金山1999年毕业于复旦大学ASIC与系统国家重点实验室,获微电子与固体电子学专业硕士学位。