点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
倪光南(中国工程院)
中国工程院院士,中国科学院计算技术研究所研究员。一直从事计算机及其应用的研究与开发,参与研制中国自行设计的第一台电子管计算机(119机),20世纪六、七十年代开展汉字处理和字符识别研究,首创在汉字输入中应用联想功能。联想集团首任总工程师,主持研发联想式汉卡和微机,分别于1988年和1992年获得国家科技进步一等奖。2011年获得中国中文信息学会终身成就奖;2015年获得中国计算机学会终身成就奖。
计算、存储、网络技术都是信息领域的关键核心技术,是建设科技强国的战略支撑。当前,随着人工智能、物联网等新一代信息技术在新一轮科技革命和产业变革中蓬勃兴起,数据已成为数字经济时代的核心资源和生产要素,算力开始成为科技强国重要的基础设施,成为人工智能时代科技发展和全球数字经济竞争的高地。
算力主要体现为数据的处理能力。这里我们提出广义算力的概念,广义算力是由算力、存力和运力(即信息计算力、数据存储力和网络运载力)三者融合而成,构成了支撑数字经济发展的引擎。
根据国际权威数据分析研究机构IDC预测,从2018年到2025年,全球数据量将从33ZB增至175ZB,其中,我国的数据量将从7.6ZB增至48.6ZB,跃居为全球第一。正是在这种大背景下,我们在建设信息技术基础设施中,要高度重视未来算力、存力和运力为支撑的数据基础设施底座建设。
所谓存力,是以数据存储为核心,包含性能表现、安全可靠、绿色低碳在内的综合数据存储服务能力,是激活数据要素的核心动能。存储历来是一个高度垄断性的行业。从全球市场份额来看,DRAM市场是三星、美光、海力士的三分天下,闪存(NAND Flash)市场被三星、铠侠、西部数据、美光、海力士五家所瓜分。由此可见,今后中国数据存储产业必须打破外国跨国公司的垄断,才能争得自己的一席之地。
近日,工信部、中央网信办、教育部、国家卫健委、中国人民银行、国务院国资委等六部门发表《算力基础设施高质量发展行动计划》(《计划》)。《计划》认为:算力基础设施是新型信息基础设施的重要组成部分,呈现多元泛在、智能敏捷、安全可靠、绿色低碳等特征,对于助推产业转型升级、赋能科技创新进步、满足人民美好生活需要和实现社会高效能治理具有重要意义。
《计划》要求加强计算、网络、存储和应用协同创新,推进算力基础设施高质量发展,充分发挥算力对数字经济的驱动作用。本文着重分析广义算力——算力、运力、存力中,存力的高质量发展问题,这正是当前中国半导体产业发展的一个重大机遇和挑战。
AI大模型现正走向千行万业,据估计未来2年将落地50%+的行业场景。当前,生成式AI正在从基础大模型发展到行业模型,并将深入到无数应用场景。显然,在不同层面上,对算力的要求是不同的,例如AI在行业和应用场景层面上方面,更多的需求是推理,如何提升推理效率至关重要。
实际上,目前大模型的发展已使算力供不应求。如按目前生成式AI对算力和内存的需求推算,算力和内存的增长倍数将需要分别达到750倍/2年和450倍/2年的巨大数目,这显然是难以达到的,应当另辟蹊径。
近期有研究发现,知识库加持大模型可以显著提升模型参数的效果,例如采用60亿参数的GPT模型 + 知识检索后,其准确性可超过1750亿参数的GPT3模型。人们看到,AI行业巨头如微软、AWS、Google等等,都纷纷推出了RAG(知识检索增强生成)方案,减轻了生成式AI对算力和内存的压力。
采用这种方案,用户向AI提出的问题将首先转为问题查询(有一个“小模型”就可支持),如果搜索命中,问题就解决返回了,如果未命中则继续查询,针对模型构建提示并通过推理返回答案(这可能需有较大模型的支持)。上述基于小模型+知识库,运用RAG辅助的AI生成技术,可望大幅降低AI在行业和场景推理应用方面的算力消耗,是值得关注的动向。
综上所述,根据中国数据存储产业的现状及发展趋势,特提出以下建议供作参考;
第一、均衡配置“算力”与“存力”,克服当前算力建设中“重算力轻存力”的倾向。
当前随着人工智能的突飞猛进,我国各地兴起了AI算力中心建设热潮,旨在为AIGC提供强大算力。不过人们往往将算力简单地理解为“计算力”,而实际上真正的算力或称之为“广义算力”,应由三部分组成:即算力、存力和运力。为取得最大的经济社会效益,三者应当均衡配置,不能偏废失调。
第二、提高“存力”中先进存力的比重,适时启动以固态硬盘SSD取代机械硬盘HDD的存储革命。
我国数据存储产业存在对新兴先进数据存储技术支持不足。迄今为止,机械硬盘HDD占据了我国存储领域近80%的存量市场,可是我国HDD产业却接近空白,早期没有布局,该市场一直被美国希捷/西部数据、日本东芝三家厂商所垄断,这意味着我们存在着严重的“卡脖子”风险。鉴于我国HDD产业基础差,再加上目前HDD技术本身已经落后,并逐步走向衰弱的事实,我国应尽快转向先进的半导体存储技术,尽快从国家战略层面在半导体存储领域启动以“固态硬盘SSD全面取代机械硬盘HDD的计划”。目前SSD在性能、效率、节能、可靠性等等方面已全面超越HDD,即使在价格方面,预计到2026年左右,SSD在价格方面也将优于HDD。为避免科技强国建设中存储技术再次受制于人的风险,应当急起直追。
第三、我国数据存储产业已基本具备国际竞争力,通过双循环拉动有望成为中国的又一出海新名片。
在多年自主创新的基础上,我国新型半导体存储产业取得了重大发展,基本上达到了自立自强的要求。这一产业链的上游包含NAND Flash(SSD颗粒)、SSD主控芯片和DRAM(内存),中游包含存储整机和存储系统,下游为应用与服务。
在产业链上游,长江存储的NAND Flash和长鑫存储的DRAM芯片已经达到全球主流的水平和生产能力;在SSD主控芯片方面,国内已经有十几家厂商的产品得到商用,产品能力与国外主流厂商持平。应当指出,生产NAND Flash存储芯片的核心设备是刻蚀机,中微公司的刻蚀机已经突破5nm工艺,达到国际领先水平。生产SSD主控芯片和DRAM的光刻机工艺为12~28nm,都不需要用到EUV光刻机,所以其芯片生产和装备基本上不会被卡脖子。
在产业链中游,我国存储整机的核心能力和竞争力构筑在自主的核心存储芯片、系统架构和软件之上,也已具备国际领先技术水平。例如华为数据存储在2022年全球存储市场排名第二(仅次于DellEMC)并进入国外金融等关键行业市场,成为国际头部存储整机厂商。由此可见,我国新型存储技术和产业在实现国产化的情况下已经具备了国际竞争力,今后如能通过国家政策引导、政府扶持,双循环拉动,能将产业迅速扩展规模,提升性价比和营销服务能力,有望成为IT领域的新型“5G”产业,成为中国出海的又一新名片。
为了不失时机地推进中国存储产业的发展,兹提出以下几点意见供作参考:
1、产业发展,标准先行。切实贯彻落实《计划》,为推进算力中心的高质量发展,确立“算力”与“存力”的适当比率,在“存力”中采用SSD先进存力的适当比率,达到算力、存力、运力的均衡部署,均衡发展。
2、政策引导,力推SSD取代HDD。在算力中心等的存储设备采购、招标等等中,应优先支持SSD,不得以单一价格指标作为评标依据;重要基础设施的存储设备,应引导或指定采用国产SSD,促进国产SSD替代进口HDD的存储技术变革。
3、安全测评,公平公正。美光未通过中国政府对其的安全审查,为国产数据存储产业发展提供发展窗口期。存储领域应以此为契机,重视对存储产品的安全审查,包括供应链安全、信息安全、数据安全等等。尤其是对于存储整机、主控芯片、存储文件系统等等关键核心技术,建议参照信创工作经验,实施“自主可控测评”,根据第三方测评机构给出的自主可控测评分值作为选择依据。
4、千秋大业,人才为先。重视高校存储产业人才培养。存储产业为技术密集型产业,产品研发需要大量具有存储技术研发能力的人才,目前国内仅有10+高校开展存储领域研究,领军教授10+,博士队伍100+,硕士不足300人。这与中国整个存储产业和应用市场显然是不匹配的,急需在高校增设存储专业、课程、实验室等,扩大存储人才培养规模,并从收入、激励机制、基本公共服务等多角度订立新的人才政策,吸引并聚集国内外优秀人才。
5、集聚产业,协同攻关。建议在国家科技攻关计划和相关产业链中设立存储专项,组织国内产学研用各界联合攻关,实现全产业链风险可控;成立存储国家实验室、国家级科创平台等,开展前沿技术研究,形成原创性成果,提升国产存储全球技术竞争力。
综上所述,鉴于数据存储在现代科技中的重要地位,我国应抓住中国数据存储业面临的重大机遇和挑战,尽快实现关键核心技术攻关,用好国内超大规模市场优势迅速形成产业规模,为数字中国建设保驾护航。
倪光南院士
(来源:“2023网络安全创新发展大会”发言整理)