艾可萨科技 朱荣臻 | 宇航存储新纪元:关于“宇航级”SSD的三级体系思考
本期作者为艾可萨科技创始人朱荣臻,为大家分享:《宇航存储新纪元:关于“宇航级”SSD的三级体系思考》。随着全球进入以商业化和规模化为特征的“新航天”时代,从低轨卫星星座的爆发式增长,到国家主导的深空探测任务,对数据存储的需求正变得空前复杂。然而,在航天存储领域的发展过程中,一个现象始终困扰着整个行业:对于“宇航级”标准的定义模糊,特别是针对SSD这类复杂模组,缺乏统一的鉴定规范。这种标准的缺失,不仅制约了技术的健康发展,也可能导致市场出现“劣币驱逐良币”的乱象。因此,现在是时候正本清源,推动行业共识了。本文基于航天存储领域的技术积淀与在轨实践,对宇航级SSD的现状、挑战以及未来发展路径进行系统性思考。(一)“宇航级”的真正含义
在航天产业的传统语境中,“宇航级”是电子元器件可靠性的最高等级,代表着对极端环境的终极挑战。其核心目标是确保产品在太空超高可靠、超长寿命地运行。严格意义上,“宇航级”是针对元器件的等级认证,而非模组。一个“宇航级”的模组或单机,其定义必然是:一个集成了多个“宇航级”或同等高等级元器件,且其整个设计、制造、测试流程均遵循严苛宇航标准的子系统。其核心要求可量化为以下几个维度,宇航级核心要求与量化标准(以电子元器件为例):工作温度: 通常要求在-55℃至+125℃范围内稳定工作,以应对太空近300℃的巨大温差。抗辐射能力: 必须能抵御宇宙射线、高能粒子等空间辐射,防止单粒子效应(SEE)和总剂量效应(TID)导致的性能异常或永久性损毁。需采用专门的抗辐射设计与加固工艺,并通过MIL-STD-883等标准测试。可靠性与寿命:例如设计寿命通常要求在20年以上,追求极低的失效率(FIT)和近乎零故障的容忍度。环境适应性: 需通过振动、冲击、热循环等严苛的环境试验,确保在发射和在轨环境下的稳定性。(二)模组级鉴定标准的重要性
然而,现实情况是,针对SSD这类复杂模组的“宇航级”鉴定标准几乎是空白的。这种标准缺失带来的问题是多方面的:技术发展受限: 缺乏明确的技术指标和测试方法,使得企业在产品开发过程中缺乏明确的目标导向,技术创新难以形成有效积累。市场混乱: 没有统一标准,各家企业对“宇航级”的理解和实现方式千差万别,用户难以进行有效的技术比较和选择。质量参差不齐: 在缺乏权威认证的情况下,市场上可能出现以次充好的现象,影响整个行业的健康发展。宇航级SSD面临的核心挑战在于如何弥合商用器件与太空环境之间的巨大鸿沟。这一挑战主要体现在以下几个方面:(一)NAND Flash的等级限制在宇航级SSD的研制中,最大的瓶颈在于能够满足空间大规模数据存储的宇航等级(Space-Grade)NAND Flash存储颗粒的极度匮乏。像法国3D Plus这种基于工业级2D SLC NAND颗粒打造的三维叠层封装闪存颗粒,单位体积的性能、容量密度及成本,均无法满足航天产业轻量化、低功耗及高性价比的发展需求。因此,基于批产3D工业级NAND构建面向航天的存储系统是航天存储技术发展的必然选择。然而,工业级3D NAND的性能指标与宇航应用的严苛要求存在显著差距,其工作温度范围、抗辐照能力、长期可靠性均无法直接满足航天任务的需求。(二)系统级可靠性设计
SSD作为一个复杂的存储系统,其可靠性不仅取决于NAND Flash颗粒,还涉及主控芯片、电源管理、固件算法等多个层面。如何在系统级别实现宇航级的可靠性要求,是一个需要综合考虑的复杂工程问题。(三)成本与性能的平衡传统的宇航级器件往往意味着高成本和相对较低的性能。在新航天时代,如何在保证可靠性的前提下,实现成本的有效控制和性能的持续提升,是行业面临的重要挑战。如何弥合商用/工业级元器件(特别是NAND Flash)与太空极端环境要求之间的巨大鸿沟,是需要建立一套科学、系统的加固方法论,正视并解决由此带来的挑战,因为简单的器件堆砌或被动防护已不足以应对,必须通过对选定NAND器件进行空间环境特性分析,获得定量的辐照指标数据,并建立⼀套“特性量化分析-全器件筛选-三级系统加固”的组合方法。(一)器件级加固:NAND精准筛选针对工业级3D NAND与宇航级在抗辐射、可靠性的差距,通过 “辐照实验量化指标→定制筛选策略→在轨监测闭环优化”,持续提升器件太空适应性。
(二) 微系统级加固:抗辐照SSD控制器
控制器是SSD的“大脑”,其可靠性至关重要。设计开发原生符合抗辐照要求的控制器,再搭配加固固件,以多通道冗余、多模冗余技术,来解决NAND翻转与失效问题。
(三)系统级加固:全链路容错体系设计
在系统层面,需要构建从物理失效到应用访问的完整容错体系,确保在极端情况下数据不丢失、服务不中断,包含加固IP与块设备驱动等,强化SSD访问可靠性;通过Smart RAID、HRFS技术来打破IO Stack层级界限,屏蔽Die/Plane/坏块故障,实现负载均衡通过分布式存储网络降低硬件可靠性依赖,最终达成 “全COTS器件适配航天存储” 目标。不同航天的任务在可靠性、寿命、成本等方面有着差异化需求,我们可以构建⼀个多维解析模型,综合不同航天任务在轨道高度、载荷及任务类型的不同,并对其的开机要求、在轨寿命以及可靠性等级要求三大核心维度的深入剖析,建立一个更加科学、实用的宇航SSD三级分类框架体系,并为不同航天任务来精准匹配最合适的存储解决方案。根据影响不同航天任务以及对于SSD的需求,建立的三级SSD分类如下:面对宇航存储技术的快速发展和市场需求的日益多样化,建立统一、科学的宇航级SSD评价体系已成为行业发展的迫切需要。这需要产业链各方的共同努力:(一)标准制定机构的作用相关标准制定机构应当加快制定针对宇航级SSD的专门标准,明确技术指标、测试方法和认证流程。这些标准应当既体现宇航级产品的严苛要求,又考虑到技术发展的现实情况和成本控制的需要。(二)产业链协同发展从NAND Flash供应商到SSD制造商,从测试设备厂商到最终用户,产业链各环节都应当积极参与标准的制定和实施。只有形成产业链的协同效应,才能真正推动宇航级SSD技术的健康发展。(三)技术创新与标准化并重在推进标准化的同时,也要鼓励技术创新。标准应当为技术发展留出足够的空间,避免过于僵化的规定阻碍技术进步。宇航存储技术正站在一个重要的历史节点上。新航天时代的到来为行业带来了前所未有的机遇,同时也提出了更高的挑战。建立科学、统一的宇航级SSD评价体系,不仅是技术发展的需要,更是行业健康发展的基石。通过构建三级分类体系,可以在满足不同应用场景需求的同时,为用户提供清晰的选择依据。这种分类方式既体现了对传统宇航级标准的尊重,又适应了新航天时代多样化的应用需求。期待产业链各方能够携手合作,共同推动宇航级SSD评价体系的建立和完善。只有通过科学的定义、透明的沟通和持续的创新,才能确保宇航存储技术在未来的发展中行稳致远,为人类的太空探索事业提供更加可靠的技术支撑。朱荣臻,工学博士,计算机体系结构方向,师从沈绪榜院士,现任艾可萨科技(成都)有限公司董事长及总经理,是我国首颗宇航级存储控制器芯片及新一代航天数据存储系统架构设计师,曾在美国LSI,Intel,SST、兆易创新等公司任职,有丰富的航天存储相关工作经验。