创新一直在推动和促进着 Western Digital 的成长。时至今日,创新对于我们的重要性相比于历史上任何一个时期从未减少。从先进的数据中心到移动设备、人工智能到物联网、革命性的数据分析到未来的更精进的技术,数据正改变我们的生活并促进我们的发展。
点击以下标题了解 CTO 办公室内部正在进行部分研究主题,这些研究支持数据存储、获得见解并产生数据价值。
以内存为中心的计算
像机器学习和人工智能这样的大数据应用程序,需要访问大数据集来训练算法或神经网络。这就需要将应用程序所需的所有数据转移至处理器。通过网络转移大量的数据需要时间、金钱并且会占用网络带宽。这并非可持续或最佳的方式。
根本原因在于目前已沿用了 30 多年的冯·诺伊曼计算机结构。在此模型中,计算机系统的其余部分都以处理器为核心(称为“通用计算架构”)。一项提议的解决方案是使内存成为计算机体系结构(以内存为中心的计算机体系结构)的焦点。但是,由于目前所有操作系统和应用程序都是以冯·诺伊曼计算机为基础构建的,因此该方案的实施比较复杂。使用大型内存池的多个处理器需要实现缓存一致性,来避免两个处理器试图访问或重写另一个处理器可能需要的内存位置。向高度平行处理的转移已促使对内存缓存和一致性的多核心访问取得了一定的进展,但它们使用的内存空间相对较小。将共享内存扩展至多 TB 级数据会增加架构转变的复杂性。我们的研究目的在于了解转型到以内存为中心的结构需要什么条件。
非易失性存储器
有两种不同的内存目前都可作为 CPU、SRAM 和 DRAM 访问的内存。但是两种都是易失性内存,这意味着停电或关机时保存的数据将丢失。目前一种新的内存类型(持久性或存储级内存,SCM)正在被开发,它是非易失性的,也就是说断开电源的时候数据不会丢失。
距离 CPU 近的内存需要更快的访问速度,或延迟接近 CPU 时钟速度,以便用作 CPU 缓存内存。固态硬盘和机械硬盘数据存储设备的延迟都太慢,无法用于缓存内存。在讨论这个主题时,将存储与内存区分开来非常关键(在这里,内存指的是位寻址内存,用于由 CPU 访问的寄存器和缓存;而存储指的是使用系统组织和存储数据的设备,并且它不是位寻址)。
部分具有低延迟的非易失性内存的设计可以与 DRAM 媲美:这些存储器称为 MRAM(磁阻随机存取存储器)或 STT-MRAM(自旋转移力矩磁阻随机存取存储器)。延迟介于 DRAM 和 SSD 之间的其他技术是 PCM(相变内存)或 ReRAM(可变电阻式存储器)。Western Digital 已对非易失性存储器进行了多年研究,研究范围从基本材质研究(包括单元物理特性和设计)到内存单元阵列制造和测试。一项产品投入新兴市场是所有这些共同努力的结果。这三大方面都是此技术的“硬件”方面。其他研究针对的是向非易失性存储器转型的“软件”方面。
持久性内存编程模型
多年来,软件程序员一直使用易失性 DRAM 和 SRAM 编写软件,因此,代码中有很多条款是用来应对这一状况的。如果使用持久性非易失性存储器取代 DRAM,会发生什么情况? 此外,如果将内存添加至延迟接近 DRAM 的计算机或服务器,将如何使用新的 SCM(存储级内存)? 需要对内核和操作系统做出哪些变更? 这会对行业中的 SaaS(存储即服务)领域产生哪些影响? 这会对灾难恢复方面产生哪些影响? 事实上,软件层次结构的每一部分都需要审视这种变化将对他们的产品和服务产生的影响。改变并非在一夜之间发生的,因此向非易失性存储器转换需要一段时间,并且道路也并不清晰,因此必须考虑向后兼容性。或者,公司可以选择提供基于计算机系统的新内存配置的产品,从而快速利用非易失性存储器。采纳这种变更是否会先影响云供应商,还是企业数据中心将发挥带头作用?
这种转型存在大量未知,我们应如何应对? 如果回溯过去,想想持久性内存,就会发现它有可能成为业界引入的最具颠覆性的技术之一,并且有可能影响我们与设备的日常交互。行业变革需要时间,需要与标准化群组、与开源社区以及具有非开源代码的公司展开合作。
机器学习/人工智能
理解 Western Digital 以内存为中心的活动的前提,是需要理解从以内存为中心的架构中受益的使用案例。为此,我们选择以机器学习 (ML) 为例。机器学习和人工智能正快速成为我们日常生活一部分,我们期待着它的继续发展,并在我们生活的许多方面发挥作用。在 Western Digital,我们确实有研究机器学习与人工智能在我们的产品和处理器中使用情况的工程项目,但是 CTO 办公室的精力更多被投入到了机器学习与人工智能发展带来的未来需求方面。由CTO办公室推动的两个主要调查领域是加速器和算法,这两个领域都在不断发展。
专门设计的加速器尤其适用于机器学习和人工智能应用程序。加速器专为特定的应用程序设计,其中微架构和指令集仅限于机器学习应用程序所需要的内容。由于此加速器具有特定功能,因此可以大大减少处理大数据集所花费的时间。对于专用芯片如何增强传统通用计算 CPU,以此来减少机器学习应用程序所需的时间和能源,加速器就是很好的例子。研究发现,将标准 CPU 设计与针对特定工作负载优化的设计进行比较时,能源和处理速度方面的可能会有 10 倍或更高的改善。采用机器学习与人工智能的应用程序大量出现,为专门针对这些数据密集型应用程序而设计的加速器带来了机遇。
Zoned Storage
Western Digital 的 Zoned Storage Initiative 是什么?
企业、机器和消费者生成的内容会创建大量数据,这些数据不断提高对数据中心存储能力的需求,从数 PB 级提升到数 EB 级。到目前为止,当前的固态硬盘和 HDD 技术一直在不断满足这些大型数据存储需求。
Zoned Storage 是一项基于标准的开源计划,旨在使数据中心能够有效扩展,以迎接 ZB 级存储容量时代。Zoned Storage 会使用硬盘 (HDD) 中用于提高存储密度的叠瓦式磁记录 (SMR),以及固态硬盘 (SSD) 中名为“分区命名空间”的配套技术来存储和检索信息。分区命名空间是 NVMe 标准的扩展。借助这项技术,我们能够提供与 HHD 分区类似的固态硬盘,从而允许将所有存储(无论是 HDD,还是固态硬盘)视作一种技术。Zoned Storage Initiative 在分离环境中利用 SMR 和 ZNS 技术、开源标准和专用计算。
RISC-V
为什么 Western Digital 这家历史悠久的数据存储公司会启动此计划,并在
RISC-V 上进行投资?
这出于两方面的原因。首先,Linux 的成功证明了开源模型,该模型现已在 RISC-V 基金会拥有硬件平台,可以推动实现新一代创新。另一个原因就是 RISC-V 所提供的可配置性是无与伦比的。 通过利用 RISC-V 的开放式协作和灵活性,Western Digital 可以创造专为以数据为中心的应用程序而打造的处理器。 几乎每一款 Western Digital 产品都包含某种处理核心。目前,我们每年在产品中使用十亿个核心,并且公开承诺将我们的处理器核心转换为 RISC-V。在将 RISC-V 核心与我们的产品结合的同时,我们也致力于开发支持生态系统,在此生态系统中,数据是推动新一代创新的关键资源。
在 2018 年闪存峰会,Western Digital 推出了其最新的 OpenFlex™ 架构和产品系列,以及全面的开放标准集,以解决大规模私有和公共云数据中心复杂而动态的数据工作负载需求。
从绘制人类基因组图像到探索银河系的边缘,人类的创新欲望从未止步。探索发现和数据如何帮助塑造当今世界。