计世网

在异构计算时代的数据中心,发现英特尔软件生态战略的生命力
作者:张帅 | 来源:计算机世界
2020-12-22
芯片产业软硬一体的重要性,在异构计算时代被提升到前所未有的高度。

 

2020年是国内半导体企业发展的黄金时期,上至上市企业,下至初创公司,都能在时代大潮中找到自己的位置。英特尔是芯片产业绕不过去的话题,通过观察英特尔正在做的事情,芯片企业很大程度上可以补足短板,少走弯路。

近日英特尔发布了oneAPI Gold版本,oneAPI是一款支持异构计算的平台软件,可为CPU、GPU和FPGA (统称为 XPU)开发跨架构的应用程序,随着数据中心所容纳的硬件平台越来越多样,如何以软件激发硬件价值,这也是英特尔软件战略的出发点。

“我们希望利用oneAPI可以释放最大的硬件潜能,同时也使得我们软件生态当中的开发者,在软件方面的投资可以最大程度的复用,不需要绑定在单一的硬件架构以及制程上,并且我们的开发效率也可以得到最大化。”英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清表示。

“过刚易折,过柔则靡”,芯片产业软硬一体的重要性,在异构计算时代被提升到前所未有的高度。

one API,构建系统软件栈生态

英特尔处理器涵盖了四大主要计算架构,包括CPU、GPU、AI以及FPGA,不同平台在不同领域里各有所长。创业公司更倾向于选择专注一个硬件平台,做“小而美”的生意,大公司应该做大公司的生意,所以英特尔选择做系统软件栈的生态圈。

英特尔以CPU为核心的软件生态圈已经十分成熟,在开源软件的各个层面都有很大的技术投入和技术储备,包括Linux的Kernel、KVM虚拟化等社区,到目前为止,英特尔是世界最大的代码贡献者。

英特尔首先坚持软件优先的策略,比如最新发布的Xe GPU,其在图形、多媒体、计算方面都需要非常稳定的生态,新的英特尔软件生态建立在其过去几十年CPU软件生态的基础上。

英特尔在编程语言、系统库以及工具链方面已经有了非常强有力的生态支持,从图形和多媒体方面来看,英特尔在Windows和Linux的操作系统也有20多年的积累。

其次是易于扩展,GPU细分市场非常多,不同市场有不同的价格、功耗、性能需求。英特尔希望能够最大限度得到所有GPU开发者的支持。

“为了得到更多开发者的支持,我们就需要覆盖不同的细分市场,这也是为什么我们现在已经建成的集成显卡生态非常重要,因为英特尔的集成显卡在某些领域每年都会有百万级的客户。这也是独立显卡和集成显卡所有的软件都具备兼容性的原因,并且我们在最近的‘Tiger Lake’产品发布之后,oneAPI软件也得到了生态圈里所有开发者非常好的评价和反馈。”谢晓清说道。

最后是全新的计算负载和用户场景。英特尔的重点是发展新的计算负载和用户场景,而不是只关注已有场景。对英特尔这样的技术领先者而言,超前一步解决现有方案或者是产品还不太能够很好解决的问题,这是英特尔塑造产品差异性的机会。

在oneAPI Gold版本中,英特尔提供了oneAPI的编译器DPC++以及所有的系统库,同时也包括一系列支持oneAPI的工具包,包括移植、分析和调试工具包等等。这些工具包支持系统软件的各个层面,开发者可以用来调试和剖析自己的应用程序。

当硬件更新换代时,开发者使用one API不改动软件即可适配,同一份源码让开发者无缝、快速地升级到新一代硬件平台。“我们鼓励开发者花更多的时间在创新、开发和优化新的用户场景,而不是花大量的时间和精力维护现有的源码和投资。”谢晓清表示。

言而总之,oneAPI主要价值分为三方面,其一是提供一个非常友好的编程环境,使得开发者可以自由选择硬件平台,不必因为某一种语言绑定在某一个硬件平台;其二,英特尔提供的编译器、系统高度优化,可以实现最大的硬件价值,并且最优支持不同异构计算的硬件加速;其三,one API开发模式非常快速、高效,并且源码的维护成本可以达到最低。

Analytics ZooAI落地软件流水线

人工智能脱虚向实,越来越多的应用已经落地到企业业务场景,从开发视角看,最大的挑战可能是如何将AI算法应用到复杂的数据当中。

英特尔大数据技术全球CTO、大数据分析和人工智能创新院院长戴金权表示,企业客户面临着数据量大且数据来源复杂的难题,如何将AI可以直接应用到大数据的生产环境中,能够让其无缝的进行大规模扩展,这是英特尔希望通过Analytics Zoo等一系列组件实现的目标。

Analytics Zoo是英特尔开源的一个端到端的大数据+AI软件平台,构建在基于one API的底层加速库或者底层优化框架之上,包括深度学习的框架、Python库,分布式的数据处理像Spark、Flink、Ray等数据处理分析框架。

据戴金权介绍,Analytics Zoo大致可以分为三层,底层提供端到端的数据流水线的能力,能够帮助用户可以直接无缝的将AI模型运行在其分布式大数据上;中间层是英特尔提供的机器学习工作流,目的是能够将很多人工的作业、人工的任务实现自动化;最上层是用户使用Analytics Zoo构建的应用场景,大致可以分为四类,推荐系统、时间序列分析、计算机视觉以及自然语言处理。

以汉堡王为例,在快餐推荐的场景下,用户实时的点餐行为和各种情景特征(比如时间、天气和位置等)都是能够被用来做合适推荐的重要因素。在汉堡王,英特尔利用 Analytics Zoo提供的RayOnSpark功能,使用Ray、Apache Spark和 Apache MXNet 构建了一个完整的端到端的推荐系统。

它将数据处理(使用 Spark )和分布式训练(使用 MXNet 和 Ray )集成到一个统一的数据分析和 AI 流水线中,并直接运行在存储数据的同一个大数据集群上。

“整个工业界已经慢慢进入了人工智能的时代,但是今天所说的人工智能的基础是大数据,AI和数据分析是我们将来非常重要的一个应用场景,特别是把AI和数据分析应用到现实的生产系统当中,端到端的AI流水线是非常重要的。英特尔不管是在软件、硬件层面,都具备高可用的产品和方案。”戴金权表示。

在异构计算时代的数据中心,英特尔的软件生态战略正在催发出硬件平台的最大生命力。

责任编辑:张帅