计世网

推动AI应用创新 英特尔下注至强开辟人工智能新捷径
作者:MS | 来源:计算机世界
2020-08-05
全新至强+傲腾,让用户在云端和边缘可以实现更多AI的应用创新。

 

“我们的生态哲学之道是水利万物而不争,我们希望继续建设基础设施,帮助客户提供更好的解决方案,解决用户最终的问题”。 英特尔公司市场营销集团副总裁、中国区数据中心销售总经理陈葆立先生在日前举办的“2020英特尔数据中心产品技术线上分享会”上如是说。

陈葆立表示,现阶段的市场面临磅礴的数据中心发展机遇,英特尔的处理器是目前业界唯一能够集成AI加速的处理器。缘于人工智能普及化的大趋势,英特尔致力于为客户及从业人员开辟出快速接洽人工智能的捷径。

陈葆立强调,不同于其他厂商,凭借全面的产品组合,目前仅英特尔可以实现在数据中心领域的全面覆盖。软件优化方面,英特尔以成千上万的软件工程师为基石,持续关注并致力于解决释放硬件性能的行业挑战。

此外,英特尔具有庞大的产业生态,在中国35年的产业历史中,英特尔携手如阿里、腾讯、百度等合作伙伴,进行深度的技术合作,共同释放硬件性能。

至强可扩展处理器

英特尔技术专家表示,人工智能和数据密集型服务是最近这几年业界的普遍需求,也是技术发展的方向。对于人工智能的支持,第三代至强可扩展处理器进一步升级了DL Boost深度学习加速技术,同时实现在深度学习加速架构下的VNNI神经网络指令,以支持创新的bfloat16数据格式。

英特尔技术专家强调,结合DL Boost及bfloat16,英特尔第三代至强可扩展处理器相比上一代平台即Cascade Lake最顶级的CPU 8280,在进行图像分类处理的时候,其计算性能可以提高1.93倍。

英特尔技术专家总结到,第三代至强可扩展处理器Cooper Lake是专为当今内置人工智能的数据密集型服务而设计的。英特尔每个处理器支持的内核数可以最高到28个核,如搭配一个8路平台,可以轻松支持224个物理核,对于云计算这种需要虚拟机密度的场景,就可以实现非常高的密度,帮助用户优化TCO。

 

此外,随着业务多样性越来越复杂,不同业务对硬件也有不同的需求,部分业务希望单线程的性能要尽可能高,但却并不需要有很多线程做并行计算;另一部分业务则希望有很多的线程,同时做并发处理,但是对单线程要求并不高。以往的解决办法大多是根据业务需求进行量身定制,然而一旦业务发生变化,就会凸显配置的不灵活性。此外,随着计算密度越来越高,用户会在一台机器上部署多个业务,此时用户更希望能有针对性的对业务设置优先级,尽可能保证高优先级的业务具备更好的性能。基于此,为解决用户痛点,英特尔还在第三代至强可扩展处理器上推出了第二代的Speed Select技术(简称SST)。SST是一个功能集合,主要提供四种功能模式,包括SST-PP(Performance Profile)、SST-CP(Performance Profile)、SST-BF(Base Frequency)、SST-TF(Turbo Frequency睿频),以解决上述业务难题。

傲腾持久内存

通过近10年的积累,英特尔创新性地打造了革命性的傲腾™ 技术,推出傲腾介质并利用其打造出了傲腾持久内存和傲腾SSD,一举改变了传统的内存和存储层级结构。通过缩小差距、减少瓶颈和解决数据延迟,使内存更靠近计算,为数据中心提供更高的灵活性和更多的价值。

对于内存产品的重要性,英特尔技术专家指出,内存访问与存储访问有本质的区别,前者基于字节存储或通过Cache Line访问,当应用程序需要数据时,以load store操作实现快速访问。而后者的访问模式基于块操作,现阶段容量已经扩展到4K,存储访问较适用于批量数据处理,将傲腾技术引入持久内存,对于内存层级不失为一项优质的技术革新。

从运作模式方面来看,英特尔技术专家告诉记者,延续上一代产品,全新傲腾200系列内存提供“App Direct Mode”和“Memory Mode”两种运作模式。其中,Memory Mode的特点主要体现在持久内存以远端内存和DRAM联合模式呈现出新的内存整体,控制由CPU内部硬件逻辑完成。内存模式由内存个体完成,同时配合内部CPU创新,形成软件端友善的使用模式。而App Direct Mode模式,即应用直接模式下,持久内存的空间对应用软件是可见的,当软件把数据写到这个里面之后,下一次可以从原来的地方直接读取出来,而且断电之后的数据依然存在。在应用直接访问模式下,既可以作为一个内存对象,也就是写入之后数据直接保留。同时通过操作系统内核驱动也可以作为一个块存储,同样可以保持对软件应用很好的兼容性。

整体来看,相比DRAM,持久内存有很大的成本优势,它可以部分取代DRAM容量从而改善系统TCO,在单机里可以部署更大的内存容量,实现更高的应用部署密度。例如,原来会采用10台机器运作的事情,在采用持久化内存之后,用3-5台机器即可完成。这样不仅可以降低成本,同时也可以减少原来机器和机器之间通信的沟通成本。

除此之外,持久内存还对I/O瓶颈的消除,以及对数据存储的使用场景起到很好提升性能作用。尽管数据通过在内存中计算可以得到很好的性能,但数据需要去持久化,让所有东西在后台有记录。任何一个用户发起请求更新自己的状态,是希望不管什么时候,哪怕是换一个终端或者是终端出现问题,其更新状态永远是可见的。因此在云计算环境里面,虽然运算本身是在内存完成的,但是实际上还有I/O的操作在这里面,而持久内存可以有效缓解I/O的瓶颈,并且它是近似一个内存产品又有持久化特性,所以能够去产生很多新的内存和存储的融合类的应用。

小结

总结来讲,AI已经作为在数据中心中大众尤为关注的工作负载。第三代至强可扩展处理器针对AI进行了充分的优化,内置的DL Boost指令集,可以非常完美胜任多样化AI计算任务。

以英特尔至强可扩展处理器为基石,结合傲腾持久内存,以及英特尔在传输、GPU、ASIC等硬件方面形成的平台化优势,结合英特尔在生态链中丰富的软件支持,相信未来一定会有越来越多用户在此平台上,以云端、边缘的形式实现更多AI的应用创新。

责任编辑:毛烁