推动AI应用创新英特尔下注至强开辟人工智能新捷径

作者:MS | 来源:计算机世界

2020-08-05

全新至强+傲腾，让用户在云端和边缘可以实现更多AI的应用创新。

“我们的生态哲学之道是水利万物而不争，我们希望继续建设基础设施，帮助客户提供更好的解决方案，解决用户最终的问题”。英特尔公司市场营销集团副总裁、中国区数据中心销售总经理陈葆立先生在日前举办的“2020英特尔数据中心产品技术线上分享会”上如是说。

陈葆立表示，现阶段的市场面临磅礴的数据中心发展机遇，英特尔的处理器是目前业界唯一能够集成AI加速的处理器。缘于人工智能普及化的大趋势，英特尔致力于为客户及从业人员开辟出快速接洽人工智能的捷径。

陈葆立强调，不同于其他厂商，凭借全面的产品组合，目前仅英特尔可以实现在数据中心领域的全面覆盖。软件优化方面，英特尔以成千上万的软件工程师为基石，持续关注并致力于解决释放硬件性能的行业挑战。

此外，英特尔具有庞大的产业生态，在中国35年的产业历史中，英特尔携手如阿里、腾讯、百度等合作伙伴，进行深度的技术合作，共同释放硬件性能。

至强可扩展处理器

英特尔技术专家表示，人工智能和数据密集型服务是最近这几年业界的普遍需求，也是技术发展的方向。对于人工智能的支持，第三代至强可扩展处理器进一步升级了DL Boost深度学习加速技术，同时实现在深度学习加速架构下的VNNI神经网络指令，以支持创新的bfloat16数据格式。

英特尔技术专家强调，结合DL Boost及bfloat16，英特尔第三代至强可扩展处理器相比上一代平台即Cascade Lake最顶级的CPU 8280，在进行图像分类处理的时候，其计算性能可以提高1.93倍。

英特尔技术专家总结到，第三代至强可扩展处理器Cooper Lake是专为当今内置人工智能的数据密集型服务而设计的。英特尔每个处理器支持的内核数可以最高到28个核，如搭配一个8路平台，可以轻松支持224个物理核，对于云计算这种需要虚拟机密度的场景，就可以实现非常高的密度，帮助用户优化TCO。

此外，随着业务多样性越来越复杂，不同业务对硬件也有不同的需求，部分业务希望单线程的性能要尽可能高，但却并不需要有很多线程做并行计算；另一部分业务则希望有很多的线程，同时做并发处理，但是对单线程要求并不高。以往的解决办法大多是根据业务需求进行量身定制，然而一旦业务发生变化，就会凸显配置的不灵活性。此外，随着计算密度越来越高，用户会在一台机器上部署多个业务，此时用户更希望能有针对性的对业务设置优先级，尽可能保证高优先级的业务具备更好的性能。基于此，为解决用户痛点，英特尔还在第三代至强可扩展处理器上推出了第二代的Speed Select技术（简称SST）。SST是一个功能集合，主要提供四种功能模式，包括SST-PP（Performance Profile）、SST-CP（Performance Profile）、SST-BF（Base Frequency）、SST-TF（Turbo Frequency睿频），以解决上述业务难题。

傲腾持久内存

通过近10年的积累，英特尔创新性地打造了革命性的傲腾™ 技术，推出傲腾介质并利用其打造出了傲腾持久内存和傲腾SSD，一举改变了传统的内存和存储层级结构。通过缩小差距、减少瓶颈和解决数据延迟，使内存更靠近计算，为数据中心提供更高的灵活性和更多的价值。

对于内存产品的重要性，英特尔技术专家指出，内存访问与存储访问有本质的区别，前者基于字节存储或通过Cache Line访问，当应用程序需要数据时，以load store操作实现快速访问。而后者的访问模式基于块操作，现阶段容量已经扩展到4K，存储访问较适用于批量数据处理，将傲腾技术引入持久内存，对于内存层级不失为一项优质的技术革新。

从运作模式方面来看，英特尔技术专家告诉记者，延续上一代产品，全新傲腾200系列内存提供“App Direct Mode”和“Memory Mode”两种运作模式。其中，Memory Mode的特点主要体现在持久内存以远端内存和DRAM联合模式呈现出新的内存整体，控制由CPU内部硬件逻辑完成。内存模式由内存个体完成，同时配合内部CPU创新，形成软件端友善的使用模式。而App Direct Mode模式，即应用直接模式下，持久内存的空间对应用软件是可见的，当软件把数据写到这个里面之后，下一次可以从原来的地方直接读取出来，而且断电之后的数据依然存在。在应用直接访问模式下，既可以作为一个内存对象，也就是写入之后数据直接保留。同时通过操作系统内核驱动也可以作为一个块存储，同样可以保持对软件应用很好的兼容性。

整体来看，相比DRAM，持久内存有很大的成本优势，它可以部分取代DRAM容量从而改善系统TCO，在单机里可以部署更大的内存容量，实现更高的应用部署密度。例如，原来会采用10台机器运作的事情，在采用持久化内存之后，用3-5台机器即可完成。这样不仅可以降低成本，同时也可以减少原来机器和机器之间通信的沟通成本。

除此之外，持久内存还对I/O瓶颈的消除，以及对数据存储的使用场景起到很好提升性能作用。尽管数据通过在内存中计算可以得到很好的性能，但数据需要去持久化，让所有东西在后台有记录。任何一个用户发起请求更新自己的状态，是希望不管什么时候，哪怕是换一个终端或者是终端出现问题，其更新状态永远是可见的。因此在云计算环境里面，虽然运算本身是在内存完成的，但是实际上还有I/O的操作在这里面，而持久内存可以有效缓解I/O的瓶颈，并且它是近似一个内存产品又有持久化特性，所以能够去产生很多新的内存和存储的融合类的应用。

小结

总结来讲，AI已经作为在数据中心中大众尤为关注的工作负载。第三代至强可扩展处理器针对AI进行了充分的优化，内置的DL Boost指令集，可以非常完美胜任多样化AI计算任务。

以英特尔至强可扩展处理器为基石，结合傲腾持久内存，以及英特尔在传输、GPU、ASIC等硬件方面形成的平台化优势，结合英特尔在生态链中丰富的软件支持，相信未来一定会有越来越多用户在此平台上，以云端、边缘的形式实现更多AI的应用创新。

责任编辑：毛烁

推动AI应用创新英特尔下注至强开辟人工智能新捷径

专题

最新发布

推动AI应用创新 英特尔下注至强开辟人工智能新捷径

专题

最新发布

推动AI应用创新英特尔下注至强开辟人工智能新捷径