AI芯片后起之秀Graphcore推出全球首款3D封装处理器
摩尔定律不灵了?除了“挤牙膏”,还能怎么办?堆核啊!还想要更强怎么办?“粘胶水”呀!
苹果最新发布PC上的M1 Ultra芯片,在封装环节将两个M1 Max通过内部互连而成。这个被业内戏称为“粘胶水”手艺,其实是芯片封装环节的“双芯叠加”技术。
无独有偶,一家叫做Graphcore的英国AI芯片硬件设计公司,在3月3日正式推出了新款AI处理器Bow IPU。这两款新品采用同一种封装技术——台积电的3D Wafer-on-Wafer技术。
Graphcore是成立于2016年的初创公司,总部位于英国布里斯托,主要业务是设计用于AI应用程序的处理器,为云服务等应用提供产品支持。
作为全球第一款3D封装的处理器,Graphcore全新推出的Bow IPU采用了台积电SoIC-WoW技术。该技术是将每个芯片上的铜焊盘在晶圆对齐时匹配,再将两个晶片叠压到一起时让焊盘熔断。我们可将其视作某种冷焊,接着将顶部晶圆削薄到仅数微米,最后将键合晶圆切割成芯片。
新一代的Bow IPU有Bow Pod16、Bow Pod32、Bow Pod64、Bow Pod256,以及Bow Pod1024的不同配置。
Bow IPU的理论AI算力从前代的250 TeraFLOPS(每秒万亿次浮点运算)提升到了350 TeraFLOPS。与旧款Colossus MK2芯片相比,Bow的性能提高了40%,同时能耗下降16%。价格和前代相比保持不变。
随着芯片制造工艺越来越逼近物理极限,传统意义上的摩尔定律逐渐失效,3D等先进封装技术对延续摩尔定律愈发重要。“Bow IPU证明了先进封装可以为性能带来可观提升。先进封装技术是大家探索超越摩尔定律的路径之一。”Graphcore大中华区总裁兼全球首席营收官卢涛表示。
特别需要指出的是,Bow IPU与前一代产品100%软件兼容,用户在进行部署时无需更改现有代码。
“性能数据的提升很大程度上归功于我们整个软件栈的生态系统。”Graphcore中国工程副总裁、AI算法科学家金琛解释道,“这些软件的加持使得我们在不同应用的性能上能够得到广泛和通用的提升。”
此外,在开发者社区方面,Graphcore提供了广泛的代码用例,以及各种文档、视频的示范。“我们在机器学习的应用上提供了特别多的模型范例,包括不同的AI垂直领域,比如图片识别、检测,以及大模型、语音、语言模型等方面。在云上,我们也提供了广泛的部署、监控,以及管理的软件集成。”金琛说。
在用户实践方面,金山云基于Graphcore IPU平台的服务器产品——金山云IPU服务器已经用于AI任务在云端的训练和推理,并且已经开始接受购买与预定。这是中国首个大型公有云厂商对外公开推出自己的IPU云产品。
金山云IPU服务器属于金山云星曜产品(裸金属服务器)系列,搭载了Graphcore IPU及Poplar软件栈。借助IPU平台基础构建块IPU-M2000的超高算力和灵活可扩展性,以及Poplar软件栈的易用性,金山云IPU服务器可以为客户提供高性能、可扩展、安全、稳定的计算服务,帮助用户快速构建与扩容高性能需求的AI应用。
IDC报告预计,2019年至2024年,中国人工智能市场年复合增长率将高达30.4%,中国的AI应用市场正在蓬勃发展。
作为AI芯片领域的后起之秀,早在去年4月,Graphcore就与神州数码宣布总代合作,共同在中国范围内发展销售渠道网络,使中国的商业客户与广大创新者能够更便捷和快速地获取IPU系统,以及配套的本地AI专家服务和工程支持。
目前,Graphcore中国有两支技术团队——一支是以定制开发为主要任务的工程技术团队,另一支是以对用户技术服务为主的现场应用团队。工程技术团队承担两方面工作,一是根据中国本地的AI应用特点和需求,将AI的算法模型在IPU上实现落地;二是根据中国本地用户对AI稳定性学习框架平台软件的需求,进行功能性的开发加强工作。现场应用团队则是帮助客户完成现场的技术支持工作。
责任编辑:焦旭