领先的中文互联网搜索提供商百度和全球先进半导体技术领导者三星电子今日宣布,百度首款云到边缘AI加速器百度KUNLUN已完成开发,将提前量产明年。
百度KUNLUN芯片基于该公司先进的XPU(一种用于云、边缘和AI的本土神经处理器架构)以及三星的14纳米(nm)工艺技术及其I-Cube™(Interposer-Cube)封装解决方案。
该芯片提供512GB每秒(GBps)的内存带宽,并以150瓦的功率提供高达260Tera操作(TOPS)。此外,新芯片允许自然语言处理预训练模型Ernie的推理速度是传统GPU/FPGA加速模型的三倍。
利用该芯片突破极限的计算能力和能效,百度可以有效支持包括大规模人工智能工作负载在内的各种功能,如搜索排名、语音识别、图像处理、自然语言处理、自动驾驶和深度学习平台像桨桨。
通过两家公司的首次代工合作,百度将提供先进的人工智能平台以最大限度地提高人工智能性能,三星将把代工业务扩展到专为云计算和边缘计算设计的高性能计算(HPC)芯片。
百度杰出架构师欧阳健表示:我们很高兴能与三星代工厂一起引领高性能计算行业。百度昆仑是一个非常具有挑战性的项目,因为它不仅需要高度的可靠性和性能,而且还汇集了半导体行业最先进的技术。得益于三星最先进的工艺技术和合格的代工服务,我们能够实现并超越我们提供卓越AI用户体验的目标。
三星电子代工营销副总裁RyanLee表示:我们很高兴能够使用我们的14纳米工艺技术为百度启动一项新的代工服务。百度昆仑对三星代工厂来说是一个重要的里程碑,因为我们正在通过开发和量产人工智能芯片将我们的业务领域从移动扩展到数据中心应用。三星将提供从设计支持到尖端制造技术(例如5LPE、4LPE以及2.5D封装)的全面代工解决方案。
随着人工智能和高性能计算等多样化应用对更高性能的要求,芯片集成技术变得越来越重要。三星的I-Cube™技术将逻辑芯片和高带宽内存(HBM)2与中介层连接起来,通过利用三星的差异化解决方案以最小的尺寸提供更高的密度/带宽。
与以前的技术相比,这些解决方案最大限度地提高了产品性能,将电源/信号完整性提高了50%以上。预计I-Cube™技术将标志着异构计算市场的新纪元。三星还在开发更先进的封装技术,例如再分布层(RDL)中介层和4x、8xHBM集成封装。