英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型
集微网旧金山报道(文/张轶群)在AI浪潮席卷全球,且将人工智能列为第一战略重点后,AMD在AI的技术创新高地继续保持攻势,并有望改变现存的英伟达一家独大的市场格局。
北京时间6月14日凌晨,AMD在美国旧金山举办的“数据中心和人工智能技术首映式”活动上,正式发布了MI300系列在内的一系列数据中心及人工智能相关技术产品。
AMD董事长兼CEO苏姿丰博士(Lisa Su)表示,AI存在大量的市场机会,而最大的机遇来自于数据中心。
(相关资料图)
Begamo:业界首款X86云原生CPU
会上,最先亮相的是AMD第四代服务器处理器EPYC 97X4,这款代号为“Begamo”的处理器是业界首款x86云原生CPU。它基于特别定制的Zen 4c微架构,保持了与Zen 4微架构基本相同的功能集,同时将内核尺寸要求减半。
据介绍, “Bergamo”处理器有128个“Zen 4c”内核,能够为在云端运行的应用程序带来最大的vCPU密度和行业领先的性能。实现2.7倍的能耗节省,同时带来3倍容量升级,以驱动大规模云原生应用。
行业分析指出,Bergamo作为一个云原生SoC,在某种程度上是对安培、亚马逊、谷歌和微软等新兴的基于Arm的数据中心级SoC的回应。Bergamo在设计上基于多种因素,包括效率、功耗、芯片尺寸和低总拥有成本(TCO),而不是以提供最大的每核性能为目标。
去年,AMD推出了领先的3D V-Cache技术,并基于此打造了第三代AMD EPYC Milan-X系列处理器。
今日,AMD宣布推出采用3D V-Cache技术的第四代EPYC处理器。这是目前业界性能最高的用于技术计算的x86服务器CPU,拥有多达96个“Zen4”内核和业界领先的1GB+L3高速缓存。
微软宣布全面推出基于第四代EPYC处理器以及3D V-Cache技术的Azure HBv4和HX实例。与上一代HBv3相比,最新的实例提供了高达5倍的性能提升。
亚马逊也展示了基于新一代AMD EPYC处理器的EC2 M7a实例,具有50%计算性能的提升,并能够支持更广泛的工作负载。
MI300系列:性能最强生成式AI加速器
此前备受关注的AMD Instinct MI300X加速器终于揭开面纱。
据苏姿丰介绍,MI300X是目前最先进的生成AI加速器。基于第三代CDNA架构,MI300X支持高达192GB的HBM3内存,借助AMD InstinctMI300X的大内存,可以在单个GPU上适配大型语言模型,例如400亿个参数模型Falcon-40B,苏姿丰在现场进行了演示。
MI300系列是业界首款“CPU+GPU+内存”一体化的数据中心芯片,采用3D堆叠和Chiplet技术,配备了9个基于5nm制程的计算核心(6个GCD+3个CCD),置于4个基于6nm制程的I/O die之上。晶体管数量达到1460亿个、多于英伟达H100的800亿个。
此外,AMD还推出了由8个MI300X整合在一起的Instinct平台,具有高达1.5TB HBM3内存。同时,AMD推出了全球首款面向高性能和AI工作负载的APU加速器AMD Instinct MI300A。
作为目前AMD AI领域最强芯片,MI300被视为是对标英伟达H100的产品。
有分析指出,从性能上MI300性能显著超越H100,在部分精度上的性能优势高达30%甚至更多。凭借CPU+GPU的能力,产品组合性能更高、同时具有成本优势。此外,在收购赛灵思之后,在加速卡领域的定制化服务大幅领先英伟达,能够协助云厂商在特定算法模块上进行训练,进一步降本增效。
据苏姿丰介绍,MI300A已经向客户送样,MI300X将于今年Q3送样,希望于今年Q4实现规模出货。
或扭转AI市场格局
如今,AI技术带来的热潮,使得越来越多的公司投入其中。AMD视AI为第一战略,全力押注,十分看好AI市场的广泛前景。
今天的会议现场,苏姿丰给出了AMD对于AI市场的判断。AMD预计,来自CPU、FPGA以及其他AI数据中心业务将推动市场规模从2023年的300亿美元增加到2027年的1500亿美元,年均复合增长率超过50%。
外界也对AMD此次芯片发布给予较高期望。6月12日,AMD盘前涨近3%,股价创2022年1月18日以来新高。
一些分析机构的研判认为,MI300性能强大,是对标英伟达高端加速卡的有力竞品。相较H100,MI300在晶体管数量和显存容量上亦大幅领先。随着MI300芯片在下半年的量产发布,AMD有望与英伟达在AI加速卡市场展开直接竞争。而随着下游应用端的高速发展,使得微软、谷歌、Meta等众多海外巨头争相增加算力储备,算力芯片需求高度旺盛之下,英伟达一家独大的市场格局或将迎来转变。
正因如此,市场对于AMD给予更多积极的预期。部分分析观点认为,AMD2024年AI相关营收有望达到4亿美元,最高甚至可能达到12亿美元——是此前预期的12倍之多。昨日,部分美国投行还相继大幅上调了对AMD的目标价,最高上调50美元之多。(校对/李映)
关键词: