英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型_微头条
2023-06-14 07:04:52    中财网

MI300X的HBM密度高达英伟达AI芯片H100的2.4倍,HBM带宽高达H100的1.6倍,可以运行的模型比H100的更大。AMD发布的其他新品已吸引硅谷巨头:亚马逊云运用四代EPYC 处理器打造实例;微软Azure推出搭载Genoa-X CPU的新实例;Meta计划使用AMD的新云芯片Bergamo。凭借发布的新品,AMD正式向英伟达的AI芯片王者地位发起挑战。

美东时间6月13日周二,AMD举行了新品发布会,其中最重磅的新品当属性用于训练大模型的ADM最先进GPU Instinct MI300。

AMD CEO苏姿丰介绍,生成式AI和大语言模型(LLM)需要电脑的算力和内存大幅提高。她预计,今年,数据中心AI 加速器的市场将达到300亿美元左右,到2027 年将超过1500 亿美元,复合年增长率超过 50%。


(相关资料图)

苏姿丰演示介绍,AMD的Instinct MI300A号称全球首款针对AI和高性能计算(HPC)的加速处理器(APU)加速器。在13个小芯片中遍布1460亿个晶体管。

它采用CDNA 3 GPU架构和24个Zen 4 CPU内核,配置128GB的HBM3内存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。AMD在发布会稍早介绍,新的Zen 4c内核比标准的Zen 4内核密度更高,比标准Zen 4的内核小35%,同时保持100%的软件兼容性。

AMD推出一款GPU专用的MI300,即MI300X,该芯片是针对LLM的优化版,拥有192GB的HBM3内存、5.2TB/秒的带宽和 896GB/秒的Infinity Fabric 带宽。AMD将1530亿个晶体管集成在共12个5纳米的小芯片中。

AMD称,MI300X提供的HBM密度最高是英伟达AI芯片H100的2.4倍,其HBM带宽最高是H100的1.6倍。这意味着,AMD的芯片可以运行比英伟达芯片更大的模型。

苏姿丰介绍,MI300X可以支持400亿个参数的Hugging Face AI 模型运行,并演示了让这个LLM写一首关于旧金山的诗。这是全球首次在单个GPU上运行这么大的模型。单个MI300X可以运行一个参数多达800亿的模型。

LLM需要的GPU更少,给开发者带来的直接好处就是,可以节约成本。

AMD还发布了AMD Instinct 平台,它拥有八个MI300X,采用行业标准OCP设计,提供总计1.5TB 的HBM3 内存。

苏姿丰称,适用于CPU和GPU的版本MI300A现在就已出样,MI300X和八个GPU的Instinct 平台将在今年第三季度出样,第四季度正式推出。

亚马逊、微软、Meta已经或将要运用AMD新品除了AI芯片,AMD此次发布会还介绍了第四代EPYC(霄龙)处理器,特别是在全球可用的云实例方面的进展。

AMD第四代EPYC(霄龙)在云工作负载的性能是英特尔竞品处理器的1.8倍,在企业工作负载中的处理速度是英特尔竞品的1.9倍。

AMD称,第四代EPYC(霄龙)启用新的Zen 4c内核,比英特尔Xeon 8490H的效率高1.9倍。由于绝大多数AI在CPU上运行,AMD在CPU AI领域具有绝对的领先优势。

亚马逊周二宣布,在用AWS Nitro和第四代EPYC 处理器打造新的实例。亚马逊云的EC2 M7a实例现已提供预览版,性能比M6a实例高50%。

AMD也将在内部工作中运用EC2 M7a实例,包括芯片设计的EDA软件。AMD还宣布,今年7月,甲骨文将推出Genoa E5实例。

AMD发布的EPYC Bergamo处理器是业界首款x86原生CPU,有128个内核,每个插槽256个线程。这意味着一个普通的2U 4 节点平台将有 2048 个线程。

Bergamo比前代Milan的性能高2.5倍,现在就可以向AMD的云客户发货。

Meta的公司代表介绍,Meta在基础设施中使用EPYC处理器。Meta也对基于AMD的处理器设计开源。Meta方面称,计划为其基础设施使用云处理器Bergamo,还要将Bergamo用于其存储平台。

AMD同时推出本周二上市的CPU Genoa-X。它将增加超过1GB 的96核L3缓存。它共有四个SKU,16到 96 个内核。因为SP5插槽兼容,所以它可以与现有的EPYC 平台一起使用。

微软的公司代表和AMD一道展示了微软云Azure HPC的性能,在EPYC处理器的帮助下,Azure四年内的性能提升四倍。

Azure宣布,搭载Genoa-X的HBv4和HX系列实例、以及新的HBv3实例全面上市。Azure还称,性能最高可较市面基准提升5.7倍。

AMD此前通过收购Pensando获得DPU技术。此次AMD称,其P4 DPU架构是世界上最智能的DPU,它能减少数据中心的网络开销,并提高了服务器的可管理性。AMD的Pensando SmartNICs是这种新数据中心架构不可或缺的组成部分。

AMD还提到有自己的AI芯片软件,名为ROCm。AMD总裁Victor Peng称,在构建强大的软件堆栈方面,AMD取得了真正的巨大进步,ROCm软件栈可与模型、库、框架和工具的开放生态系统配合使用。

关键词:

下一篇: 最后一页
上一篇: 能否留队?班巴与助教训练 月底不被裁1030万合同将转为全额保障 全球动态

英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型_微头条

能否留队?班巴与助教训练 月底不被裁1030万合同将转为全额保障 全球动态

每日关注!小米12pro相机防抖怎么开

芒果酱神剧_网络红人芒果酱是谁 芒果酱爱露出系列有哪些

世界快资讯:lovestory歌曲_lovestory

每日观察!华数传媒(000156.SZ):将积极探索尝试虚拟人艾珈在品牌宣发、虚拟客服、直播带货等多种场景应用

精选!8年来 她坚持做一件“小事”

携程发布端午假期出游趋势:3小时“飞的”出境游受欢迎 今日热文

破译双色球pdf(破译双色球)-今日热搜

“萌”禽落难,临清警民联手助它“回家” 全球今热点

qq网名英文带翻译伤感_qq网名英文

今日快讯:夜的唯美说说(夜的说说心情简介介绍)

巴菲特效应发威,西方石油股价更坚挺,波动性更低|全球快讯

南京三批次3宗商品住宅用地延期出让 出让时间另行公告

赣粤高速(600269.SH):5月份车辆通行服务收入为2.77亿元-微头条

环球快消息!“颜值经济”又推创业新项目

环球滚动:最新股东户数揭秘:这46股股东户数连降三期

玉门市乡村振兴技能人才培训基地首期培训班开班

每日视讯:收购发票抵扣进项税额_收购发票如何抵扣

最新消息:亲近自然践行低碳生活 宝龙街道开展环保宣传活动

环球热资讯!Cell:我国科学家揭示芸薹属作物抵抗根肿病的新机制

职业教育产教融合方案出炉 哪些专业优先发展 哪些将撤并? 当前观察

芸苔素和复硝酚钠的区别(复硝酚钠和芸苔素内脂有什么区别)

天天视讯!白色城堡:青年医生患者术后脑干出血死亡!路易他们该不该负责任?

每日焦点!交通运输部:5月网约车订单量环比上升4.2%

“穷游”一个月,你能想象有多爽?

京东健康联合公益伙伴发起“追梦妈妈健康关爱行动”|天天观察

四川盛豪地产重整投资人资格一拍流拍 起拍价13.3亿元 最新资讯

今热点:2023“解码凉州文化”海峡两岸暨港澳文化行者研学研习活动走进武威

天天热点评!阿里影业根据股份奖励计划授出约2.32亿股奖励股份

注意防御!茂名又将迎来新一轮强降水 环球讯息

宝马iX1 续航曝光:66.45度电/NEDC 450km

高铁买到餐车了能让换座位吗(高铁买到餐车是因为没票了吗) 全球独家

智己“全程AI舱”发布,智己LS7 Urban Fit30万城市智能通勤标杆智己LS7,28.98万元的起售价极具竞争力

天天视讯!怎么看微博最近访客记录(微博怎么看最近访客是谁)

福建台州市地图_福建台州市属于哪个省 今日热文