华为:昇腾AI计算平台训练出准万亿MoE模型|界面新闻 · 快讯

DANBgkqhk 11 0

5月30日消息,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。

  • 美国上诉法院暂时恢复实施特朗普政府关税政策|界面新闻 · 快讯
  • 巴厘岛、科莫多等地溺亡事故多发,中使馆发布安全提醒|界面新闻 · 快讯
  • 和解将影响中东,库尔德工人党宣布结束与土耳其政府斗争|界面新闻 · 天下
  • 《中国金融政策报告2025》:金融体制改革有五大重点丨2025五道口金融论坛|界面新闻
  • 俄摩尔曼斯克州州长确认该州遭无人机袭击|界面新闻 · 快讯
  • 市场持续否定“美国例外论”,美国资产仍面临海外买家抵制|界面新闻 · 天下
  • 贵州果瓦乡山体滑坡搜救出2人,已无生命体征|界面新闻 · 快讯
  • 海信Vidda电视被判诋毁小米,相关负责人:将补足营销方面的不足|界面新闻 · 科技
  • 盘中必读|今日共76股涨停,三大指数震荡反弹,算力概念午后大涨|界面新闻 · 证券
  • 巴菲特透露决定卸任CEO的真实原因|界面新闻
  • 巴黎世家全球最大旗舰店在北京启幕,富士胶片跨界美妆产品|是日美好事物|界面新闻 · 时尚
  • 高盛:沪深300还有17%上涨空间|界面新闻
  • 李家超称香港将部署为内地企业提供供应链服务,突破美国封锁|界面新闻 · 快讯
  • 商业地产企稳回暖,内地收入飙升助力领展全年收益同比增长4.8%|界面新闻 · 地产
  • 文华东方再拓巴黎版图,阿联酋航空推出快递服务 | 一周旅行指南|界面新闻 · 旅行
  • 抱歉,评论功能暂时关闭!