英伟达含量为零!华为135B密集模型性能比肩DeepSeek-R1:纯昇腾集群训练

密集模型的推理能力也能和DeepSeek-R1掰手腕了? 华为利用纯昇腾集群训练出的盘古Ultra,在数学竞赛、编程等推理任务当中,和R1打得有来有回。 关键是模型参数量只有135B,整个训练过程零英伟达含量,而且没有出现损失尖峰。 通过改进的模型架构和系统优化策略,盘古Ultra拥有优异的性能表现...

地球将变回终极盘古大陆!超级计算机算出人类灭绝时间

2月20日消息,地球会一直适合人类居住吗,显然不是。 最近发表在《自然》上的一项研究显示,地球将在2.5亿年后重新变回 Pangea Ultima(终极盘古大陆),气温上升、火山爆发以及严酷的气候让地球不再适合生存,包括人类在内的哺乳动物将迎来灭绝。 英国布里斯托大学科学家通过超级计算机模拟了这一情...
  • 1
  • 共 1 页
微信二维码