
MiniMax闫俊杰:未来一两年模型推理成本还能再降一个数量级,但算力使用还会继续增长

7月26日,在2025世界人工智能大会(WAIC)开幕式上,MiniMax创始人、CEO闫俊杰在主题发言中表示,AI公司并不是重新复制一个互联网公司,AI是一个更基础更根本的生产力,是对个人能力和社会能力的持续增强。“这里有两点比较关键:第一,AI是一种能力,第二是AI是可持续的。”
闫俊杰有一个判断,即“AI 会变得越来越强,而且这种增强几乎是没有尽头的”。
人工智能的强大有目共睹,业界也在讨论如何更好利用好人工智能,那么AI到底会不会被垄断?
闫俊杰在演讲中表示,AI领域一定会有多个玩家持续存在,且AI一定会变得越来越普惠,使用成本也会变得更加可控。“过去一年比较受关注 AI 的排行榜,可以发现最好的模型还是闭源的,但最好的开源模型越来越多,同时也在不断逼近最好的闭源模型。”
“在过去一年半, AI 模型的大小没有发生特别大的变化,即便我们可使用算力更多了。为什么呢?对所有实用模型而言,计算速度是一个比较关键的因素。如果模型计算速度特别慢,就会降低用户的使用意愿,所以所有公司都关注模型的参数量和智能水平之间的平衡。”闫俊杰指出,此前,模型大小增长和芯片的进步速度基本上是成正比的。芯片进步速度是每18个月会翻一倍,模型也会相应保持这样的增长趋势。而现在,虽然大家都有更多的算力了,模型参数却没有变得更大。
那这些增长的算力花在哪呢?
闫俊杰表示,训练层面来看,规模增长的速度在过去半年已经变得比较缓慢,训练单个模型的成本实际上却没有显著增加。这些算力花在做更多的研究跟探索上。拥有非常多算力的公司和没拥有那么多算力的公司,在训练上其实的差异可能不会那么大。没有那么多算力的公司,可以通过持续提升自己的实验设计、提升思考能力和组织形式,让实验探索变得更加高效。
其次是推理,在过去一年,最好模型的推理成本其实是降了一个数量级,通过大量的计算网络系统和优化算法,“我们认为在接下来一两年之内,最好模型的推理成本可能还能再降低一个数量级。总结而言,我们认为训练单个模型的成本不会显著地增加。”
闫俊杰指出,大量创新能让AI研发变成一个没有那么烧钱的行业,但是算力使用还会增加。尽管Token会变得很便宜,但是使用Token的数量会显著增加。去年ChatBot单个对话只要消耗几千个Token,现在Agent单个对话可能消耗几百万个Token,并且因为AI解决的问题越来越复杂,越来越实用,那么用的人也会越来越多。
作者:访客本文地址:https://www.zsclv.com/zsclv/15047.html发布于 2025-07-26 19:08:31
文章转载或复制请以超链接形式并注明出处中首车旅集团