“大模型的天花板很高,现在距离理想情况还差非常远”,9月11日,百度CEO李彦宏的一则内部讲话曝光。他直言外界对大模型有三个认知误区,“不同的模型之间差距不是越来越小,是会越来越大的”“算力是决定大模型成败的一个关键因素,开源模型解决不了这个问题”“智能体是大模型最重要的发展方向是个非共识”。
风口上的大模型话题常谈常新,开源闭源之争、榜单价值等都是由头,早期就看准大模型赛道的李彦宏乐于分享自己的看法。
“每一个新模型发布时,肯定都想说自己有多好,每次都去跟GPT-4o做比较,拿测试集或者弄一些榜单,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了,但这并不能证明这些新发的模型跟OpenAl最先进的模型相比已经没有那么大的差距了”,李彦宏认为外界对大模型有误解。
在他看来,差距体现在能力和成本方面,“从榜单或者测试集上看,你觉得能力已经很接近了,但到实际应用中还是有明显差距的。我不允许我们的技术人员去打榜,真正衡量文心大模型能力的是,你在具体应用场景当中到底有没有能够满足用户的需求、有没有能够产生价值的增益,这是我们真正在乎的”。
价值和场景也常被同行提及。“企业业拥抱AI,不是追求技术的酷炫,也不是‘拿着锤子找钉子’,核心是要解决商业上的痛点。去年(2023年)以来,大家对大模型有些过于乐观,认为可以快速改变世界。最近又有一些悲观,觉得大模型好看不好用。‘短期高估进度,长期低估效果’,其实都不可取”,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生站在客户的角度说,场景是解锁AI的关键钥匙。企业最好是能够结合独有的专业数据,在已有工作流和业务场景中,寻找降本增效的机会,然后持续改进和长期投入。
开源闭源则是争论已久的话题,作为闭源代表,李彦宏再次做对比,“一个模型除了能力或效果之外还要看效率,效率上开源模型是不行的”。
“闭源模型准确地讲应该叫商业模型,商业化的模型是无数个用户或者说客户在共享同样的资源,在分摊研发成本、分摊推理用的机器资源和GPU(图形处理器),而开源模型需要你自己去部署一套东西。”他进一步说,“在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。但是这些东西在大模型时代都不成立,大模型时代大家经常讲的是GPU有多贵,算力是决定大模型成败的一个关键因素,开源的模型给你送算力吗?它不给你送算力,怎么能够让算力高效地被利用?开源模型解决不了这个问题。”
两个月前,李彦宏在2024世界人工智能大会上表态:最看好智能体。9月初,多位企业家和专家在2024·Inclusion外滩大会认为智能体是新型终端形态,孕育新一代超级平台。
围绕这个日渐升温的话题,李彦宏再次发声,“为什么我们这么强调智能体?因为智能体的门槛确实很低,智能体提供了一个非常直接、非常高效、非常简单的方式,在模型之上构建智能体是相当方便的”,他自问自答。
他认为,“‘智能体是大模型最重要的发展方向’这个判断,其实是一个非共识。到今天为止智能体还不是共识,像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多”。