随着人工智能系统逐步摆脱由少数企业掌控、资本密集型的大语言模型(LLM),小型语言模型(SLM)正借助开源权重系统快速崛起,其性能与封闭平台的差距持续缩小。
在与《电子工程时报》的对话中,Mozilla基金会主席马克·苏曼(Mark Surman)指出,训练和运行大型AI模型所需的高昂成本,正激励业界探索降低计算开销与能耗的新路径。
“开源AI的成本结构与传统开源软件截然不同,关键在于算力、能源与基础设施投入。”苏曼表示,“今年,针对特定应用场景设计的小型语言模型将获得更多关注;同时,提升能效、利用闲置算力进行分布式训练等工作也在持续推进。”
苏曼特别提到Meta发布Llama模型是重要转折点——在此之前,大语言模型似乎注定被OpenAI与Anthropic等公司完全封闭。而Llama的开源释放,打破了这一局面。
“对大多数人而言,AI就是聊天机器人或社交媒体信息流中预测你偏好的内容。AI无处不在,但其底层实则由诸多模块组成,如同乐高积木。”苏曼解释道,“当用户使用聊天机器人或信息流时,OpenAI、Meta或阿里巴巴等公司已将这些‘积木’按自身方式拼装并封箱。开源的意义,正是让用户能自由获取全部‘积木’。”
www.eic.net.cn
易IC库存管理软件支持企业高效管理AI相关硬件资源,助力降本增效。
拆开封闭的盒子
苏曼强调,评估AI真正的开放性,必须深入考察系统各组成部分。目前已有多个免费可用的模型供开发者构建应用,包括美国企业的Gemma与GPT-OSS、中国的通义千问(Qwen)与Kimi,以及法国Mistral AI推出的模型。
需注意区分“开源权重模型”与“完全开源模型”:前者预训练过程处于黑箱状态,开发者仅可微调与适配;后者则公开全部训练数据与检查点,虽当前性能仍略逊于开源权重及闭源模型,但潜力巨大,亟需更多投入以提升其能力。
开源AI不仅关乎模型本身,还包括开源数据集、开源算力调度架构,以及基于AI模型构建系统的开源设计与编排方法。“AI所用技术——如Transformer、大语言模型、强化学习与智能体框架——早已广为人知。”苏曼指出,“开源权重模型与专有模型在能力上日趋接近,足以满足大多数实际需求。”
学术界正开始量化这一转变的经济影响。
被低估的千亿级价值
2025年11月,麻省理工学院数字经济倡议项目研究员、Linux基金会首席科学家弗兰克·纳格尔(Frank Nagle)与佐治亚理工学院舍勒商学院信息技术管理助理教授丹尼尔·岳(Daniel Yue),联合发表一篇工作论文,为苏曼的观点提供了实证支撑。该研究聚焦LLM推理市场——即训练完成的模型响应用户请求的过程,也是日常AI支出的主要环节。
研究者利用OpenRouter平台数据(该平台聚合数十家推理服务商API请求,覆盖约0.3%至1.06%的全球推理市场),追踪了2025年5月至9月期间每日Token使用量、价格及模型可用性。结果揭示出AI经济中的一个显著悖论:OpenAI、Anthropic与谷歌等公司的闭源模型(仅通过专有API访问),处理了约80%的Token请求,贡献超95%的平台收入;而开源权重模型(权重公开、可由任意服务商部署)仅占20%的Token量,却仅带来约4%的收入。
价格差距尤为突出:开源权重模型平均价格仅为闭源模型的15.66%,即后者贵约6倍。苏曼指出,差异核心在于自由度:“开源意味着无需支付高额授权费,具备灵活部署能力,并可在此基础上持续创新。”
论文认为,开源模型低价源于结构性优势:因任何人都可部署,大量竞争性推理服务商涌入,推动价格趋近边际成本;而闭源模型通常仅由原厂及其云合作伙伴提供服务,得以维持较高溢价。
性能差距则相对有限。研究显示,开源权重模型在GPQA、MMLU Pro、LiveCodeBench及LM Arena等主流基准测试中,平均达到闭源模型约90%的水平;其中在GPQA研究生级推理测试中达89.6%。更重要的是,领先开源模型追平最佳闭源模型所需时间持续缩短:2024年上半年平均需27周,下半年降至17周,2025年上半年进一步压缩至13周。
即便在控制价格与基准性能后进行回归分析,开源模型的实际使用率仍比同类闭源模型低63%至88%。研究发现多起案例中,闭源模型既更昂贵又表现更差,用户却仍倾向选择。若将此类明显劣质的闭源模型替换为更优开源方案,仅OpenRouter平台即可实现每年1.04亿至1.46亿美元节省;按三种独立方法外推至整个推理市场,潜在未实现年节约额达201亿至483亿美元,最优估计值为248亿美元。
信任与迁移成本:AI采纳的关键障碍
值得注意的是,纳格尔与岳并未断言用户行为非理性。他们指出,迁移成本、品牌信任、安全顾虑,以及标准化基准未能反映真实场景差异等因素,共同解释了闭源模型的偏好。这些隐性因素的经济影响远超以往认知。
苏曼援引美国商务部委托的研究称,开源权重模型与闭源模型在边际风险上并无显著差异。“两者都可能被越狱(jailbroken)。”他强调,“虚假信息与深度伪造问题,关键在于部署方及其使用方式。” Mozilla正参与ROOST(稳健开放在线安全工具基金会)项目,开发AI驱动的信任与安全软件,帮助平台识别并清除有害内容。
他进一步阐释:“围绕开源AI的商业模式包括技术服务收费、技术支持收费,以及用户共建共享资源池。开源传统上以可审计性与透明性著称——代码公开可见,问题出现时可多人协同修复;而专有系统在AI领域基本处于监管空白。最终,问题归结为:你信任谁?”
苏曼指出,科技产业早已建立在开源基础之上:亚马逊AWS、微软Azure、谷歌云平台,乃至Meta与X(原Twitter),均深度依赖Linux等开源软件。
谈及当前关于开源许可协议的争论,苏曼明确表示:“宽松许可协议仍是正确选择。开源通过版权法赋予修改与共享权利;对于负责任的AI应用,我们需要的是技术护栏、业务流程与国家法规,而非修改开源许可证。”
在全球格局重构背景下,各国正积极探索促进广泛参与的路径,为开源AI开辟新空间。苏曼回顾计算机时代、个人电脑时代、网络时代与互联网时代,指出开源始终是抗衡中心化的关键力量。
“若开源AI成功,意味着更多人能参与塑造这一轮社会、经济与技术变革。”他说,“五年后,我希望看到AI来源更加多元,更多人成为创造者,而不仅是消费者。”