模型降价大战——曾经小甜甜，如今牛夫人 #

昨天收到了这样一条短信：

【百度智能云】尊敬的百度智能云千帆用户您好，5月21日起，千帆大模型平台ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny系列模型预置服务全面免费，欢迎您前来体验…

手握短信，不禁让人唏嘘：遥想当年 OpenAI 推出 ChatGPT 的时候，大模型 LLM 的表现惊艳全世界，百度很快推出了类似的产品文心一言，那时国内几乎人人都想尝试一下，成群的公司甚至不局限于 IT 领域的公司，都迫切希望接入百度的文心，看看这大模型究竟能做哪些事情。

然而炙手可热的东西，岂是人人都能用上的？百度云借着这波大模型的热度顺势签约了不少公司，着实赚足了眼球和钱。当时要想用上文心，还需要签订额外的合同，甚至需要预缴一部分金额。毕竟狼多肉少，“有诚意” 才能用得上。

然而仅仅短短一年过去，大模型已经进入了降价狂潮：

深度求索（DeepSeek）：第二代 MoE 大模型 DeepSeek-V2
智谱 AI：大模型 GLM-3-Turbo
字节跳动：大模型豆包通用模型 pro-32k
阿里云：通义千问系列的 9 款大模型，包括主力大模型 Qwen-Long 和最强大模型 Qwen-Max
百度：文心大模型系列的 ERNIE Speed 和 ERNIE Lite
科大讯飞：大模型讯飞星火 spark Lite
腾讯云：大模型混元-lite

当年的高攀不上的“小甜甜”们，如今都降价成了“牛夫人”，要么价格打到骨折，要么全面免费。因为厂商都很清楚，如今这些大模型的质量，希望大家花大价钱去买，完全不现实，身边还有那么多“友商”卷上了天。能收到点儿用户的真实数据，也算当初那些训练模型的显卡没白缴电费 🤣

大模型的到来虽然着实让人惊艳，一夜之间，具备理解能力的不再是人类这碳基生物的专项，硅基生物也可以尝试一下。然后现在来看，这“力大砖飞”的 LLM 更像是一个过度产物，并非最终的产品。它貌似能做很多事情，但还不够，远远不够。。。

当年 iPhone 和 App Store 开启了移动互联网的浪潮，全球的企业都看到了一条清晰的路径走上了移动互联网；然而如今 LLM 却并未给出这样清晰的路径，大家也都清楚这个 AGI 背后的重要意义，谁也不想落下，甚至那些普通人，也心甘情愿的手里握着钱，心甘情愿的被 AI 讲师们收割着。

然而不清晰，背后并不意味着此事微不足道，更可能的是：大的还在后面，LLM 作为敲门砖还在天上飞——砖不值钱，但门开了，大的就来了。