模型降价大战——曾经小甜甜,如今牛夫人 #
昨天收到了这样一条短信:
【百度智能云】尊敬的百度智能云千帆用户您好,5月21日起,千帆大模型平台ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny系列模型预置服务全面免费,欢迎您前来体验…
手握短信,不禁让人唏嘘:遥想当年 OpenAI 推出 ChatGPT 的时候,大模型 LLM 的表现惊艳全世界, 百度很快推出了类似的产品文心一言,那时国内几乎人人都想尝试一下,成群的公司甚至不局限于 IT 领域的公司,都迫切希望接入百度的文心,看看这大模型究竟能做哪些事情。
然而炙手可热的东西,岂是人人都能用上的?百度云借着这波大模型的热度顺势签约了不少公司,着实赚足了眼球和钱。当时要想用上文心,还需要签订额外的合同,甚至需要预缴一部分金额。毕竟狼多肉少,“有诚意” 才能用得上。
然而仅仅短短一年过去,大模型已经进入了降价狂潮:
- 深度求索(DeepSeek):第二代 MoE 大模型 DeepSeek-V2
- 智谱 AI:大模型 GLM-3-Turbo
- 字节跳动:大模型豆包通用模型 pro-32k
- 阿里云:通义千问系列的 9 款大模型,包括主力大模型 Qwen-Long 和最强大模型 Qwen-Max
- 百度:文心大模型系列的 ERNIE Speed 和 ERNIE Lite
- 科大讯飞:大模型讯飞星火 spark Lite
- 腾讯云:大模型混元-lite
当年的高攀不上的“小甜甜”们,如今都降价成了“牛夫人”,要么价格打到骨折,要么全面免费。因为厂商都很清楚,如今这些大模型的质量,希望大家花大价钱去买,完全不现实,身边还有那么多“友商”卷上了天。能收到点儿用户的真实数据,也算当初那些训练模型的显卡没白缴电费 🤣
大模型的到来虽然着实让人惊艳,一夜之间,具备理解能力的不再是人类这碳基生物的专项,硅基生物也可以尝试一下。然后现在来看,这“力大砖飞”的 LLM 更像是一个过度产物,并非最终的产品。 它貌似能做很多事情,但还不够,远远不够。。。
当年 iPhone 和 App Store 开启了移动互联网的浪潮,全球的企业都看到了一条清晰的路径走上了移动互联网;然而如今 LLM 却并未给出这样清晰的路径,大家也都清楚这个 AGI 背后的重要意义,谁也不想落下,甚至那些普通人,也心甘情愿的手里握着钱,心甘情愿的被 AI 讲师们收割着。
然而不清晰,背后并不意味着此事微不足道,更可能的是:大的还在后面,LLM 作为敲门砖还在天上飞——砖不值钱,但门开了,大的就来了。