“机器人都去写诗了，人类还在洗碗”

　　*本文为《半月谈内部版》2024 年第 4 期内容

　　“我们希望机器人帮助人类扫地、洗碗，是因为人类要去写诗、画画。现在机器人都去写诗、画画了，人类却还在扫地、洗碗。”

　　网上的这个段子听上去搞笑，却暗含对人工智能的深层追问：生成式人工智能飞驰，带来的推背感固然令人兴奋，但人类究竟需要怎样的智能？“规模化”的大模型之路能否带我们去往那个理想之境？

　　一年多来，看涨大模型的声浪已经很高。这一次看看热闹之外的另一面，看看里面隐藏几多陷阱几多“坑”。

　　后发者陷阱

　　春天是人工智能故事密集的季节。GPT4 发布一周年之季，Figure01 成为第一个“拿起苹果”的人形机器人。这一天距离被视作“世界模拟器”的 Sora 诞生还未满月，OpenAI 和 Figure 官宣合作仅过去 13 天。

　　国内，“百模大战”依旧激战正酣。大模型卷出了新高度，一边“卷参数”、一边“拼落地”，消费电子厂商竞相把大模型装进手机，技术与产品加速迭代。多方红利释放下，产业似乎一片向好。但模型与模型之间，更多的是趋同。模型林立、参数浩瀚，但剥开外壳，想要找到够用的、扛打的、鹤立鸡群的，其实不太容易。

　　从 GPT 到 Sora，同样的问题又一次摆到国内厂商面前：如何追赶、如何复现。每一次现象级“王炸”问世后，扎堆跟随成为不少从业者的路径依赖。

　　这种习惯由来已久。过去很长一段时间，是后发优势让我们尝到了甜头。后发者引进先发者的技术和经验，能避免大量试错纠偏成本以获得更快发展。毕竟自己搭梯子去摘高处的果实费时费力，还是“低垂的果实”捡起来多快好省。

　　然而，成长期的大模型，像鱼需要水一样等待算力、数据、资本、人力、能耗的投喂。这些因素过半受制于人或滞后于人时，后发劣势就会逐步显现。此时，先发者兴许早已坐收渔翁之利。

　　2023 年 7 月 6 日，在 2023 世界人工智能大会展会现场拍摄的特斯拉机器人。方喆摄

　　1848 年，美国加利福尼亚发现了金矿，无数淘金客从世界各地涌向西海岸。10 年过去后，大部分淘金者不仅没有发财，反而流离失所，而金矿旁边卖铲子的人最终得到了暴利和财富。

　　如今，大模型这波热潮，还没真正让多少人尝到实惠，但“卖铲子”的英伟达如同大象坐上火箭，率先成为赢家。出门走一走，几个创业者中总有一个在做大模型。有句话说，大模型创业者睁开眼就能看到对手。但今天，特别是在越发细分的 AI 级别芯片市场中，英伟达已经没了对手。

　　路线陷阱

　　站上风口的大模型光芒有多耀眼，其他技术路线的背影就有多落寞。这几年，大模型忙着刷参数、搞“军备竞赛”，但打败它的往往不是大模型。

　　时下最热的是自回归生成式路线，即大数据、大模型、大算力的“暴力美学”。从 GPT 到 Sora，都是这一路线的代表产物。它的最大信仰是“规模”（scaling law）——“有疑问时，那就扩大规模”“如果还不够好，那就扩大规模”。

　　过去一年，“暴力美学”连赢两次，但这条路值得我们集体梭哈吗？

　　回溯技术发展史，路线之争一直伴随着人工智能的发展。没有一种路线始终独占上风，而是螺旋式推动技术向上走。另一方面，选择“暴力美学”需要算力的优势。而我们，算力遭到掣肘；投资，不比 3 年前充裕；数据，质量和数量是否够用有待时间检验。200 多个（可能更多）大模型在嗷嗷待哺，等待无止境的算力投喂。与能够把一万张 GPU 连起来用的公司相比，时间窗口正不断错过。

　　大模型的尽头是 AGI（通用人工智能）吗？至今，大数据、大算力炼出的大模型，实现的仍是小任务：回复一段话、做一段视频。这些任务如果交给人类大脑，也许只消耗 25 瓦的功率，但交给大模型之后，这个计算量就需要把一万张 GPU 连成串……这是“大数据、小任务”与“小数据、大任务”的不同。当我们琢磨起自己的每一个闪念、每一个行为是如何产生，其实不难发现，一些重要的任务、重要的功能根本无法在规模上无限扩展。

　　前者好比“鹦鹉学舌”，模仿人说话，既无法解释也不能理解。后者好比“鹦鹉喝水”，复杂架构，无需很多数据，却能实现感知、认知、推理、学习、执行等行为。

　　事实上，先发者已在看不见的地方，分散布局多点开花。后发者却信了风口造神的神话。

　　眼下，大模型建设如火如荼，越做越大，也越来越“贵”。最新的 AI 芯片一颗已经超过 3 万美元，还不是想买就能买得到。一个百亿级参数的大模型每天的用电量相当于 1.7 万个家庭的日用电量总和。“暴力美学”不烧脑，但真烧钱啊。

　　哪怕这条路追得起，跟随的人也总在雾里看花，风口来了一哄而上、泡沫破了一哄而散。因为不知其所以然，所以既不懂得什么应当舍弃，也不知道什么时候应当停下。

　　认知陷阱

　　向前看，人类依然期望在硅基上创造一个“人类镜像”。AGI 的终极目的依然是让计算机像人类一样智能。AI 也依然是那个改变“我们是谁、我们能做什么、我们成为什么”的技术。但仍有相当多的问题没有形成共识。

　　什么是智能？是数据海洋里的涌现吗？相比于有问才有答的聊天界面，人类是实境生物。人的生命力源自改造世界的实践，AGI 的实现终将建立在与真实世界的互动之中。

　　而今天，等待人类投喂的大模型，还是一个被动接收的信息压缩器，不依赖内部意图驱动，也尚未形成感知世界、收集信息、归纳整合、提出理论、应用实践、修正理论的闭环。因此，自回归生成的语言、内容仅与人类的语言、创造有表面的相似，却没有内在机制的因果关联。