知识分享

风向变了，科技公司连夜请回人类：不是AI不好用，是Token账单烧不起了

上个月初，风向还吹得正劲。

彼时国内外的科技公司争先恐后地把OpenClaw等AI Agent（智能体）工具接入了自己的业务流水线。这只从2025年12月横空出世的“龙虾”，三个月改了三次名字，一步步长大。在短短四个月内就狂揽超28.5万GitHub星标，创下开源软件历史最高纪录，从开发者社区一路渗透到企业级生产环境。连不懂代码的普通人，都花699块找上门师傅“装虾”，只为体验一把“AI替我打工”的爽感。黄牛代装费用一度炒至上千元，无锡、苏州、深圳等地方政府更是化身“超级天使投资人”，以最高500万元的真金白银补贴算力消耗，全力抢占AI Agent（智能体）产业生态制高点。老板们刷到热搜，两眼发亮，恨不得立刻把这只会干活的AI请进公司。IT部门连夜写接入方案，业务团队摩拳擦掌——有了这玩意，一个人顶十个人用，降本增效的好日子仿佛就在眼前。

一个月后，画风突变。

那些争先恐后上线AI Agent（智能体）的公司，开始不约而同地按下了“下线”按钮。运维团队手忙脚乱地撤掉部署，HR连夜打电话把休假的员工召回来上班。而更具讽刺意味的是，一股逆向潮流悄然涌现——有用户开始付费找人卸载这只曾被视为“数字员工”的AI助手。“周五求安装，周一求卸载。”一位兼职做“龙虾清理”的技术人员在社交平台上晒出了自己的新业务。

原因说出来让人哭笑不得：不是AI Agent（智能体）不好用，而是太费Token了。

一、“数字牛马”变成“算力刺客”

浏览社交平台上那些卸载的理由，简直像一部荒诞剧的台词：有人一觉醒来欠费数百美元，有人因为AI失控被迫删光了邮件，有人发现自己的API密钥被恶意技能窃取。深圳一位程序员分享了自己的噩梦经历：“安装OpenClaw第三天，凌晨收到账单——API密钥被盗，3天消耗了1.2万元Token费用”。还有一位大数据工程师，一个晚上用OpenClaw闲聊了几句、查了下数据，100万Token就没了还欠了费——“如果不是邮件提醒我就要破产了”。

从一“虾”难求到“虾”手不及，这场被戏称为“养龙虾”的AI热潮，在极短的时间内完成了从神话到笑话的荒诞轮回。但真正让所有人心疼的，不是被盗的密钥，而是Token这个看不见的“吞金兽”。

在英伟达创始人黄仁勋看来，Token早已不是聊天框里吐出来的几个字符，而是“下一个商品”。他甚至说，未来的工程师都要有自己的“年度Token预算”——一个高薪工程师一年下来没消耗多少Token，反倒显得奇怪。Token将继工资、奖金、期权之后，成为“第四种薪酬”。国家数据局干脆给Token取了个正式的中文名：词元。到2026年3月，中国日均词元调用量已经突破了140万亿——这个数字在2024年初还只有1000亿，两年时间涨了一千多倍。OpenRouter平台的数据更惊人：2025年3月24日当周的Token调用量为1.62万亿，到了2026年3月9日当周，这个数字已经涨到16.90万亿，一年翻了10倍。

听起来很宏大，但落到一家普通科技公司的账单上，故事就没那么浪漫了。

OpenClaw这类AI Agent（智能体）的核心工作方式是：你给它下一个指令，它背后的大模型开始疯狂运转。而大模型每一次运转，都在以Token为单位计费。更关键的是，你以为一次指令只消耗一次Token，但实际上它是三头在吃你的资源。

第一头：用户端输入的Token。 每次你给AI Agent（智能体）发指令，不管是打字还是语音，这些内容都会被切分成Token送进模型。你让OpenClaw“帮我整理一下今天的邮件”，这句话本身可能只消耗几十个Token。但问题是——OpenClaw为了实现连续任务和记忆对话，每一轮请求都会把完整的历史对话、系统提示、记忆文件、工具配置全部重新提交给大模型。一位开发者实测发现，某次普通对话中，仅系统配置文件（CLAUDE.md、skills、memory）就占了35,000个Token——这是每次对话一开始就要烧掉的固定开销，占整次请求Token总量的28%。更隐蔽的是它默认的心跳机制：每30分钟向模型发送一次“检查新指令”的请求，每次唤醒都会触发一次完整的API调用。也就是说，哪怕你什么都不做，让它在后台挂一天，它也会自动产生几十次API调用。有人算过一笔账：一次心跳消耗约37,500个Token，按主模型定价算下来一次就是0.11美元，一天6次就是0.66美元，一个月光“证明我还活着”就要花掉20美元。调查数据显示，个人用户若全天候开启OpenClaw心跳机制，单日Token费用可高达700至1700元人民币。

第二头：模型端思考的Token。 这是最容易被忽略却最烧钱的部分。OpenClaw接到指令后，不会直接干活，而是先“思考”——拆解任务、调用工具、分析结果、迭代优化。普通AI是一问一答的单次交互，而AI Agent（智能体）是“链式消耗”：收到一个指令后自动拆解、验证、纠错，单次任务可能触发数十次API调用。更糟的是，当模型思考不足导致输出质量下降时，它会崩溃——生成错误结果、被中断、不断重试，并在后续修正中消耗大量Token，而这些修正原本在第一次就正确思考的情况下根本不需要。智谱CEO张鹏曾在中关村论坛上直言：完成一个Agent任务所需要的Token量，可能是回答一个简单问题时的十倍甚至百倍。业内人士测算，AI Agent（智能体）每次执行任务需要多轮推理、反复调用工具、读取大量上下文，相比传统聊天机器人，Token消耗动辄放大数十倍甚至上千倍。

这里有个容易误导大家的问题需要澄清一下，我们平时在网页上使用大模型回答问题的时候，不点击深度思考模式是否就意味着模型不用思考，直接回答问题了呢？

绝对不是。 大模型的工作方式决定了它每一次生成回答，都需要在内部完成复杂的计算和推理。你可以把它理解为：

不开启深度思考：模型像一位经验丰富的专家，听完问题后，在脑子里快速想清楚，然后直接说出答案。这个过程对用户是不可见的。
开启深度思考：模型像一位正在做复杂数学题的学生，会把草稿纸上的每一步推导过程都写出来给你看。

所以，所以当你调用模型API的时候，虽然没有开启深度思考模式，但是模型依然在内部进行着思考过程，消耗了大量的“内部思考Token”，只是这个过程你看不见而已。（也就是上一轮提到的、计入输出Token的那部分计算资源），只是这些思考痕迹没有被打印在聊天界面上。

第三头：最终输出的Token。 这是你真正看到的部分——AI给你的回复。但你以为这是全部，其实这不过是冰山露出水面的一角。一位博主在实测中发现，当你向OpenClaw发送“帮我优化这段代码”这么一条简单指令时，你以为自己在进行一次API调用，但后台实际触发了多次独立的模型请求：第一次是解析意图，第二次是生成任务步骤，第三次是调用工具分析代码，第四次是生成回复，第五次是为对话生成标题和标签，甚至再推荐几个可能的追问建议。用户只看到一次回复，账单却在后台无声地蒸发。

一位中小企业主在网上分享了他的经历，这个案例后来被反复引用，几乎成了“养虾血泪史”的经典教材：团队五个人共享一个OpenClaw实例，设置自动执行测试用例和代码审查。第一个月结束时，他们预期的成本是100美元，实际账单却接近800美元。“最恐怖的是，”他在社交平台分享，“你根本不知道钱是怎么花掉的，就像家里有个看不见的水龙头在一直滴水”。还有一位中国开发者在阿里云开发者社区披露：使用OpenClaw进行自动化任务处理，2个小时就消耗了100美元的Token费用。更有极客实测执行复杂程序调试任务，一天就能烧掉10亿个Token，成本达数万元。小米MiMo大模型负责人罗福莉在X上发帖直指，OpenClaw这类第三方Agent是“Token的虚假狂欢”，她痛批它们对算力的粗放型消耗——上下文管理混乱、缓存命中率低下、多轮对话中充斥着大量低价值的重复计算。在她看来，OpenClaw这类工具像一辆没有经过工程优化的原型车，每公里的油耗是正常车辆的十倍。

二、有人靠AI Agent省钱，有人用AI Agent烧钱

那是不是说AI Agent（智能体）就完全不能用了？倒也不是。关键在于——业务的类型。

第一类：算得过来账的业务

有些业务用AI Agent（智能体），确实能降本增效。典型的比如文档摘要与批量处理：一位私募基金研究员向记者展示了他的OpenClaw后台账单——过去一周，仅用于自动化研报摘要和舆情监控，就消耗了超过1200万Token，API费用折合人民币近千元。听起来贵？但对比他本人每天花四五个小时翻阅研报的时间成本，这笔Token支出反而划算。一份上百页的合同或研报，人工逐页翻看可能要花一整天甚至更久，而AI能在几分钟内读完并提取关键信息。Token消耗虽然也有，但相比一个研究员或律师的时薪，这笔账是算得过来的。

客服系统的第一轮筛选也是公认的“划算”场景。让AI Agent（智能体）先过一遍用户的常见问题，把简单重复的咨询——比如“怎么退货”“几点开门”——挡在外面，复杂问题再转人工。这类场景下AI回答的问题大多是高频、标准化的，Token消耗可控，而一个客服座席的月薪远高于Token账单。关键在于合理分流：别让AI去处理需要复杂判断和情绪安抚的投诉，那些还是留给真人。

Intuit的转型案例就很能说明问题。这家公司在ChatGPT发布后匆忙推出了聊天式AI助手，结果遭遇失败。随后公司进行了为期九个月的战略转型，通过观察客户实际工作流程，发现手动转录发票等重复性劳动才是真正的痛点，于是决定用AI Agent（智能体）自动化这些任务，而不是强加新的聊天行为。调整之后，AI日使用率从20%跃升至71%，43%的员工表示每天节省了最多两个小时。这个案例说明：AI要替代的，应该是那些让人痛苦的低价值重复劳动，而不是那些需要人类判断力的核心工作。

第二类：越用越亏的业务

但更多的业务，用上AI Agent（智能体）之后成本不降反升。

第一种高风险场景：多轮复杂判断的工作。 代码审查和测试用例自动执行就是最典型的例子。前面那位中小企业主踩的就是这个坑——五个人共享一个OpenClaw实例，预期月成本100美元，实际800美元。原因在于，代码审查需要AI反复理解上下文、调用多个分析工具、生成多轮反馈，每一步都在燃烧Token。更复杂的是，在程序调试场景中，AI Agent（智能体）可能会陷入反复试错的循环——写一段代码、测试、发现bug、重新写、再测试……每一次循环都在消耗Token，而一个有经验的程序员几眼就能看出问题所在。

即使是Anthropic自己官方推出的代码审查工具，成本也不低。根据官方数据，Claude Code Review按Token使用量计费，单次Pull Request审查的平均费用在15到25美元之间（约合人民币108到180元），这个价格是指每次代码提交的审查费用。对于大型开发团队来说，每天可能有数十甚至上百个PR，一年下来光代码审查的Token费用就可能高达数十万美元。虽然相比传统人工审计5万美元一次的费用便宜了2000倍，但对于日常高频使用的场景来说，这笔持续开支依然不容忽视。

第二种高风险场景：高频调用但低价值的业务。 把OpenClaw接入QQ群当机器人管家就是一个典型的反面教材。看似很酷，但每一条群消息都要触发AI去判断要不要回复、怎么回复。在一个200人的活跃群里，每天可能有上千条消息，AI每次都要读取上下文、判断意图、生成回复，Token消耗迅速失控。更糟的是，群聊场景中大部分对话对业务没有实际价值——员工在闲聊，AI却在认真烧Token。

还有一个被广泛讨论的失败案例：深圳华强北的一位档口老板花800元请人装了“龙虾”，希望能自动帮他管理拼多多和淘宝店铺。结果AI连“满199减20”和“第二件半价”都分不清楚。老板无奈地吐槽：“折腾了三天，最后发现还不如我自己用手机回复来得快”。电商促销规则灵活多变，需要人工判断和调整，AI Agent（智能体）不仅没帮上忙，反而让老板损失了三个晚上的睡眠和800元的安装费。

某科技公司产品经理的经历同样触目惊心：他试图利用“龙虾”替代实习生进行自动化运营，不到一周时间API账单便飙升逾3000元，调用成本远超雇佣实习生薪资。这说明一个残酷的现实——在某些场景下，用真人反而更便宜。

三、大模型厂商开始“收网”

用户感觉养虾贵，其实只是冰山一角。水面之下，大模型厂商正在经历更残酷的现实——他们也在失血，而且失血速度远超预期。

Anthropic的订阅制本来是给普通用户“包月刷网页、聊聊天”的福利，结果被OpenClaw这类高强度Agent彻底玩崩。比如Claude Max每月200美元的订阅，被用户用龙虾跑24小时循环、工具调用，直接烧出价值5000美元的算力。有行业分析师估算，OpenClaw用户通过订阅套利产生的API消耗，与实际支付价格之间存在超过5倍的价差。

当Anthropic被全球开发者用龙虾疯狂薅羊毛，结构性亏损直接摆上桌面。所以4月4日，Anthropic的封禁来得又快又狠——Claude Pro、Max、Free所有订阅额度，一夜之间全部和OpenClaw说再见。用户只能老老实实走API，按Token一分一厘地付钱。更有消息称，Anthropic拟对第三方工具调用额外收费，这意味着开发者将面临超出既定预算的、难以预估的成本。

与此同时，国内大模型厂商也开始了集体涨价。从2025年的“降价狂欢”到2026年的“集体提价”，画风急转直下。腾讯混元大模型最高涨价463%，输入单价从0.0008元/千tokens调整为0.004505元/千tokens，输出价格也从0.0024元上调至0.0135元——涨了四倍多。阿里云算力卡产品上涨5%到34%，百度智能云也涨了5%到30%。智谱API平台的Token价格在2026年一季度上涨了83%，甚至在4月再度提价10%，其编程场景缓存命中Token单价已接近Claude Sonnet 4.6的水平。

“两年前大模型厂商还在打价格战，现在终于到了收割期。”一位业内人士感叹。对于那些高频调用Token的中小AI创业公司来说，Token成本直接决定企业能不能活下去——大模型调用成本翻倍，一个月就要多几十万元甚至几百万元的支出。

Gartner预测，到2027年底，超过40%的自主式AI项目将被取消，核心原因就是成本失控、商业价值不清、风险管控不足。这个预测如今看来并非危言耸听——在OpenClaw爆火短短几个月后，第一批“养虾人”已经开始大批量撤退。

四、人工仍然是更优选的，但不是永远

所以那批科技公司在用了一个月OpenClaw之后，连夜下线、召回员工，并非AI技术不好用。而是Token经济这笔账，目前在很多业务场景下根本算不过来。

这像极了经济学里的“杰文斯悖论”：技术越高效，资源总使用量反而可能更大。大模型本身在进步，单位Token的成本也确实在下降——2023年初全球Token成本约30美元/百万，到2026年初已经降到0.2美元/百万。但AI Agent（智能体）干活的“胃口”比聊天大得多，智谱CEO张鹏解释得很清楚：Agent在面临复杂任务时，模型思考的链路很长，Token消耗量非常大。单价在降，总量却涨得更快，最后落到企业头上的账单不降反升。

这就是为什么那些连夜撤回的公司，虽然看着像是“退步”，但恰恰是在做一道清醒的经济题。

当然，行业也在积极寻找解法。有技术博主通过6项配置优化——包括设置上下文Token上限、缩短上下文裁剪TTL从7天改为6小时、让心跳使用便宜模型加轻量上下文——将OpenClaw的Token消耗降低了40%。把上下文截断策略从“软限制”改为“硬截断”后，长会话的Token消耗下降了40%。但这些优化本质上都是“止血”，而非“治本”——它们说明了一个事实：当前的AI Agent（智能体）架构在工程化方面还有巨大的优化空间。

AI Agent（智能体）不是不能用，而是要看准了用。 简单重复、判断链条短、替代成本高人工的场景——比如文档摘要、批量分类、客服初筛——AI Agent（智能体）是一把好手。复杂多变、需要多轮判断、人工一眼就能干完的活——比如代码审查、自动化测试、需要灵活应变的电商运营——让AI Agent（智能体）来干就是花钱买折腾。那些真正留下来的AI应用，无一不是经过了Token成本的精算：用在哪里，用到什么程度，消耗多少，产出多少，每一项都要落到同一张表里。正如中关村科金技术负责人所说：“对企业来说，OpenClaw离稳定可靠的生产力仍有距离。在企业级市场，稳定性和可靠性是生命线”。

说到这里，如果你还不知道如何正确地使用AI Agent（智能体）来提高工作效率——不是那种“一觉醒来欠费数百美元”的野路子玩法，而是真正懂得算Token账、懂场景适配、懂工程优化的专业用法——这里有一条值得考虑的路径。

工信部教育与考试中心推出了《AI Agent工程师》职业能力证书，分为初级、中级、高级三个级别，每个级别的课程内容都对应不同的人群和岗位需求。最关键的是，课程适合零基础人群，所有内容都是从零基础开始搭建的。

•初级课程：涵盖行业市场分析、未来发展方向等宏观内容，适合做市场和商务的人群——让你先看懂AI Agent（智能体）这盘大棋，不至于一上来就被各种“虾言虾语”带偏方向。

•中级课程：包括主流的图片和视频生成技术，适合做设计和产品的人群——从工具实操入手，把AI变成创意加速器，而不是无底洞式的Token焚烧炉。

•高级课程：包括主流的AI Agent（智能体）工具在各行业的深度应用，适合日常办公和细分领域的岗位人群——真正学会什么时候该用Agent、什么时候该用人工，怎么用最省Token、怎么调最高效。

在学习完课程后，即可参加由国家工信部教考中心组织的全国统一线上考试。考试通过后，将获得由工信部教考中心颁发的职业能力证书。指定报名机构为成都深度智谷科技有限公司，有意者可以搜索人工智能实训学习平台或深度人工智能教育官网查询报名。在学习技术的同时，还能拿到一份高含金量的职业能力凭证——对于想进入这条赛道、又不想被Token账单割韭菜的普通人来说，这或许是一个比盲目“养虾”更稳妥的起点。

Token终究会越来越便宜，模型也终究会越来越高效。但在那一天真正到来之前，认清什么业务该交给AI Agent（智能体）、什么业务该交给人工，比盲目追风更重要。那些连夜下线AI Agent（智能体）的公司，不是不爱AI了，而是终于学会了怎么算一笔AI的账。从狂热到冷静，从“装虾”到“卸虾”，这场荒诞又真实的轮回，或许是AI产业从泡沫走向成熟的必经之路。

留下联系方式

我们将尽快与您联系

我们的业务

高校人工智能实验室共建