文 |无言
最近AI圈聊得最多的Agent技术,突然有人喊“停”。
Anthropic的工程师ThariqShihipar甩了个重磅观点:折腾了一年的API工具箱思路可能走错了,真正厉害的Agent工具居然是程序员天天用的Bash和文件系统。
这话听着像返璞归真,实际上可能藏着AIAgent的下个爆发点。
API工具模式的死穴
过去大家都觉得,给大语言模型配个API工具箱就万事大吉。
想用地图就调高德接口,要生成图片就喊DALL-E,思路简单直接。
但实际用起来才发现,这东西更像个提线木偶。
Thariq在分享里举了个扎心的例子:有个电商Agent集成了20多个API,结果工具调用错误率飙到35%。
这哪是智能Agent,分明是个需要人盯着的半成品。最要命的是这东西没自主性。
就像你让它查资料,要是第一次搜索没结果,它就只会摊手说“找不到”。
正常开发者遇到这种情况,肯定会换关键词或者换数据源吧?可传统Agent就卡在那儿了。
本来想靠API堆砌出万能助手,后来发现每个接口都是道墙,把Agent圈在了预设好的格子里。
Bash才是万能工具箱
Anthropic自己做的测试更颠覆:ClaudeCode里用简单的Bash命令,居然搞定了80%的复杂任务。
这事儿说穿了不复杂,Unix哲学早就告诉我们“小工具组合出大能力”。
你想把视频转成GIF,开发者谁会用专门的API啊?直接敲`ffmpeg-iinput.mp4output.gif`不就完了?
这种组合能力才是Agent该有的样子。
比如让它统计本周打车花费,它能自己拼命令:先用`grep"打车"email.txt`把账单揪出来,再用`awk`算总和。
比起记几十种API参数,这种方式反而更符合人类解决问题的思路。
更妙的是,命令行工具自带说明书,打个`--help`就能查用法,哪用得着把所有接口文档都塞到Prompt里?
文件系统当外部大脑
光有Bash还不够,文件系统才是Agent的“防失忆神器”。
大语言模型上下文窗口就那么点,聊几句就忘事儿。
Anthropic的办法是把中间结果写进文件,比如搞个`CLAUDE.md`存计划,下次对话直接读文件恢复状态。
他们测试说这么一来,可靠性比专用记忆模块还高40%。这还能搞“操作-验证”闭环。
创建文件后用`ls`看看成没成,编译报错了就读日志改代码。
就像程序员写代码要反复调试,Agent也得有这种试错修正的能力。