电话: 邮箱:

博亚(中国)体育app 澳洲放羊大叔引爆 AI 编程立异!Claude Code 急推 goal 形状,不干完不许停

发布日期:2026-05-13 23:39 作者:admin 来源:未知 点击:138

博亚(中国)体育app 澳洲放羊大叔引爆 AI 编程立异!Claude Code 急推 goal 形状,不干完不许停

澳洲牧羊大叔顺手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。

一醒觉来,Claude Code 又更新!

为了让 Claude 执续使命直到任务完成,Claude Code 最近推出的新功能:/goal 。

你独一设定条目,Claude 不完成任务它绝怪异正!

张开剩余90%

用过 AI 编程器具的东说念主都懂,这到底多艰苦!

你给 Agent 下了一个任务,它跑了三个回合,改了两个文献,俄顷停驻来问你「接下来需要我作念什么?」

不是,bug 你这还没修完呢啊!

Agent 越来越灵巧,写代码越来越快,但「从新到尾把一件事干完」这件事,到 2026 年头都莫得一家能作念到。

然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 责罚了。

while :; do cat PROMPT.md | claude-code --continuedone

他把它定名为 Ralph Loop,致意《辛普森一家》里阿谁恒久搞不清状态但从不烧毁的小孩 Ralph Wiggum。

逻辑极其奸诈,无尽轮回,反复把吞并个 prompt 喂给 Agent。过程写在文献系统和 Git 历史里,崎岖文满了就开新实例,读文献接着干。

原始,不优雅,但相配有用。

有用到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。

11 天,三家顶级 AI 实验室,异途同归地把这三行 bash 写进了官方家具。

这一刻,总共东说念主都昭彰了一件事 ——

通用东说念主工智能的临门一脚,可能不是更灵巧的模子,而是「把事作念完」的模子。

换句话说,AI 编程的中枢战场正在从「生成代码」转向「闭环委用」。

11 天,三条线,吞并个止境

4 月 30 日,OpenAI 的 Codex 当先上线 / goal。

Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。

一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。

11 天。三家。吞并个大叫。吞并个功能。

但终了旅途,差了十万八沉。

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。

Codex:把看法存成一条数据库纪录

OpenAI 是三家里起先起首的,决策也最纯粹。

在 Codex 里,/goal 是一个执久化的使命流对象,存在土产货的 app-server 状态层里。

关掉末端、合上条记本、甚而重启系统,看法都不会丢。下次掀开 Codex,自动接上。

模子通过结构化的 update_goal 器具禀报过程状态,token 预算破钞时触发「软着陆」而非硬停。

有东说念主用这个功能贯穿跑了 14 个小时,中间暂停 5 小时去寝息,讲求 Codex 从断点续跑,把一个建造驱动名堂作念完毕。

工程化,干净,但克制。

Hermes Agent:一个东说念骨干不完,博亚体育app官方网站那就上一个团队

Hermes Agent 的筹算最大。

在这里,/goal 仅仅冰山一角。简直的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队合作问题。

看板的底层是土产货 SQLite,执久化存储,跨重启不丢。

你在上头创建一个任务卡片,Hermes 会平直把它拆成多个子任务,分拨给不同的 Agent worker。每个 worker 是一个零丁的 OS 过程,有我方的身份、模子建树和使命目次。

看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的看法锁定(Ralph loop),看板管的是多个 Agent 之间的任务调养。一个纵向潜入,一个横向铺开。

终末,是五层防烂尾机制。

极速飞艇pk10官网入口

第一层,心跳检测。每个 worker 依期向看板报到,讲授我方还辞世。

第二层,僵尸回收。worker 超时没反映?系统自动判定弃世,回收它手上的任务再行分拨。macOS 上还有挑升的达尔文僵尸检测逻辑。

第三层,退出阻挡。worker 没完成任务就退出了?系统自动把它绚丽为 blocked,不让它再接新活,退缩「摸鱼型 Agent」反复领任务又不作念。

第四层,幻觉阻挡。这是最狠的一层。AI 说「我作念完毕」不算数,系统会考据它现实产出的代码是否简直落盘了。Agent 说我方创建了一个文献但现实上莫得?收拢,回滚,重来。

第五层,重试预算。每个任务有零丁的 max_retries,最多重试 N 次,向上就上报东说念主类。都备不会无尽轮回到死机。

Claude Code:作念事的东说念主和验收的东说念主,弗成是吞并个

Anthropic 是三家里终末起首的,但决策最阴私。

现实上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。

你设定一个完成条目(比如「test / auth 目次下总共测试通过且 lint 无报错」),Claude 就运转干活。

重要瞎想在验收范例。每干完一轮,系统不让 Claude 我方判断「我作念完毕莫得」。

它把对话纪录和你的完成条目一都发给一个零丁的小模子(默许是 Haiku),让这个小模子来裁判。

小模子如若认为没完成,就需要复返一个具体根由(比如「test_login.py还有 2 个 failure」)。然后这个根由会被注入 Claude 下一轮的崎岖文,调换它接着干。

如若小模子认为完成了,看法就会自动撤消,任务断绝。

值得一提的是,这个裁判模子不调用任何器具,不读文献,不跑大叫。它只看 Claude 在对话里产出的内容。

是以,你的完成条目必须是 Claude 在对话中能讲授的东西。

它最长因循 4000 字符,因此你不错写得很细。

甚而,还不错在条目里加敛迹,比如「不修改其他测试文献」「20 轮内完成不然罢手」等等。

决赛进行时:使命流进口

把视角拉远一步。

Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了双方的模子,同期亦然 DeepSeek V4 等模子的主力分发渠说念。

三条旅途,正巧遮盖了 ASI 决赛的三个生态进口。

而他们争的,亦然吞并样东西 —— 使命流。

谁的 Agent 先闪开荒者养成「设完看法就走开」的俗例,谁就锁死了使命流进口。

因为俗例一朝酿成,搬动资本是指数级的。

你不会舍弃离开一个也曾跑通了看板调养、断点续传、checkpoint 回滚的 Agent 基础作为。

一个看似很小的 / goal 大叫,背后卡的是整条 Agent 使命流的护城河。

参考贵府:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog博亚(中国)体育app

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

发布于:山东省
相关标签: