type
Post
status
Published
date
May 21, 2026
slug
aris-vs-autoresearchclaw-comparison
summary
对比 ARIS 与 AutoResearchClaw 两个自主 ML 科研工作流框架的设计哲学、架构和适用场景。
tags
LLM
agent
工具
category
Agent
icon
password
两个都想让 AI 自动做科研——但它们想的根本不是同一件事。
最近研究了两个自主科研工作流框架:ARIS(Auto-claude-code-research-in-sleep)和 AutoResearchClaw。乍一看都是"让 AI 帮你写论文",但深入对比后发现,两者的设计哲学差异相当大。

一、核心定位

ARIS 的 slogan 是:
"Let Claude Code do research while you sleep."
注意主语是 Claude Code,而不是 ARIS 本身。它把自己定位成一套工具箱,你仍然是研究者,ARIS 帮你执行。
AutoResearchClaw 的 slogan 是:
"Chat an Idea. Get a Paper."
主语是你的一句话,输出是一篇论文。它把自己定位成一个替代者
这个差异决定了后续所有的设计选择。

二、架构对比

维度
ARIS
AutoResearchClaw
本质
60+ 个独立 Markdown Skill 文件
完整 Python 应用(pip 安装)
依赖
零依赖,纯文本
有状态机、数据库、CLI 入口
流程
可拆分,任意节点插入
固定 23 阶段黑盒流水线
评审机制
跨模型对抗审查(Claude × GPT)
多 Agent 辩论(同类模型)
人的角色
定方向,Agent 执行
可选介入(6 种 HITL 模式)
可移植性
任何 LLM Agent 均可运行
ACP 协议兼容多平台

三、最核心的哲学差异

ARIS:跨模型对抗

ARIS 最独特的设计是两个不同家族的模型互相审查:Claude Code 负责执行(速度快),GPT/Codex 负责批评(更严格)。
理由很朴素:同一个模型审查自己的输出,会有系统性盲点。就像论文送审,作者自审和外审的结果完全不同。
这套机制贯穿整个流水线:写论文、跑实验、做 Rebuttal,每一步都有独立评审出具 PASS/FAIL verdict 才能继续。

AutoResearchClaw:自强化学习

AutoResearchClaw 的核心创新是 MetaClaw——跨 run 知识迁移。每次跑完一个课题,系统提取经验教训写入知识库,下次跑类似课题时复用,宣称带来 +18.3% 鲁棒性提升。
本质上是在做研究 Agent 的持续学习,而不只是单次流水线优化。

四、适用场景

选 ARIS,如果你:
  • 已经有自己的研究方向和部分结果
  • 想从中间某个节点(如写作、Rebuttal)切入
  • 需要灵活组合不同工具
  • 不想依赖任何特定平台或框架
选 AutoResearchClaw,如果你:
  • 想从零开始探索一个新领域
  • 希望系统全自动跑完出论文
  • 需要多领域支持(物理、生物、统计等专业 Agent)
  • 在意跨 run 的经验积累和自我进化

五、一句话总结

AutoResearchClaw 是自动驾驶——你说目的地,它开车。
ARIS 是高级辅助驾驶——你掌方向盘,它帮你处理路况。
前者追求"全自动出论文",后者追求"帮真实研究者少做重复工作、多做创意工作"。两者并不互斥,取决于你在科研流程的哪个位置、想要多少控制权。
Autoresearch(uditgoenka)深度分析:一个被过度包装的好点子oh-my-claudecode 完全解析:用 tmux 实现 multi-agent 编排的工程哲学
Loading...