我把 BrowserUse 当成浏览器 Agent 的一个典型样本来学习：它不是简单打开网页，而是让模型围绕页面状态、动作和目标形成闭环。

BrowserUse 学习笔记：我如何理解浏览器 Agent

我从学习者视角梳理 Open Deep Research：它的重点不是多搜几个网页，而是把问题澄清、资料收集和报告写作组织成稳定流程。

Open Deep Research 学习笔记：我如何理解研究型 Agent

我把 MCP 当成连接模型、工具和数据源的一套通用协议来学习。真正重要的不是概念本身，而是它如何让 Agent 稳定拿到上下文并调用外部能力。

MCP 课程学习笔记：我如何理解工具、上下文和 Agent

我从学习者角度重新整理 DeepSeek WebUI 自部署：如何理解 Ollama、Open WebUI、本地模型服务和排查思路。

DeepSeek webui 自部署

我用学习者视角拆解 DeepSeek 模型复现的路线：先明确目标，再从数据、训练方法、评估和成本边界逐步缩小范围。

DeepSeek 模型复现：我会从哪里开始

我从学习者角度梳理 DeepSeek 背后的几个关键技术线索：MoE、低成本训练、强化学习推理能力，以及它对开源大模型生态的影响。

DeepSeek 背后的技术：我的学习笔记

我从学习者角度整理 Hugging Face TRL：把它理解成大模型后训练工具箱，并梳理 SFT、DPO、GRPO、Reward Modeling 和 PPO 的学习路线。

TRL学习

我从学习者视角理解 DeepSeek：它不只是一个聊天入口，而是一组围绕开源、推理能力、成本和应用生态展开的模型体系。

DeepSeek 是什么：我的学习笔记

我从学习和实际接入角度比较 DeepSeek API 的几类主流渠道：官方接口、云厂商平台和第三方聚合服务，重点关注稳定性、价格、延迟和迁移成本。

DeepSeek API 主流厂商比较：我的选择思路

我用学习者视角拆解多模态大模型训练：从视觉编码器、投影层、语言模型对齐，到数据质量和评测闭环。

0 到 1 训练一个多模态大模型：我的学习路线

我从普通 RAG 的边界出发理解 GraphRAG：向量检索解决相似性，图结构更适合表达关系、社区和全局知识。

GraphRAG 学习笔记：我如何理解图增强检索

我把 AIPC 理解成端侧 Agent 系统：本地 ASR、LLM、TTS 和工具调用共同组成一个可控的个人智能入口。

Turn Your PC into AIPC：我对端侧智能的理解

我从 CrewAI Evaluation 出发梳理 Agent 评测：可运行不等于可靠，评测要覆盖任务完成度、过程质量、稳定性和成本。

CrewAI Evaluation 学习笔记：我如何评价 Agent 是否可靠

我把 Talky 理解成一个大模型数据生产工作台：用多 Agent 生成对话，再完成验证、可视化和训练数据导出。

Talky 学习笔记：一个大模型数据生成工具的想法

我把 Agent 生态按能力拆解：规划、工具调用、记忆、协作、评测和权限控制，比单纯罗列框架更重要。

Agent is All You Need：我的 Agent 生态学习笔记

我从医学大模型数据出发，整理真实医患对话、医学文献、结构化知识和通用指令数据的价值与风险。

医学大模型数据汇总：我的学习笔记

我从学习者角度梳理大模型数据生成方法：Self-Instruct、CAMEL、ShareGPT、Baize 和 Data-Copilot 的共同问题是如何让数据可控、可验证、可复用。

大模型数据生成学习笔记：从 Self-Instruct 到多 Agent 数据流水线

我从学习者角度理解 Deep Auction：用神经网络学习拍卖机制时，不能只看收益，还要关注激励相容、约束和 regret。

Deep Auction 学习笔记：当深度学习遇到拍卖机制

我把数据集整理看成训练工程的一部分：要记录任务类型、数据来源、许可证、偏差风险和适用边界。

DataSet Collection：我的大模型数据集整理方法

我从多任务提示训练理解 zero-shot 泛化：任务多样性和提示多样性会影响模型迁移到未见任务的能力。

多任务训练如何加强 zero-shot 泛化：我的学习笔记

用chatgpt生成多轮完整对话数据，而不是QA对，从而有更好的效果。同时使用chatgpt做了一个对齐方式代替人类的对齐方式（SDF，Self-Distillation with Feedback）

LLM-白泽🐲

我把 Agent Memory 理解成智能体从一次性助手走向长期协作者的基础能力，关键在于写入、检索、更新和遗忘机制。

Agent Memory 学习笔记：我如何理解智能体长期记忆

这篇文章系统梳理 Daily Stock Analysis 的核心功能、部署方式、普通分析与 Agent 模式的实现差异，并用一只股票示例说明不同模式下报告会长什么样。

Daily Stock Analysis：从数据抓取到 Agent 决策的完整使用指南

深度研究报告：涵盖长周期智能体的上下文管理创新（Context-Folding、MemAct）、工业架构演进（DeerFlow、Anthropic接力架构、Cognition反思）、持久化记忆框架（Zep、Mem0）以及评估体系重构（SWE-Bench Pro、Harvey LAB）。

长周期运行智能体（Long-Horizon Agents）深度研究报告

客观分析 uditgoenka/autoresearch 项目：它是什么、能做什么、真正的局限在哪里，以及与 Karpathy 原版的本质差距。

Autoresearch（uditgoenka）深度分析：一个被过度包装的好点子

对比 ARIS 与 AutoResearchClaw 两个自主 ML 科研工作流框架的设计哲学、架构和适用场景。

ARIS vs AutoResearchClaw：两种自主科研工作流的对比

从零理解 oh-my-claudecode：它解决了什么问题、tmux 如何成为进程总线、rate limit 检测的两层机制，以及多 agent 任务分配的评分系统。

oh-my-claudecode 完全解析：用 tmux 实现 multi-agent 编排的工程哲学

Superpowers 是一套开源的 AI coding agent 工作流插件，通过 14 个技能模块硬性约束 AI 的开发流程，防止跳步骤和自作主张，让 Claude Code、Cursor、Copilot 等工具变得更可控、更有纪律。

Superpowers：给 AI Coding Agent 的结构化开发方法论

从零开始的 Ghostty 使用体验，涵盖基础配置、Oh My Zsh + agnoster 主题、zsh-autosuggestions 和 zsh-syntax-highlighting 插件，以及 NVM、Homebrew、conda 开发环境集成。

Ghostty 终端使用心得：从初体验到深度配置

我第一次系统使用 Claude Code 后，最大的感受是它不是替代开发者，而是把重复、搜索、改造和验证这些环节变得更连贯。

用 AI 写代码是什么感觉：Claude Code 初体验

这篇文章记录了 notion-publisher skill 的使用方式、适配过程和实现原理：如何让 Codex / Claude Code 通过 Notion MCP 发布文章，并让 OpenClaw 在无 MCP 环境中通过 CLI runtime 调用 Notion API 创建和更新页面。

用 Skill 自动发布 Notion 文章：notion-publisher 的用法与实现

KISS 原则是软件工程的基础哲学——保持简单，避免过度设计，是对未来维护者最大的尊重。

🗒️多任务训练如何加强 zero-shot 泛化：我的学习笔记

🗒️LLM-白泽🐲