🗒️DeepSeek 模型复现:我会从哪里开始LLM我用学习者视角拆解 DeepSeek 模型复现的路线:先明确目标,再从数据、训练方法、评估和成本边界逐步缩小范围。2025-3-6 LLM 训练 PEFT DATA
🗒️GraphRAG 学习笔记:我如何理解图增强检索LLM我从普通 RAG 的边界出发理解 GraphRAG:向量检索解决相似性,图结构更适合表达关系、社区和全局知识。2025-7-14 LLM DATA 开发
🗒️Talky 学习笔记:一个大模型数据生成工具的想法LLM我把 Talky 理解成一个大模型数据生产工作台:用多 Agent 生成对话,再完成验证、可视化和训练数据导出。2025-12-2 LLM 训练 工具 DATA
🗒️大模型数据生成学习笔记:从 Self-Instruct 到多 Agent 数据流水线LLM我从学习者角度梳理大模型数据生成方法:Self-Instruct、CAMEL、ShareGPT、Baize 和 Data-Copilot 的共同问题是如何让数据可控、可验证、可复用。2025-5-21 LLM DATA 训练
🗒️DataSet Collection:我的大模型数据集整理方法LLM我把数据集整理看成训练工程的一部分:要记录任务类型、数据来源、许可证、偏差风险和适用边界。2025-12-15 LLM DATA 训练
🗒️多任务训练如何加强 zero-shot 泛化:我的学习笔记LLM我从多任务提示训练理解 zero-shot 泛化:任务多样性和提示多样性会影响模型迁移到未见任务的能力。2025-11-6 LLM 训练 DATA