🗒️DeepSeek webui 自部署LLM我从学习者角度重新整理 DeepSeek WebUI 自部署:如何理解 Ollama、Open WebUI、本地模型服务和排查思路。2025-3-18 LLM 工具 开发
🗒️DeepSeek 模型复现:我会从哪里开始LLM我用学习者视角拆解 DeepSeek 模型复现的路线:先明确目标,再从数据、训练方法、评估和成本边界逐步缩小范围。2025-3-6 LLM 训练 PEFT DATA
🗒️DeepSeek 背后的技术:我的学习笔记LLM我从学习者角度梳理 DeepSeek 背后的几个关键技术线索:MoE、低成本训练、强化学习推理能力,以及它对开源大模型生态的影响。2025-2-22 LLM 训练 开发
🗒️TRL学习LLM我从学习者角度整理 Hugging Face TRL:把它理解成大模型后训练工具箱,并梳理 SFT、DPO、GRPO、Reward Modeling 和 PPO 的学习路线。2025-6-12 LLM 训练 PEFT
🗒️DeepSeek 是什么:我的学习笔记LLM我从学习者视角理解 DeepSeek:它不只是一个聊天入口,而是一组围绕开源、推理能力、成本和应用生态展开的模型体系。2025-3-1 LLM 工具 开发
🗒️DeepSeek API 主流厂商比较:我的选择思路LLM我从学习和实际接入角度比较 DeepSeek API 的几类主流渠道:官方接口、云厂商平台和第三方聚合服务,重点关注稳定性、价格、延迟和迁移成本。2025-2-26 LLM 工具 开发
🗒️Talky 学习笔记:一个大模型数据生成工具的想法LLM我把 Talky 理解成一个大模型数据生产工作台:用多 Agent 生成对话,再完成验证、可视化和训练数据导出。2025-12-2 LLM 训练 工具 DATA
🗒️Agent is All You Need:我的 Agent 生态学习笔记LLM我把 Agent 生态按能力拆解:规划、工具调用、记忆、协作、评测和权限控制,比单纯罗列框架更重要。2025-9-28 LLM agent 工具
🗒️大模型数据生成学习笔记:从 Self-Instruct 到多 Agent 数据流水线LLM我从学习者角度梳理大模型数据生成方法:Self-Instruct、CAMEL、ShareGPT、Baize 和 Data-Copilot 的共同问题是如何让数据可控、可验证、可复用。2025-5-21 LLM DATA 训练
🗒️DataSet Collection:我的大模型数据集整理方法LLM我把数据集整理看成训练工程的一部分:要记录任务类型、数据来源、许可证、偏差风险和适用边界。2025-12-15 LLM DATA 训练