DeepSeek 是什么：我的学习笔记

type

Post

status

Published

date

Mar 1, 2025

slug

what-is-deepseek-learning-notes

summary

我从学习者视角理解 DeepSeek：它不只是一个聊天入口，而是一组围绕开源、推理能力、成本和应用生态展开的模型体系。

📝 主旨内容

DeepSeek 不只是一个聊天入口，而是一组围绕代码、通用对话和推理能力演进的模型。

刚开始我只知道 DeepSeek 是一个大模型产品。后来随着 DeepSeek-V3、DeepSeek-R1 这些模型被更多人讨论，我才意识到它真正引人关注的地方在于：开源、效果、成本和推理能力同时出现在一个案例里。

这让我重新理解了国产开源模型的价值。以前我更多是把开源模型看成替代方案，现在我会把它看成应用创新的基础设施。

DeepSeek-R1 让我更直观地理解了“推理模型”和普通对话模型的区别。普通模型可以很好地生成文本，但面对数学、逻辑、代码推导这类多步骤问题时，很容易中途走偏。

推理模型更强调分解问题、检查中间步骤和在反馈中改进答案。它不一定意味着模型真的像人一样思考，但从使用效果看，它确实更适合复杂任务。

我现在会把 DeepSeek 放在几个场景里考虑：

但我也不会把它神化。模型仍然会出错，尤其是在事实细节、实时信息和高风险决策上。所以我更愿意把它当成一个强工具，而不是最终答案来源。

DeepSeek 对我最大的影响，是让我看到开源模型和推理模型正在快速接近真实应用需求。它降低了很多 AI 应用的尝试成本，也让模型选择不再只围绕少数闭源 API。

作为学习者，我后面会继续关注它的技术报告、部署成本、API 生态和与其他模型的差异。理解这些，比只看模型热度更重要。

💡

我现在更关心的问题是：DeepSeek 这类模型如何进入真实工作流，而不是只在排行榜和新闻里出现。