type
Post
status
Published
date
Mar 1, 2025
slug
what-is-deepseek-learning-notes
summary
我从学习者视角理解 DeepSeek:它不只是一个聊天入口,而是一组围绕开源、推理能力、成本和应用生态展开的模型体系。
tags
LLM
工具
开发
category
LLM
icon
password
这篇是我重新整理“DeepSeek 是什么”时的学习笔记。相比单纯介绍一家公司或一个模型,我更想用学习者视角理解:为什么 DeepSeek 会被频繁讨论,它到底改变了我对开源模型、推理模型和使用成本的认识。

📝 主旨内容
💡 一、我先把 DeepSeek 当成一个模型体系来看
DeepSeek 不只是一个聊天入口,而是一组围绕代码、通用对话和推理能力演进的模型。
刚开始我只知道 DeepSeek 是一个大模型产品。后来随着 DeepSeek-V3、DeepSeek-R1 这些模型被更多人讨论,我才意识到它真正引人关注的地方在于:开源、效果、成本和推理能力同时出现在一个案例里。
这让我重新理解了国产开源模型的价值。以前我更多是把开源模型看成替代方案,现在我会把它看成应用创新的基础设施。
🔍 二、我理解的推理模型
DeepSeek-R1 让我更直观地理解了“推理模型”和普通对话模型的区别。普通模型可以很好地生成文本,但面对数学、逻辑、代码推导这类多步骤问题时,很容易中途走偏。
推理模型更强调分解问题、检查中间步骤和在反馈中改进答案。它不一定意味着模型真的像人一样思考,但从使用效果看,它确实更适合复杂任务。
🛠️ 三、我会怎么使用 DeepSeek
我现在会把 DeepSeek 放在几个场景里考虑:
- 代码解释和代码生成
- 文档总结和知识整理
- 数学、逻辑和推理任务
- 低成本 API 接入
- 本地或私有化部署评估
但我也不会把它神化。模型仍然会出错,尤其是在事实细节、实时信息和高风险决策上。所以我更愿意把它当成一个强工具,而不是最终答案来源。
🤗 总结归纳
DeepSeek 对我最大的影响,是让我看到开源模型和推理模型正在快速接近真实应用需求。它降低了很多 AI 应用的尝试成本,也让模型选择不再只围绕少数闭源 API。
作为学习者,我后面会继续关注它的技术报告、部署成本、API 生态和与其他模型的差异。理解这些,比只看模型热度更重要。
📎 参考文章
- DeepSeek 官方文档:https://api-docs.deepseek.com
- DeepSeek-V3:https://arxiv.org/abs/2412.19437
- DeepSeek-R1:https://arxiv.org/abs/2501.12948
我现在更关心的问题是:DeepSeek 这类模型如何进入真实工作流,而不是只在排行榜和新闻里出现。
- 作者:老王TechTalk
- 链接:https://www.illusionjourney.com/article/what-is-deepseek-learning-notes
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章








