type
Post
status
Published
date
Mar 1, 2025
slug
what-is-deepseek-learning-notes
summary
我从学习者视角理解 DeepSeek:它不只是一个聊天入口,而是一组围绕开源、推理能力、成本和应用生态展开的模型体系。
tags
LLM
工具
开发
category
LLM
icon
password
🐋
这篇是我重新整理“DeepSeek 是什么”时的学习笔记。相比单纯介绍一家公司或一个模型,我更想用学习者视角理解:为什么 DeepSeek 会被频繁讨论,它到底改变了我对开源模型、推理模型和使用成本的认识。
深空图像很适合表达大模型背后的复杂结构
深空图像很适合表达大模型背后的复杂结构

📝 主旨内容

💡 一、我先把 DeepSeek 当成一个模型体系来看

DeepSeek 不只是一个聊天入口,而是一组围绕代码、通用对话和推理能力演进的模型。
刚开始我只知道 DeepSeek 是一个大模型产品。后来随着 DeepSeek-V3、DeepSeek-R1 这些模型被更多人讨论,我才意识到它真正引人关注的地方在于:开源、效果、成本和推理能力同时出现在一个案例里。
这让我重新理解了国产开源模型的价值。以前我更多是把开源模型看成替代方案,现在我会把它看成应用创新的基础设施。

🔍 二、我理解的推理模型

DeepSeek-R1 让我更直观地理解了“推理模型”和普通对话模型的区别。普通模型可以很好地生成文本,但面对数学、逻辑、代码推导这类多步骤问题时,很容易中途走偏。
推理模型更强调分解问题、检查中间步骤和在反馈中改进答案。它不一定意味着模型真的像人一样思考,但从使用效果看,它确实更适合复杂任务。

🛠️ 三、我会怎么使用 DeepSeek

我现在会把 DeepSeek 放在几个场景里考虑:
  • 代码解释和代码生成
  • 文档总结和知识整理
  • 数学、逻辑和推理任务
  • 低成本 API 接入
  • 本地或私有化部署评估
但我也不会把它神化。模型仍然会出错,尤其是在事实细节、实时信息和高风险决策上。所以我更愿意把它当成一个强工具,而不是最终答案来源。

🤗 总结归纳

DeepSeek 对我最大的影响,是让我看到开源模型和推理模型正在快速接近真实应用需求。它降低了很多 AI 应用的尝试成本,也让模型选择不再只围绕少数闭源 API。
作为学习者,我后面会继续关注它的技术报告、部署成本、API 生态和与其他模型的差异。理解这些,比只看模型热度更重要。

📎 参考文章

 
💡
我现在更关心的问题是:DeepSeek 这类模型如何进入真实工作流,而不是只在排行榜和新闻里出现。
DeepSeek 背后的技术:我的学习笔记DeepSeek API 主流厂商比较:我的选择思路
Loading...