【入门科普】关于Deepseek你肯定会关心的3个基本问题
是什么,超越ChatGPT登顶苹果App Store排行榜? 是什么,让英伟达股价暴跌近20%? 是什么,让OpenAI一边忍不住夸赞一边又无中生有地污蔑其盗窃? 是什么,让中国人春节前后欢腾不已而美国人叫苦不迭? 答案是——Deepseek的横空出世。 相信春节前后有在关注科技圈的朋友们,都会被关于Deepseek的报道、体验、分析等内容一遍遍地刷屏。这些内容,有从个人体验切入感叹Deepseek的强大,有从技术层面入手详细拆解背后的突破,也有从政治、经济、国际关系等层面剖析中美两国关系的变化。但我在春节期间回家与亲朋戚友交流发现,他们其实也有刷到相关的内容,但大多表示看不懂,或者不太清楚这款产品对于他们的日常使用有什么影响?基于此,结合本人这些天来的信息搜集和个人体验,我打算撰写这篇科普文章,希望从普通人的视角来切入,回答普通人对于Deepseek需要知道的内容。 01 Deepseek是什么 简单来说,Deepseek是由杭州深度求索公司所自研的一款通用生成式AI产品。深度求索公司在2023年7月17日正式成立,在短时间内,Deepseek发布了多个重要模型,比如Deepseek Coder、Deepseek LLM、Deepseek-V2、Deepseek-V3。2025年1月15日,搭载Deepseek-V3模型的APP上架,快速登顶苹果App Store排行榜。2025年1月20日,引起关注的Deepseek-R1模型发布并同步开源。 看到这里,也许你会发出疑问:在此之前,国内已经有多款AI产品先后发布,也号称取得良好的效果。那为什么这次Deepseek的发布,如此大的关注呢?来,我们接着往下。 02 为什么Deepseek的发布,会引起如此大的关注 Deepseek近期引发全球关注的原因,总结起来有以下4点: 1)模型的表现卓越:根据Deepseek官方和其他行业人士测试的结果,Deepseek-R1模型在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,部分测试甚至超越了OpenAI的模型。而且,Deepseek针对中文语境和特定行业需求进行了精心优化,“更适合中国宝宝体质”。 2)模型的训练方式足够创新突破:Deepseek-R1 通过独立自研的方式,在对模型训练方式、架构等进行了多项优化改进,从而大幅提升了训练效率。而且,Deepseek团队将他们的探索过程一一记录在论文当中,帮助业界指明方向。 3)模型的全面开源:Deepseek-R1模型完全开源,在遵循MIT License的规则下,为全球开发者敞开了自由使用、修改和进一步开发的大门。这种开放性极大地促进了AI领域的技术交流与创新,为整个行业的发展提供了强大助力。而这样的开源精神,曾经是OpenAI所倡导的(OpenAI的Open正是此意)。 4)模型的使用成本低:如果不想部署开源模型,Deepseek也提供了价格很低的API。这意味着普通开发者和企业可以在不承担过高费用的前提下,轻松地将Deepseek的强大功能集成到自己的应用程序或业务流程中。相信随着越来越多的落地场景探索,AI技术在应用层面会取得更大的突破。 综上所述,从国际关系视角来看,Deepseek是我国打破美国算力芯片封锁的有力动作,某种层面也给了其他行业极大的信心(任何年代,信心都是比黄金还要珍贵的事物);从技术视角来看,Deepseek使用了很低的算力成本,就达到了OpenAI-O1模型的水平,为后续的技术迭代指明了方向,而且它还对外开源了;从应用视角来看,Deepseek相当于让每一位使用者都可以使用到第一梯队的AI产品,实现“技术平权”。 或许,你不负责技术实现,也不关心国家大事,但Deepseek的问世,也意味着我们使用AI的方式也有了变化,这就跟我们密切相关了。接下来,我们来看看,对于普通人而言,Deepseek发布后,使用AI的方式有哪些改变。 03 Deepseek发布后,我们使用AI的方式有哪些变化 我们先来看看,在Deepseek发布之前(或者说是OpenAI-o1发布之前),在普罗大众层面传播的AI使用方式是怎样的。以下是我在微信搜索“提示词”的一些典型文章截图。 这些提示词教学,无一不是在强调提示词的框架性。但从Deepseek-R1发布的那一刻起,这些文章的内容就已经不再适用了。关于这一点的原因,我在我自己的AI课程里也有介绍,倒不是说这些内容是错误的,而是它们其实是属于提示词工程(Prompt Engineering)范畴的内容。各类专业框架,实质上是给AI生成过程提供严谨、完整的参考信息和思考链路,从而追求极致的生成质量。但是,Deepseek-R1以及之前的OpenAI-O1,都是推理型模型,自带思维链的能力。对于没有经过深度钻研提示词工程的普罗大众而言,盲目套用这些框架,只会干扰AI的思考结果,得不偿失。就好比手动档的汽车,需要驾驶员自己判断何时切换档位,为此也有各路老司机总结的一些判断准则。但是,盲目将这些判断套用到自动档上,显然是适得其反。 所谓思维链(CoT,Chain-of-Thought),就是让模型在给出答案前进行逐步的思考与推理,并将这一过程显式呈现,仿佛是人类将复杂的思考路径拆解展示。例如在解决多步数学问题或复杂逻辑推理时,模型按照逻辑顺序逐步分析,先理解问题,再寻找关键条件,逐步推导直至得出结论。这种方式不仅增强了模型的可解释性,使人们能够清晰了解答案的由来,同时也提升了解决复杂问题的能力。 那么,在自带思维链的Deepseek面前,我们使用AI方式,应该如何改变?比之“改变”,我认为准确的说法是“回归”,也就是回归到平常的自然语言上。用大白话解答就是三个字—— 说——人——话—— 展开来讲就是,忘掉以往学习软件那一套“指令式交互”,而是回归到完成任务本身。也就是我们把AI看成是一名“无所不知、非常聪明、听懂人话、刚进公司”的实习生,然后想想,如果你跟这样一名实习生交代任务,你会怎么交代?是不是要把任务讲清楚,然后要提供足够的参考信息,尽可能明确各类要求,必要的时候还可以提供一些参考例子? 是的,跟AI下达指令时,不要再去纠结这样说“正不正确”,而是关注这样说“齐不齐全”。只要信息给得足够齐全,Deepseek会自己拆解问题逐步思考给出回答。 至于具体的使用Prompt的技巧,这足够单独成文了。限于篇幅,我们在这里就不展开,如果大家比较感兴趣,可以给在下多多点赞,我在后续安排上。这里,我就给大家展示一个我自己使用Deepseek的例子,就是让AI依据词牌写词(补充一下,我很喜欢用给AI出写古代诗词,基本上能很好地看出是套了ChatGPT还是自己训练,前者对中文的理解没有这么透彻)。 我的Prompt如下: 你要参考水调歌头的词牌,以当前人工智能的发展为主题,写一首歌,我希望你告诉我你主要参考了哪些作者的作品,参考了哪些内容。 是不是感觉这段Prompt平平无奇,甚至有些简陋。是的,我是故意为之,当时也是想看看Deepseek的思维链表现。来,我们再来看看Deepseek的思考过程(内容较多,我就直接截图)。 看完后我直呼好家伙,Deepseek展示了它的完整思考过程。首先挑选它认为合适的参考作品,然后确定主题内容,押韵韵脚和用词的选择,最后还会检查是否符合格律要求。这简直就跟人类在思考创作一阙词作的过程一模一样。 不过,我还有后招,按我以前的经验,AI大概率是处理不好中文的押韵问题的(我曾经为此跟ChatGPT及多款AI来回拉扯了几轮都没有达成)。大家注意看下,“秋”和“浮”是不押韵的,当时我心里想,“哈哈,还不让我抓住你的小瓣子”。于是,我就在对话里指出,“上面的作品,秋和浮,不押韵”。 然而,结果证明是我肤浅了。来,我们来看下Deepseek对此的回应。 原来是我低估了,Deepseek指出,它参考了《词林正韵》,“流”和“浮”这两个字在古代的读音是押韵的,“浮”字的宋代实际读音近「fəu」(这点我作为一名广东人还是能理解的,实际上这两个字在粤语里的确还是押韵的)。而且,它还补充说,“苏轼原词「天」「年」「寒」「间」同样存在古今音变问题”,这多少是有点傲娇了哈哈。不过,它最后还是按照要求进行了调整。 之后,我在多轮对话中,陆续还提了“我希望就以现代普通话为标准就行”、“最后两句的结尾都是同一个字“舟”,可否避免?”等要求。这是我和Deepseek的最后一轮对话。 我虽已练就与AI对话的能力,但在与Deepseek对话的过程中,我依然有一种“惊喜感”,一种“你太会了”的感受。可以说,Deepseek代表着人类在AI领域的探索又前进了一步。我之前曾有总结“AI生成结果再丰富再优质,最终的判断与选择权在使用者。只有使用者的认知水平足够高,才能辨别AI结果的优与劣。”这既是对AI没有判断立场的补充,又仿佛是人类的挽尊。 最后总结一下,我们在面对类似Deepseek这样自带思维链的推理型AI模型,在实际对话的过程中,不必关注Prompt的框架性,而是要“说人话”,也就是使用自然语言来表达清楚我们的任务。重点关注提供的信息,对于完成任务而言是否有帮助,是否足够齐全。至于过程中的问题拆解,就尽管交给AI即可。 作者:产品经理崇生,公众号:崇生的黑板报 本文由 @产品经理崇生 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自 unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

是什么,超越ChatGPT登顶苹果App Store排行榜?
是什么,让英伟达股价暴跌近20%?
是什么,让OpenAI一边忍不住夸赞一边又无中生有地污蔑其盗窃?
是什么,让中国人春节前后欢腾不已而美国人叫苦不迭?
答案是——Deepseek的横空出世。
相信春节前后有在关注科技圈的朋友们,都会被关于Deepseek的报道、体验、分析等内容一遍遍地刷屏。这些内容,有从个人体验切入感叹Deepseek的强大,有从技术层面入手详细拆解背后的突破,也有从政治、经济、国际关系等层面剖析中美两国关系的变化。但我在春节期间回家与亲朋戚友交流发现,他们其实也有刷到相关的内容,但大多表示看不懂,或者不太清楚这款产品对于他们的日常使用有什么影响?基于此,结合本人这些天来的信息搜集和个人体验,我打算撰写这篇科普文章,希望从普通人的视角来切入,回答普通人对于Deepseek需要知道的内容。
01 Deepseek是什么
简单来说,Deepseek是由杭州深度求索公司所自研的一款通用生成式AI产品。深度求索公司在2023年7月17日正式成立,在短时间内,Deepseek发布了多个重要模型,比如Deepseek Coder、Deepseek LLM、Deepseek-V2、Deepseek-V3。2025年1月15日,搭载Deepseek-V3模型的APP上架,快速登顶苹果App Store排行榜。2025年1月20日,引起关注的Deepseek-R1模型发布并同步开源。
看到这里,也许你会发出疑问:在此之前,国内已经有多款AI产品先后发布,也号称取得良好的效果。那为什么这次Deepseek的发布,如此大的关注呢?来,我们接着往下。
02 为什么Deepseek的发布,会引起如此大的关注
Deepseek近期引发全球关注的原因,总结起来有以下4点:
1)模型的表现卓越:根据Deepseek官方和其他行业人士测试的结果,Deepseek-R1模型在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,部分测试甚至超越了OpenAI的模型。而且,Deepseek针对中文语境和特定行业需求进行了精心优化,“更适合中国宝宝体质”。
2)模型的训练方式足够创新突破:Deepseek-R1 通过独立自研的方式,在对模型训练方式、架构等进行了多项优化改进,从而大幅提升了训练效率。而且,Deepseek团队将他们的探索过程一一记录在论文当中,帮助业界指明方向。
3)模型的全面开源:Deepseek-R1模型完全开源,在遵循MIT License的规则下,为全球开发者敞开了自由使用、修改和进一步开发的大门。这种开放性极大地促进了AI领域的技术交流与创新,为整个行业的发展提供了强大助力。而这样的开源精神,曾经是OpenAI所倡导的(OpenAI的Open正是此意)。
4)模型的使用成本低:如果不想部署开源模型,Deepseek也提供了价格很低的API。这意味着普通开发者和企业可以在不承担过高费用的前提下,轻松地将Deepseek的强大功能集成到自己的应用程序或业务流程中。相信随着越来越多的落地场景探索,AI技术在应用层面会取得更大的突破。
综上所述,从国际关系视角来看,Deepseek是我国打破美国算力芯片封锁的有力动作,某种层面也给了其他行业极大的信心(任何年代,信心都是比黄金还要珍贵的事物);从技术视角来看,Deepseek使用了很低的算力成本,就达到了OpenAI-O1模型的水平,为后续的技术迭代指明了方向,而且它还对外开源了;从应用视角来看,Deepseek相当于让每一位使用者都可以使用到第一梯队的AI产品,实现“技术平权”。
或许,你不负责技术实现,也不关心国家大事,但Deepseek的问世,也意味着我们使用AI的方式也有了变化,这就跟我们密切相关了。接下来,我们来看看,对于普通人而言,Deepseek发布后,使用AI的方式有哪些改变。
03 Deepseek发布后,我们使用AI的方式有哪些变化
我们先来看看,在Deepseek发布之前(或者说是OpenAI-o1发布之前),在普罗大众层面传播的AI使用方式是怎样的。以下是我在微信搜索“提示词”的一些典型文章截图。
这些提示词教学,无一不是在强调提示词的框架性。但从Deepseek-R1发布的那一刻起,这些文章的内容就已经不再适用了。关于这一点的原因,我在我自己的AI课程里也有介绍,倒不是说这些内容是错误的,而是它们其实是属于提示词工程(Prompt Engineering)范畴的内容。各类专业框架,实质上是给AI生成过程提供严谨、完整的参考信息和思考链路,从而追求极致的生成质量。但是,Deepseek-R1以及之前的OpenAI-O1,都是推理型模型,自带思维链的能力。对于没有经过深度钻研提示词工程的普罗大众而言,盲目套用这些框架,只会干扰AI的思考结果,得不偿失。就好比手动档的汽车,需要驾驶员自己判断何时切换档位,为此也有各路老司机总结的一些判断准则。但是,盲目将这些判断套用到自动档上,显然是适得其反。
所谓思维链(CoT,Chain-of-Thought),就是让模型在给出答案前进行逐步的思考与推理,并将这一过程显式呈现,仿佛是人类将复杂的思考路径拆解展示。例如在解决多步数学问题或复杂逻辑推理时,模型按照逻辑顺序逐步分析,先理解问题,再寻找关键条件,逐步推导直至得出结论。这种方式不仅增强了模型的可解释性,使人们能够清晰了解答案的由来,同时也提升了解决复杂问题的能力。
那么,在自带思维链的Deepseek面前,我们使用AI方式,应该如何改变?比之“改变”,我认为准确的说法是“回归”,也就是回归到平常的自然语言上。用大白话解答就是三个字——
说——人——话——
展开来讲就是,忘掉以往学习软件那一套“指令式交互”,而是回归到完成任务本身。也就是我们把AI看成是一名“无所不知、非常聪明、听懂人话、刚进公司”的实习生,然后想想,如果你跟这样一名实习生交代任务,你会怎么交代?是不是要把任务讲清楚,然后要提供足够的参考信息,尽可能明确各类要求,必要的时候还可以提供一些参考例子?
是的,跟AI下达指令时,不要再去纠结这样说“正不正确”,而是关注这样说“齐不齐全”。只要信息给得足够齐全,Deepseek会自己拆解问题逐步思考给出回答。
至于具体的使用Prompt的技巧,这足够单独成文了。限于篇幅,我们在这里就不展开,如果大家比较感兴趣,可以给在下多多点赞,我在后续安排上。这里,我就给大家展示一个我自己使用Deepseek的例子,就是让AI依据词牌写词(补充一下,我很喜欢用给AI出写古代诗词,基本上能很好地看出是套了ChatGPT还是自己训练,前者对中文的理解没有这么透彻)。
我的Prompt如下:
你要参考水调歌头的词牌,以当前人工智能的发展为主题,写一首歌,我希望你告诉我你主要参考了哪些作者的作品,参考了哪些内容。
是不是感觉这段Prompt平平无奇,甚至有些简陋。是的,我是故意为之,当时也是想看看Deepseek的思维链表现。来,我们再来看看Deepseek的思考过程(内容较多,我就直接截图)。
看完后我直呼好家伙,Deepseek展示了它的完整思考过程。首先挑选它认为合适的参考作品,然后确定主题内容,押韵韵脚和用词的选择,最后还会检查是否符合格律要求。这简直就跟人类在思考创作一阙词作的过程一模一样。
不过,我还有后招,按我以前的经验,AI大概率是处理不好中文的押韵问题的(我曾经为此跟ChatGPT及多款AI来回拉扯了几轮都没有达成)。大家注意看下,“秋”和“浮”是不押韵的,当时我心里想,“哈哈,还不让我抓住你的小瓣子”。于是,我就在对话里指出,“上面的作品,秋和浮,不押韵”。
然而,结果证明是我肤浅了。来,我们来看下Deepseek对此的回应。
原来是我低估了,Deepseek指出,它参考了《词林正韵》,“流”和“浮”这两个字在古代的读音是押韵的,“浮”字的宋代实际读音近「fəu」(这点我作为一名广东人还是能理解的,实际上这两个字在粤语里的确还是押韵的)。而且,它还补充说,“苏轼原词「天」「年」「寒」「间」同样存在古今音变问题”,这多少是有点傲娇了哈哈。不过,它最后还是按照要求进行了调整。
之后,我在多轮对话中,陆续还提了“我希望就以现代普通话为标准就行”、“最后两句的结尾都是同一个字“舟”,可否避免?”等要求。这是我和Deepseek的最后一轮对话。
我虽已练就与AI对话的能力,但在与Deepseek对话的过程中,我依然有一种“惊喜感”,一种“你太会了”的感受。可以说,Deepseek代表着人类在AI领域的探索又前进了一步。我之前曾有总结“AI生成结果再丰富再优质,最终的判断与选择权在使用者。只有使用者的认知水平足够高,才能辨别AI结果的优与劣。”这既是对AI没有判断立场的补充,又仿佛是人类的挽尊。
最后总结一下,我们在面对类似Deepseek这样自带思维链的推理型AI模型,在实际对话的过程中,不必关注Prompt的框架性,而是要“说人话”,也就是使用自然语言来表达清楚我们的任务。重点关注提供的信息,对于完成任务而言是否有帮助,是否足够齐全。至于过程中的问题拆解,就尽管交给AI即可。
作者:产品经理崇生,公众号:崇生的黑板报
本文由 @产品经理崇生 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 unsplash,基于CC0协议
你的反应是什么?






