AI产品经理进化指南:基础入门
AI产品的爆火,让不少人都希望做AI产品经理。但不是那么容易的,光是AI领域的这些基础名词,你知道多少呢? DeepSeek实现信息整合和建议输出,Manus则直接具备独立完成复杂任务的闭环执行能力,从DeepSeek到Manus爆火,前后不足2个月,技术更新的很快。AI成为标配,产品经理也要持续更新迭代,在不确定的时代始终给自己一份确定感。 进化指南系列从AI基础入门、应用实践、场景挖掘三个方面通俗易懂地记录、分享AI学习与实践。 基础入门部门,系统地梳理大模型和AI基础知识,建立AI领域的基础语言,理解现有大模型的能力范围和边界,知道大模型能做哪些事情,不能做哪些事情。 AI产品、AI企业、AI产品经理 人工智能产品=数据+算法+算力 如果把人工智能产品比如刚刚开始学习的小孩,数据就是学习用的 “课本” 和 “资料”,数据越多学习的素材就越多;算法是学习的方法,不同的算法就像不同的学习方法,有的方法可能学习得又快又准,有的可能就会慢一些或者容易出错;算力:相当于 “大脑运转速度”,算力强就算的快,算力弱就有可能卡顿或处理不过来。 AI企业 分为基础层企业、技术层企业、应用层企业 AI=基础层:做AI核心技术的公司,比如提供AI算法模型的Deepseek,提供算法芯片的英伟达 AI+=技术层:对于基础AI能力进行包装和优化,输出通用方案的公司,比如计算机视觉、语音识别及语义处理 +AI=应用层:结合人工智能技术进行业务赋能,直接解决业务场景问题的公司,金融+AI、工业+AI、能源+AI等等。 AI产品经理 把AI技术包装为新产品或融入旧产品,用新方法解决用户需求的人。 在这样的要求下,就需要产品经理了解AI技术原理,能够进行解释说明,理解现有AI的能力范围和边界,知道AI能做哪些事情,不能做哪些事情。 经典算法模型 CNN 算法(卷积神经网络) 【原理】 可以把 CNN 算法想象成一个专业的图像检查员。当你拿到一张复杂的大图片时,要从中找出关键信息是很困难的。CNN 就像检查员一样,它不会一下子看完整张图片,而是把图片划分成一个个小区域,使用特定的 “小窗口”(卷积核)在这些小区域上滑动查看。 这个 “小窗口” 会检查每个小区域的特征,比如边缘、颜色变化等。每检查完一个小区域,就会输出一个表示该区域特征的数值。随着 “小窗口” 在整个图片上滑动,就能得到很多这样的数值,这些数值组成了一个新的 “特征图”。 CNN 会使用多个不同的 “小窗口”,得到多个不同的特征图,每个特征图关注图片的不同方面。之后,它会对这些特征图进行处理,比如通过池化操作减少数据量,保留重要信息。最后,把处理后的特征输入到全连接层,就像做总结一样,根据这些特征判断图片的类别。 【应用场景】 图像识别:在安防领域,用于识别监控画面中的人脸、车辆型号等;在医疗领域,帮助医生识别 X 光、CT 等影像中的病变。 自动驾驶:识别道路上的交通标志、行人、其他车辆等,为自动驾驶决策提供依据。 RNN 算法(循环神经网络) 【原理】 RNN 就像是一个有 “记忆” 的智能助手,专门处理和时间序列相关的数据。当你给它输入一系列数据时,它不仅仅关注当前输入的数据,还会记住之前输入的数据信息。 比如,当你输入一段文字时,RNN 会依次处理每个单词。在处理当前单词时,它会结合之前处理过的单词信息来理解句子的意思。这是因为 RNN 有一个循环结构,它会把上一个时间步的输出作为当前时间步的一部分输入,这样就可以保留历史信息。 不过,传统的 RNN 存在 “长时依赖” 问题,也就是很难记住很久之前的信息。后来出现了 LSTM(长短期记忆网络)和 GRU(门控循环单元)等改进版本,它们能更好地控制信息的记忆和遗忘,解决了长时依赖问题。 【应用场景】 自然语言处理:用于机器翻译,将一种语言的句子逐词处理并结合上下文信息,翻译成另一种语言;文本生成,如写新闻稿、诗歌等,根据前文内容生成后续的文本。 语音识别:识别连续的语音信号,结合之前听到的语音片段来准确识别整个句子的内容。 GAN 算法(生成对抗网络) 【原理】 GAN 算法由两个 “对手” 组成,一个是生成器,另一个是判别器,它们就像两个在进行比赛的选手。 生成器的任务是生成数据,比如生成图像、文本等。一开始,生成器生成的数据质量很差,很容易被识别出来是假的。判别器的任务是判断输入的数据是真实数据还是生成器生成的假数据。 生成器会不断学习,尝试生成更逼真的数据来骗过判别器;而判别器也会不断提高自己的判断能力,准确区分真假数据。在这个对抗的过程中,生成器和判别器的能力都不断提升,最终生成器能够生成非常逼真的数据。 【应用场景】 图像生成:生成逼真的人脸、风景等图像,在游戏开发、影视制作中用于创建虚拟场景和角色。 数据增强:在训练机器学习模型时,通过 GAN 生成更多的训练数据,提高模型的泛化能力和性能。例如,在医学图像领域,生成更多的病理图像用于训练疾病诊断模型。 决策式AI和生成式AI 决策式 AI 【原理】 建立一个样本归属于特定类别的概率,再对新的场景进行判断、分析和预测。决策式 AI先学习大量已有的数据和规则,当遇到新的问题或情况时,它就会把当前的信息和自己学到的知识进行对比分析,按照一定的算法和逻辑,衡量各种可能的行动方案,最后选出它认为最合适的决策,就好像参谋根据战场形势和以往经验给出作战策略一样。 【应用场景】 交通信号控制:根据实时的车流量、行人数量等数据,决策式 AI 决定什么时候该亮红灯、绿灯,以优化交通流量,减少拥堵。 人脸识别,决策式AI对实时获取的人脸图像进行特征信息提取,再与人脸库中的特征数据匹配,从而实现人脸识别。 决策式AI可以通过学习电商平台上海量用户的消费行为数据,制订最合适的推荐方案,尽可能提升平台交易量。 生成式 AI 【原理】 生成式 AI 同样会学习大量已有的数据,比如很多的图片、文字、音频等。但它不是简单地根据规则做决策,而是在学习这些数据的模式和规律后,发挥 “想象力”,按照这些学到的模式来创造全新的内容,像生成一幅画、写一篇文章、创作一段音乐等,生成的内容看起来就像是人类创作的一样。 【应用场景】 现在比较火热的 ChatGPT、Deepseek等大型语言模型这些都是生成式AI,可以生成生成文字、图片、视频等等。 这里推荐大家去看丁磊的《生成式人工智能》这本书,对生成式AI介绍很透彻。 常用AI算法 语音识别 【原理】 它先学习大量的语音样本,记住不同语音对应的文字内容。当接收到新的语音时,就把这个语音和它学过的样本进行比对,找出最匹配的文字内容。 【应用场景】 智能音箱如小爱同学、天猫精灵,用户可以通过语音让它播放音乐、查询天气等;汽车的语音控制系统,让驾驶员通过语音操作导航、调节空调等。 虚拟现实(VR)和增强现实(AR) 【原理】 VR 是打造一个完全虚拟的世界,设备会根据人的动作和视角变化,实时调整虚拟场景的显示,让人感觉自己真的身处这个虚拟世界中。AR 则是把虚拟的信息叠加到现实场景中,通过摄像头捕捉现实画面,然后将虚拟元素融入其中展示给用户。 【应用场景】 VR 常用于游戏,让玩家有沉浸式的游戏体验;也用于一些培训场景,如飞行员模拟训练。AR 在教育领域,可以让学生通过手机或平板看到书本上的虚拟立体模型;在导航中,能将路线信息叠加在现实道路画面上。 深度学习 【原理】 可以想象成一个有很多层的知识大厦,深度学习通过构建多层的神经网络来学习数据。它结合了有监督和半监督学习,在学习过程中,数据在神经网络的各层之间传递和处理,每一层都会提取出不同层次和抽象程度的特征,最终实现对数据的深度理解和分析。 【应用场景】 人脸识别,用于门禁系统、安防监控;工业生产中的产品质量检测,通过识别产品外观缺陷来保证产品质量。 针对 AI 优化的硬件和芯片(如摄像头) 【原理】 这些硬件和芯片是专门为了让 AI 运行得更快、更高效而设计的。以摄像头为例,它要快速、准确地捕捉图像或视频数据,并且要能和 AI 算法很好地配合,把数据高效地传输给 AI 系统进行处理。 【应用场景】 安防监控摄像头,配合人脸识别、行为分析等 AI 算法,实时监控公共场所的安全情况;智能手机摄像头,利用 AI 算法实现拍照美化、场景识别等功能。 生物特征识别技术 【原理】 就像给每个人设置了一个独一无二的 “密码锁”。系统先学习每个人的生物特征(如指纹的纹路、面部的特征点、虹膜的图案等),把这些特征转化为数字代码存储起来。当有人进行身份验证时,系统会采集当前的生物特征,和存储的代码进行比对,如果匹配就验证通过。 【应用场景】 家用指纹锁,保障家庭安全;机场、高铁站的人脸识别闸机,加快旅客通关速度。 机器人流程自动化(RPA) 【原理】 用户输入具体的业务需求和规则,RPA 会按照这些规则自动执行一系列的操作,就像人在电脑上进行的各种操作一样,如数据录入、文件处理、报表生成等,从而节省人力和时间。 【应用场景】 金融行业的银行账户对账、保险理赔处理;企业的财务报销流程自动化。 自然语言处理(NLP) 【原理】 通过对大量文本数据的学习,分析语言的语法、语义和语用等信息。可以感知环境数据(如新闻报道中的事件信息)、行为数据(如用户在社交媒体上的发言),进行情感分析(判断文本是积极、消极还是中性情感),还能识别人的身份(通过对话内容中的特征),结合智能穿戴设备收集的数据来分析人的精神状态。 【应用场景】 智能客服,自动回答客户的问题;舆情监测,分析社交媒体上公众对某个事件或品牌的看法和情感倾向。 知识图谱 【原理】 一个大型的知识仓库,把以前储备的各种问题和对应的解决方法整理成一个数据库,并且梳理出它们之间的关系。当遇到类似的问题时,就可以快速在这个仓库里找到相关的信息和解决办法,并推荐给用户。 【应用场景】 电商平台的客服机器人,如淘宝小蜜,当用户咨询商品问题时,它能快速找到类似问题的答案进行回复;智能搜索,在搜索某个主题时,能展示相关的知识和关联信息。 本文由 @思睿 原创发布于人人都是产品经理。未经作者许可,禁止转载。 题图来自Unsplash,基于CC0协议。 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

AI产品的爆火,让不少人都希望做AI产品经理。但不是那么容易的,光是AI领域的这些基础名词,你知道多少呢?
DeepSeek实现信息整合和建议输出,Manus则直接具备独立完成复杂任务的闭环执行能力,从DeepSeek到Manus爆火,前后不足2个月,技术更新的很快。AI成为标配,产品经理也要持续更新迭代,在不确定的时代始终给自己一份确定感。
进化指南系列从AI基础入门、应用实践、场景挖掘三个方面通俗易懂地记录、分享AI学习与实践。
基础入门部门,系统地梳理大模型和AI基础知识,建立AI领域的基础语言,理解现有大模型的能力范围和边界,知道大模型能做哪些事情,不能做哪些事情。
AI产品、AI企业、AI产品经理
人工智能产品=数据+算法+算力
如果把人工智能产品比如刚刚开始学习的小孩,数据就是学习用的 “课本” 和 “资料”,数据越多学习的素材就越多;算法是学习的方法,不同的算法就像不同的学习方法,有的方法可能学习得又快又准,有的可能就会慢一些或者容易出错;算力:相当于 “大脑运转速度”,算力强就算的快,算力弱就有可能卡顿或处理不过来。
AI企业
分为基础层企业、技术层企业、应用层企业
AI=基础层:做AI核心技术的公司,比如提供AI算法模型的Deepseek,提供算法芯片的英伟达
AI+=技术层:对于基础AI能力进行包装和优化,输出通用方案的公司,比如计算机视觉、语音识别及语义处理
+AI=应用层:结合人工智能技术进行业务赋能,直接解决业务场景问题的公司,金融+AI、工业+AI、能源+AI等等。
AI产品经理
把AI技术包装为新产品或融入旧产品,用新方法解决用户需求的人。
在这样的要求下,就需要产品经理了解AI技术原理,能够进行解释说明,理解现有AI的能力范围和边界,知道AI能做哪些事情,不能做哪些事情。
经典算法模型
CNN 算法(卷积神经网络)
【原理】
可以把 CNN 算法想象成一个专业的图像检查员。当你拿到一张复杂的大图片时,要从中找出关键信息是很困难的。CNN 就像检查员一样,它不会一下子看完整张图片,而是把图片划分成一个个小区域,使用特定的 “小窗口”(卷积核)在这些小区域上滑动查看。
这个 “小窗口” 会检查每个小区域的特征,比如边缘、颜色变化等。每检查完一个小区域,就会输出一个表示该区域特征的数值。随着 “小窗口” 在整个图片上滑动,就能得到很多这样的数值,这些数值组成了一个新的 “特征图”。
CNN 会使用多个不同的 “小窗口”,得到多个不同的特征图,每个特征图关注图片的不同方面。之后,它会对这些特征图进行处理,比如通过池化操作减少数据量,保留重要信息。最后,把处理后的特征输入到全连接层,就像做总结一样,根据这些特征判断图片的类别。
【应用场景】
图像识别:在安防领域,用于识别监控画面中的人脸、车辆型号等;在医疗领域,帮助医生识别 X 光、CT 等影像中的病变。
自动驾驶:识别道路上的交通标志、行人、其他车辆等,为自动驾驶决策提供依据。
RNN 算法(循环神经网络)
【原理】
RNN 就像是一个有 “记忆” 的智能助手,专门处理和时间序列相关的数据。当你给它输入一系列数据时,它不仅仅关注当前输入的数据,还会记住之前输入的数据信息。
比如,当你输入一段文字时,RNN 会依次处理每个单词。在处理当前单词时,它会结合之前处理过的单词信息来理解句子的意思。这是因为 RNN 有一个循环结构,它会把上一个时间步的输出作为当前时间步的一部分输入,这样就可以保留历史信息。
不过,传统的 RNN 存在 “长时依赖” 问题,也就是很难记住很久之前的信息。后来出现了 LSTM(长短期记忆网络)和 GRU(门控循环单元)等改进版本,它们能更好地控制信息的记忆和遗忘,解决了长时依赖问题。
【应用场景】
自然语言处理:用于机器翻译,将一种语言的句子逐词处理并结合上下文信息,翻译成另一种语言;文本生成,如写新闻稿、诗歌等,根据前文内容生成后续的文本。
语音识别:识别连续的语音信号,结合之前听到的语音片段来准确识别整个句子的内容。
GAN 算法(生成对抗网络)
【原理】
GAN 算法由两个 “对手” 组成,一个是生成器,另一个是判别器,它们就像两个在进行比赛的选手。
生成器的任务是生成数据,比如生成图像、文本等。一开始,生成器生成的数据质量很差,很容易被识别出来是假的。判别器的任务是判断输入的数据是真实数据还是生成器生成的假数据。
生成器会不断学习,尝试生成更逼真的数据来骗过判别器;而判别器也会不断提高自己的判断能力,准确区分真假数据。在这个对抗的过程中,生成器和判别器的能力都不断提升,最终生成器能够生成非常逼真的数据。
【应用场景】
图像生成:生成逼真的人脸、风景等图像,在游戏开发、影视制作中用于创建虚拟场景和角色。
数据增强:在训练机器学习模型时,通过 GAN 生成更多的训练数据,提高模型的泛化能力和性能。例如,在医学图像领域,生成更多的病理图像用于训练疾病诊断模型。
决策式AI和生成式AI
决策式 AI
【原理】
建立一个样本归属于特定类别的概率,再对新的场景进行判断、分析和预测。决策式 AI先学习大量已有的数据和规则,当遇到新的问题或情况时,它就会把当前的信息和自己学到的知识进行对比分析,按照一定的算法和逻辑,衡量各种可能的行动方案,最后选出它认为最合适的决策,就好像参谋根据战场形势和以往经验给出作战策略一样。
【应用场景】
交通信号控制:根据实时的车流量、行人数量等数据,决策式 AI 决定什么时候该亮红灯、绿灯,以优化交通流量,减少拥堵。
人脸识别,决策式AI对实时获取的人脸图像进行特征信息提取,再与人脸库中的特征数据匹配,从而实现人脸识别。
决策式AI可以通过学习电商平台上海量用户的消费行为数据,制订最合适的推荐方案,尽可能提升平台交易量。
生成式 AI
【原理】
生成式 AI 同样会学习大量已有的数据,比如很多的图片、文字、音频等。但它不是简单地根据规则做决策,而是在学习这些数据的模式和规律后,发挥 “想象力”,按照这些学到的模式来创造全新的内容,像生成一幅画、写一篇文章、创作一段音乐等,生成的内容看起来就像是人类创作的一样。
【应用场景】
现在比较火热的 ChatGPT、Deepseek等大型语言模型这些都是生成式AI,可以生成生成文字、图片、视频等等。
这里推荐大家去看丁磊的《生成式人工智能》这本书,对生成式AI介绍很透彻。
常用AI算法
语音识别
【原理】
它先学习大量的语音样本,记住不同语音对应的文字内容。当接收到新的语音时,就把这个语音和它学过的样本进行比对,找出最匹配的文字内容。
【应用场景】
智能音箱如小爱同学、天猫精灵,用户可以通过语音让它播放音乐、查询天气等;汽车的语音控制系统,让驾驶员通过语音操作导航、调节空调等。
虚拟现实(VR)和增强现实(AR)
【原理】
VR 是打造一个完全虚拟的世界,设备会根据人的动作和视角变化,实时调整虚拟场景的显示,让人感觉自己真的身处这个虚拟世界中。AR 则是把虚拟的信息叠加到现实场景中,通过摄像头捕捉现实画面,然后将虚拟元素融入其中展示给用户。
【应用场景】
VR 常用于游戏,让玩家有沉浸式的游戏体验;也用于一些培训场景,如飞行员模拟训练。AR 在教育领域,可以让学生通过手机或平板看到书本上的虚拟立体模型;在导航中,能将路线信息叠加在现实道路画面上。
深度学习
【原理】
可以想象成一个有很多层的知识大厦,深度学习通过构建多层的神经网络来学习数据。它结合了有监督和半监督学习,在学习过程中,数据在神经网络的各层之间传递和处理,每一层都会提取出不同层次和抽象程度的特征,最终实现对数据的深度理解和分析。
【应用场景】
人脸识别,用于门禁系统、安防监控;工业生产中的产品质量检测,通过识别产品外观缺陷来保证产品质量。
针对 AI 优化的硬件和芯片(如摄像头)
【原理】
这些硬件和芯片是专门为了让 AI 运行得更快、更高效而设计的。以摄像头为例,它要快速、准确地捕捉图像或视频数据,并且要能和 AI 算法很好地配合,把数据高效地传输给 AI 系统进行处理。
【应用场景】
安防监控摄像头,配合人脸识别、行为分析等 AI 算法,实时监控公共场所的安全情况;智能手机摄像头,利用 AI 算法实现拍照美化、场景识别等功能。
生物特征识别技术
【原理】
就像给每个人设置了一个独一无二的 “密码锁”。系统先学习每个人的生物特征(如指纹的纹路、面部的特征点、虹膜的图案等),把这些特征转化为数字代码存储起来。当有人进行身份验证时,系统会采集当前的生物特征,和存储的代码进行比对,如果匹配就验证通过。
【应用场景】
家用指纹锁,保障家庭安全;机场、高铁站的人脸识别闸机,加快旅客通关速度。
机器人流程自动化(RPA)
【原理】
用户输入具体的业务需求和规则,RPA 会按照这些规则自动执行一系列的操作,就像人在电脑上进行的各种操作一样,如数据录入、文件处理、报表生成等,从而节省人力和时间。
【应用场景】
金融行业的银行账户对账、保险理赔处理;企业的财务报销流程自动化。
自然语言处理(NLP)
【原理】
通过对大量文本数据的学习,分析语言的语法、语义和语用等信息。可以感知环境数据(如新闻报道中的事件信息)、行为数据(如用户在社交媒体上的发言),进行情感分析(判断文本是积极、消极还是中性情感),还能识别人的身份(通过对话内容中的特征),结合智能穿戴设备收集的数据来分析人的精神状态。
【应用场景】
智能客服,自动回答客户的问题;舆情监测,分析社交媒体上公众对某个事件或品牌的看法和情感倾向。
知识图谱
【原理】
一个大型的知识仓库,把以前储备的各种问题和对应的解决方法整理成一个数据库,并且梳理出它们之间的关系。当遇到类似的问题时,就可以快速在这个仓库里找到相关的信息和解决办法,并推荐给用户。
【应用场景】
电商平台的客服机器人,如淘宝小蜜,当用户咨询商品问题时,它能快速找到类似问题的答案进行回复;智能搜索,在搜索某个主题时,能展示相关的知识和关联信息。
本文由 @思睿 原创发布于人人都是产品经理。未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。