模型、产品、实践三维度看AI

在人工智能蓬勃发展的当下，AI技术的复杂性与多样性让许多从业者和研究者感到既兴奋又困惑。为了更好地理解AI的全貌，本文将从模型、产品和实践三个维度展开深入探讨，供大家参考。今年是个热闹的AI年，年初的deepseekR1平地一声雷，又一次掀起了全民的热潮，做为一个AI行业的从业者，见证了23年AI的惊起到沉浸，再到24年的蓬勃发展，我想每个月进录一下在AI行业中发生的那些有趣的事情，就有了这份月报。 AI发展中最重要的一个事情莫过于模型能力&算力成本。模型能力决定了AI到底有多强，是洲际导弹还是弓箭；而算力成本决定了AI到底是个高大上的科研产品，还是普通人都可以日常使用的工具；AI月报的第一部分我们就来重点关注这个事情。第二部分是有趣的AI产品，会带着大家看看实用有趣的AI产品。第三部分是落地实践案例，我们去看看AI在日常生活中有哪些非常棒的使用方法。一、模型能力 & 算力成本 1.1 闭源模型 2月份新发布的模型： OpenAI的ChatGPT4.5（看不懂升级了点啥）马斯克的Grok3（榜单第一） Anthropic的Claude3.7（极强编程能力）谷歌的Gemini2.0系列（Flash、pro、Flash Thinking 百万上下文）模型排行榜参考Chatbot Arena LLM Leaderboard，它是业界公认的最公正、最权威榜单之一，也是全球顶级大模型的最重要竞技场。模型排行榜参考Chatbot Arena LLM Leaderboard，它是业界公认的最公正、最权威榜单之一，也是全球顶级大模型的最重要竞技场。它们的模型成本对比如图所示：从成本上来看，OpenAI的4.5真是离谱到家的产品，价格比最贵的Claude贵10倍以上了；谷歌的Gemini模型继续保持了量大便宜的惯例，Gemini和DeepSeek一样都支持缓存命中，相同内容的token成本还能再降低1/10。以下是新模型发布值得关注的点： 1）Claude 3.7：编程能力强到爆炸。在单独的模型编程榜中，Claude3.7无疑是遥遥领先了，其它模型跟它的差距变得更大了。从代码长度测试下来，600行的代码它可以轻轻松松写下来，1700行都能够搞定；之前Claude3.5也就300行轻松，再多一点各种bug频出了。一句话写个网页案例： 2）Grok3 是其它家没有的功能；模型能力也非常强，且没啥太多的忌讳。 3）Gemini2.0 超强的上下文能力，支持100万token，保持了Gemini家族的惯性。 4）ChatGPT的4.5升级了实在不知道它升级了点啥，目前只能200美刀一个月的会员才能用；从模型能力和测评上来看这个模型好像新版本强的有限。来源：Twitter karminski-牙医经典的草莓问题还是数不对，其它能力也看起来变化不大，具体的在等大家测试下来看看。来源：Twitter Alex Northstar 1.2 开源模型开源模型上通义发布了3个开源模型，他们分别是： 1）多模态识别模型 Qwen2.5-VL，有 3B、7B 和 72B 三个尺寸版本。 72B是比GPT4o和Claude3.5更强的视觉模型，能够最多支持1个小时的视频理解。不错的多模态识别能力 2）超长文本处理模型 Qwen2.5-1M，专门处理长文本的AI模型；分为7B和14B两个模型。在100万token的大海捞针中，有不错的表现 3）文生视频模型：Wan2.1 有1.3B和14B两个版本。视频评测VBench中踩下Sora、Pika等国际对手（总分86.22%第一）。 comfyUI也接入这个模型，效果看起来还是很不错的二、有趣的AI产品 1. ima知识库腾讯出品的一款基于deepseekR1的PC端知识库产品，用来阅读文章非常省事。支持网站浏览器和传文章等多种阅读方式，还可以搜索公众号的内容，记得用的时候选R1模型。用R1读文章，让它运用深度思考的能力同时说人话，可以快速抓到一个文章的重点，然后自己根据需求再去判断要不要继续读文章。 2. AI编程产品 Cursor 3.7出来了，做产品更方便了，这两款AI产品都适合用AI来写代码。 Cursor：最新版以Agent模式为核心，对小白来说用AI编程门槛又低了一些，之前的环境问题都可以让AI干活来搞定了；同时也支持Claude3.7，编程能力杠杠的。字节的Tera：一款新上的AI编程工具，交互页面更舒服一点，目前还是免费状态；支持3.5和3.7。 3. 用R1的一些渠道官网总是出现R1不干活的情况，2月份也有不少平替出来，各家云厂商也都支持了R1的调用，大家可以按需进行选择；但需要注意云厂商的R1是没有虚拟缓存的，对于批量打api的成本需要重新算成本。云的话：硅基云、阿里云、火山云都可以，根据大家的需求选择；官网也恢复充值了，但是看起来还是不稳定，没有1月份并发快。本地化+API调用建议选择chatbox+硅基流动，用起来体验还不错 4. 秘塔搜索研究模式把搜索变成了两种不同的研究模式，用于提升搜索的准确性，用起来体验还不错我在做API价格对比的时候搜了一下，抛掉Gemini2没找到信息源，整理的没啥问题 5. 可灵1.6的毛绒玩具把任何东西变成毛绒玩具，是个蛮好玩的特效功能；我试了试把灭霸转化一下，看起来还不错，而且生成的时候可灵还会给你加个好玩的配音。三、落地实践案例 1. 简单方便用好R1的一个小技巧：加一句说人话。就可以让R1输出的内容更加接地气，而不是高大上的一堆堆词。 2. Claude 3.7的画图，以下是一些案例参考 3. 飞书多维表格+R1 是个很便捷不需要开发就可以使用AI能力的文档，下面是一些给大家找的参考案例先介绍一下这个功能：飞书文档在最近的多维表格里接入了R1模型，可以直接通过表格来调取火山云的API来实现AI功能，不需要编程只需要调一下文档就可以了 Cynthia’s做的AI文献速度神器： https://jih7kdah80b.feishu.cn/wiki/BpSIwQSyritC1eko1OKcIvDknKb?table=tblK1CVZBHe1zBY9&view=vewekYXv2s 木水酱的AI胃之书：为了好好吃饭，我用飞书多维表格+DeepSeek做了个定制版胃之书 4. AI陪伴的总结文章：10 个月，5 万 DAU，我们可能找到了 AI 陪伴的另一种可能 AI创业中一直难绕过去的一个问题是token消耗，这和传统互联网时的边际成本递减完全反过来了，用户用的越多消耗越多，特别是聊天类的产品形态，还得把上下文包含进来要么角色就傻了，这个成本增加的更厉害，AI陪伴产品也就很难盈利。从王登科做的独响，可以看到他们对社交本身的深刻认知，然后打造了这样一款有意思的AI陪伴产品，能够产品有良性的增长和盈利；对业务深度的洞察是做好一个产品的永恒的前提。本文由人人都是产品经理作者【云舒】，微信公众号：【云舒的AI观察笔记】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。题图来自Unsplash，基于 CC0 协议。

模型、产品、实践三维度看AI

在人工智能蓬勃发展的当下，AI技术的复杂性与多样性让许多从业者和研究者感到既兴奋又困惑。为了更好地理解AI的全貌，本文将从模型、产品和实践三个维度展开深入探讨，供大家参考。

今年是个热闹的AI年，年初的deepseekR1平地一声雷，又一次掀起了全民的热潮，做为一个AI行业的从业者，见证了23年AI的惊起到沉浸，再到24年的蓬勃发展，我想每个月进录一下在AI行业中发生的那些有趣的事情，就有了这份月报。

AI发展中最重要的一个事情莫过于模型能力&算力成本。

模型能力决定了AI到底有多强，是洲际导弹还是弓箭；而算力成本决定了AI到底是个高大上的科研产品，还是普通人都可以日常使用的工具；AI月报的第一部分我们就来重点关注这个事情。

第二部分是有趣的AI产品，会带着大家看看实用有趣的AI产品。

第三部分是落地实践案例，我们去看看AI在日常生活中有哪些非常棒的使用方法。

一、模型能力 & 算力成本

1.1 闭源模型

2月份新发布的模型：

OpenAI的ChatGPT4.5（看不懂升级了点啥）
马斯克的Grok3（榜单第一）
Anthropic的Claude3.7（极强编程能力）
谷歌的Gemini2.0系列（Flash、pro、Flash Thinking 百万上下文）

模型排行榜参考Chatbot Arena LLM Leaderboard，它是业界公认的最公正、最权威榜单之一，也是全球顶级大模型的最重要竞技场。

模型排行榜参考Chatbot Arena LLM Leaderboard，它是业界公认的最公正、最权威榜单之一，也是全球顶级大模型的最重要竞技场。

它们的模型成本对比如图所示：

从成本上来看，OpenAI的4.5真是离谱到家的产品，价格比最贵的Claude贵10倍以上了；谷歌的Gemini模型继续保持了量大便宜的惯例，Gemini和DeepSeek一样都支持缓存命中，相同内容的token成本还能再降低1/10。

以下是新模型发布值得关注的点：

1）Claude 3.7：编程能力强到爆炸。

在单独的模型编程榜中，Claude3.7无疑是遥遥领先了，其它模型跟它的差距变得更大了。

从代码长度测试下来，600行的代码它可以轻轻松松写下来，1700行都能够搞定；之前Claude3.5也就300行轻松，再多一点各种bug频出了。

一句话写个网页案例：

2）Grok3

是其它家没有的功能；模型能力也非常强，且没啥太多的忌讳。

3）Gemini2.0

超强的上下文能力，支持100万token，保持了Gemini家族的惯性。

4）ChatGPT的4.5升级了

实在不知道它升级了点啥，目前只能200美刀一个月的会员才能用；从模型能力和测评上来看这个模型好像新版本强的有限。

来源：Twitter karminski-牙医

经典的草莓问题还是数不对，其它能力也看起来变化不大，具体的在等大家测试下来看看。

来源：Twitter Alex Northstar

1.2 开源模型

开源模型上通义发布了3个开源模型，他们分别是：

1）多模态识别模型

Qwen2.5-VL，有 3B、7B 和 72B 三个尺寸版本。

72B是比GPT4o和Claude3.5更强的视觉模型，能够最多支持1个小时的视频理解。

不错的多模态识别能力

2）超长文本处理模型

Qwen2.5-1M，专门处理长文本的AI模型；分为7B和14B两个模型。在100万token的大海捞针中，有不错的表现

3）文生视频模型：Wan2.1

有1.3B和14B两个版本。视频评测VBench中踩下Sora、Pika等国际对手（总分86.22%第一）。

comfyUI也接入这个模型，效果看起来还是很不错的

二、有趣的AI产品

1. ima知识库

腾讯出品的一款基于deepseekR1的PC端知识库产品，用来阅读文章非常省事。

支持网站浏览器和传文章等多种阅读方式，还可以搜索公众号的内容，记得用的时候选R1模型。

用R1读文章，让它运用深度思考的能力同时说人话，可以快速抓到一个文章的重点，然后自己根据需求再去判断要不要继续读文章。

2. AI编程产品

Cursor 3.7出来了，做产品更方便了，这两款AI产品都适合用AI来写代码。

Cursor：最新版以Agent模式为核心，对小白来说用AI编程门槛又低了一些，之前的环境问题都可以让AI干活来搞定了；同时也支持Claude3.7，编程能力杠杠的。

字节的Tera：一款新上的AI编程工具，交互页面更舒服一点，目前还是免费状态；支持3.5和3.7。

3. 用R1的一些渠道

官网总是出现R1不干活的情况，2月份也有不少平替出来，各家云厂商也都支持了R1的调用，大家可以按需进行选择；但需要注意云厂商的R1是没有虚拟缓存的，对于批量打api的成本需要重新算成本。

云的话：硅基云、阿里云、火山云都可以，根据大家的需求选择；官网也恢复充值了，但是看起来还是不稳定，没有1月份并发快。

本地化+API调用建议选择chatbox+硅基流动，用起来体验还不错

4. 秘塔搜索研究模式

把搜索变成了两种不同的研究模式，用于提升搜索的准确性，用起来体验还不错

我在做API价格对比的时候搜了一下，抛掉Gemini2没找到信息源，整理的没啥问题

5. 可灵1.6的毛绒玩具

把任何东西变成毛绒玩具，是个蛮好玩的特效功能；我试了试把灭霸转化一下，看起来还不错，而且生成的时候可灵还会给你加个好玩的配音。

三、落地实践案例

1. 简单方便用好R1的一个小技巧：加一句说人话。

就可以让R1输出的内容更加接地气，而不是高大上的一堆堆词。

2. Claude 3.7的画图，以下是一些案例参考

3. 飞书多维表格+R1

是个很便捷不需要开发就可以使用AI能力的文档，下面是一些给大家找的参考案例

先介绍一下这个功能：飞书文档在最近的多维表格里接入了R1模型，可以直接通过表格来调取火山云的API来实现AI功能，不需要编程只需要调一下文档就可以了

Cynthia’s做的AI文献速度神器：

https://jih7kdah80b.feishu.cn/wiki/BpSIwQSyritC1eko1OKcIvDknKb?table=tblK1CVZBHe1zBY9&view=vewekYXv2s

木水酱的AI胃之书：为了好好吃饭，我用飞书多维表格+DeepSeek做了个定制版胃之书

4. AI陪伴的总结文章：10 个月，5 万 DAU，我们可能找到了 AI 陪伴的另一种可能

AI创业中一直难绕过去的一个问题是token消耗，这和传统互联网时的边际成本递减完全反过来了，用户用的越多消耗越多，特别是聊天类的产品形态，还得把上下文包含进来要么角色就傻了，这个成本增加的更厉害，AI陪伴产品也就很难盈利。

从王登科做的独响，可以看到他们对社交本身的深刻认知，然后打造了这样一款有意思的AI陪伴产品，能够产品有良性的增长和盈利；对业务深度的洞察是做好一个产品的永恒的前提。

本文由人人都是产品经理作者【云舒】，微信公众号：【云舒的AI观察笔记】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

标签：

上一篇文章

8万私域粉复购暴跌？120天逆袭：不靠神话模型，死磕这3个真相

下一篇文章

Skype落幕-从与世界相连到被世界遗忘

相关帖子

月收入暴涨3092%，下载量激增1366%，社交出海再创文化社区新范式

月收入暴涨3092%，下载量激增1366%，社交出海再创文化社区...

客服引领未来：降本增效，提升客户体验

客服引领未来：降本增效，提升客户体验

看到月薪27k的产品岗我心动了，想到没经验我迟疑了

看到月薪27k的产品岗我心动了，想到没经验我迟疑了

Reader Reels Author Wholesale 中文