为了集福，我生成了100个福字

一年一度的集五福又开始了，不过有了AI的帮助，我们可以直接自己生成福字，不用再考虑到处找“福”字的问题。这篇文章，我们来看看作者测试的效果，AI的表现如何。临近过年啊，一年一度的集福大战又双叒叕拉开帷幕啦！之前家人不理解，说弄这个能给几百块钱啊，我说没有，人均几块钱，或者十几块钱的样子吧，运气好了，能有个几十左右吧。然后妈妈给我拿了 100 块钱，说：放下手机，去打扫卫生。将近 40 岁的年纪啊，还被这么一个小小的利益给拿捏了。当集福已成为习惯，越是到了年底，就会不由自主的想起来这个游戏。看到 “福” 字就像被施了定身咒，挪不动脚，眼睛直勾勾地盯着，满心想着赶紧掏出手机扫一扫，说不定就能扫到稀缺福卡。我也完全被这股集福热潮给 “拿捏” 得死死的，深陷其中，无法自拔。但，一天了不起能找到十几二十多个福字，概率还是很低的。如果说依靠数量取胜，那为什么我不能先给自己生成 100 个福，让就扫个过瘾呢。一、工具先行说干就干，我一头扎进了互联网的海洋，开始疯狂搜索如何利用 AI 生成福字的方法。我先是考虑使用专门的图形设计软件，如 photoshop 、Illustrator 、CorelDRAW，毕竟咱是做设计出身的，这几个软件基础功能还是掌握的。专业的设计图形软件功能强大，可以通过直接选择字体生成，后面再进行配图就可以了。但万事开头难啊，第一步安装软件，就花费了我好几个小时。打开软件后，发现一脸的茫然，毕竟十多年没有碰过了，我觉得我和这三个软件关系很熟，都是铁汁，但这三个软件对我一脸的茫然。又是一个小时，只生成了几个，还要排版，调整，眼瞅着天都黑了，我这点产出量，还不如直接用搜索得到的结果快呢。但，大活人哪能让尿给憋死啊。于是我放弃了专业的图形软件，改用 AI 工具来实现我的需求。 Kimi 我现打开了常用了kimi，发现kimi默认界面没有生图功能。给了我一段字体类型的介绍，然后又给我一些网页搜索结果。这 AI，和我想象的有点不不一样啊。不是说 AI 能够代替人类写作、画画和思考吗，这也没理解我的意思，也没达到我的要求啊。虽然能够解决问题，但这次的结果不满意，放弃～文心一言因为文心一言本质上也是文生文的 AI 工具，所以我在开始指令的时候，直接添加了场景的条件“画”。很多小伙伴都说自己对 AI 软件熟悉，但大多数都是在常用的基础上，还有一些细节技巧的东西也需要知道和了解。相对于Kimi的回答，文心一言的答案才是我这个场景需要的。虽然只生成了 9 个（大概率是排版的问题），虽然在同一个对话中我更改了场景，让其解释这 10 个福字都是使用什么字体，没有给我生成答案，而是继续生成福字。但相对于第一目标而言，结果还是令人满意的。文心一言似乎对上下文关联的理解有时候不是很好。或者说，它只是在车轱辘话，很少看到真正的「生成式内容」。所以理解文心一言的底层模型逻辑上并不是这么简洁的，很可能也加入了很多中间层的处理，也就是把文章里完整的词组、句子甚至段落也当成了可检索的对象，并且直出了（还要考虑一些指向性的关键词触发）。所以这里就会出现在同一组对话中，如果你突然做了场景变更，文心一言就难以跳出这个边界的范围。那么如果我们需要一个不同的场景回答，就需要新建一组对话。比如我新建了一组对话，没有加上画这个关键词做条件触发，那么就是文生文的结果。我以为我找到了窍门，所以我又返回了Kimi，告诉他，画：10 个字不同字体的福字。结果还是文生文。豆包再次使用豆包来生成，最近用豆包比较多，觉得豆包文生文，文生图，对于场景的理解，对于概念的叙述性都很强。我已经逐步从文心一言替换到 Kimi，现在又替换到豆包，作为 AI 常用工具了。先来看结果：帮我生成图片：生成 10 个不同字体的福字。为了避免重复，我直接把场景“图片”这个要求先加上了。所以给的结果是图片，这个是符合要求的。我是要 10 个不同字体，数量上不精准符合要求。但大总比少要少。最后就是不同字体：肉眼对比了一下，有近一半的字体应该是相同的。相对于 Kimi和文心一言，豆包生成的结果还是令人满意的，至少在便利性上面来说，一次就能解决问题。搜索了一下关于豆包的 AI 功能，在 24 年的 12 月份智能AI助手豆包升级文生图能力，支持一键生成指定文本。用户可以在生图提示词中加入文本要求，如“一张带有‘新年快乐’的图”，即可生成带有指定文字的图片。那么根据这样的要求，我又重新提出了一个指令：一张带有“福”的图。结果令人意想不到。豆包生成的图片，更加具有美感，不光是字体样式有了变化，连带图案也有了新的变化。这里猜测，豆包应该是在推理模块增加了一些场景关联。比如福字，在过年时候的使用场景，是有寓意的代表。那么单纯一个字的结果是不能满足用户需要的，所以可以增加一个装饰性的设计。也就是说豆包能理解对话之间的关系、场景布局以及链路的整体含义。其次，豆包是具有复杂推理能力，不仅能更好地识别内容，还能根据所识别的文字和图像信息进行复杂的逻辑计算。在回到我们最开始的主题：生成 100 个福字。豆包给出了近乎满意的结果（70 来个）。 Midjourney 和 StableDiffusion 这里有小伙伴会说了，国外的MJ和 SD 不是很强大吗，为啥不用呢。其实我在写文章最开始的时候也是考虑了这俩软件，毕竟之前用来做过一些比较特殊的内容。但不知道为啥今天一直登录不上去，折腾了一下没办法操作，也就放弃了。二、AI的理解与未来随着 AI 技术的不断发展，未来我们有望看到更强大的通用人工智能出现。这将使 AI 能够在更多领域发挥作用，如科学研究、艺术创作等。量子计算技术的发展也可能为 AI 带来巨大的计算能力提升，加速模型的训练和优化。如果说计算机还是一个机械化的工具，那么 AI 就是自动化的升级应用。计算机毕竟需要人去设定指令，需要人去下达指令；而 AI 则是具有一定的思考性，能够拟人定义，能够做出自一定的自我决策。 AI 作为一项具有深远影响力的技术，已经在众多领域展现出巨大的应用潜力和价值。通过深入理解 AI 的技术原理和应用场景，我们能够更好地把握这一技术带来的机遇，推动各行业的创新发展。然而，AI 的广泛应用也面临着诸多挑战，需要政府、企业、科研机构和社会各界共同努力，加强技术研发、完善法律法规、培养专业人才，以确保 AI 技术的健康、可持续发展。展望未来，AI 将继续深入渗透到各个领域，与其他新兴技术如物联网、区块链、量子计算等融合发展，创造更多的创新应用和商业模式。我们有理由相信，AI 将为人类社会带来更加美好的未来。最后放上三张来自大设AI特效字工具生成的福字，祝福大家新年快乐～借鉴文章：1天100张福字海报，真的有人接吗…… 图片生成：Kimi、文心一言、豆包、大社内容生成：豆包（50%），手打（50%）。专栏作家老虎~色，公众号：产品经理有话说，人人都是产品经理专栏作家。13年产品经理经历，涉及商业设计、业务转型、产品架构定义、个成成长等方面。自学AIGC落地应用，目前在鸿蒙场景做产品服务工作。本文原创发布于人人都是产品经理。未经许可，禁止转载题图来自 Unsplash，基于CC0协议该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

一年一度的集五福又开始了，不过有了AI的帮助，我们可以直接自己生成福字，不用再考虑到处找“福”字的问题。这篇文章，我们来看看作者测试的效果，AI的表现如何。

临近过年啊，一年一度的集福大战又双叒叕拉开帷幕啦！之前家人不理解，说弄这个能给几百块钱啊，我说没有，人均几块钱，或者十几块钱的样子吧，运气好了，能有个几十左右吧。然后妈妈给我拿了 100 块钱，说：放下手机，去打扫卫生。

将近 40 岁的年纪啊，还被这么一个小小的利益给拿捏了。当集福已成为习惯，越是到了年底，就会不由自主的想起来这个游戏。看到 “福” 字就像被施了定身咒，挪不动脚，眼睛直勾勾地盯着，满心想着赶紧掏出手机扫一扫，说不定就能扫到稀缺福卡。我也完全被这股集福热潮给 “拿捏” 得死死的，深陷其中，无法自拔。

但，一天了不起能找到十几二十多个福字，概率还是很低的。如果说依靠数量取胜，那为什么我不能先给自己生成 100 个福，让就扫个过瘾呢。

一、工具先行

说干就干，我一头扎进了互联网的海洋，开始疯狂搜索如何利用 AI 生成福字的方法。

我先是考虑使用专门的图形设计软件，如 photoshop 、Illustrator 、CorelDRAW，毕竟咱是做设计出身的，这几个软件基础功能还是掌握的。专业的设计图形软件功能强大，可以通过直接选择字体生成，后面再进行配图就可以了。但万事开头难啊，第一步安装软件，就花费了我好几个小时。打开软件后，发现一脸的茫然，毕竟十多年没有碰过了，我觉得我和这三个软件关系很熟，都是铁汁，但这三个软件对我一脸的茫然。又是一个小时，只生成了几个，还要排版，调整，眼瞅着天都黑了，我这点产出量，还不如直接用搜索得到的结果快呢。

但，大活人哪能让尿给憋死啊。于是我放弃了专业的图形软件，改用 AI 工具来实现我的需求。

Kimi

我现打开了常用了kimi，发现kimi默认界面没有生图功能。给了我一段字体类型的介绍，然后又给我一些网页搜索结果。这 AI，和我想象的有点不不一样啊。不是说 AI 能够代替人类写作、画画和思考吗，这也没理解我的意思，也没达到我的要求啊。

虽然能够解决问题，但这次的结果不满意，放弃～

文心一言

因为文心一言本质上也是文生文的 AI 工具，所以我在开始指令的时候，直接添加了场景的条件“画”。很多小伙伴都说自己对 AI 软件熟悉，但大多数都是在常用的基础上，还有一些细节技巧的东西也需要知道和了解。

相对于Kimi的回答，文心一言的答案才是我这个场景需要的。虽然只生成了 9 个（大概率是排版的问题），虽然在同一个对话中我更改了场景，让其解释这 10 个福字都是使用什么字体，没有给我生成答案，而是继续生成福字。但相对于第一目标而言，结果还是令人满意的。

文心一言似乎对上下文关联的理解有时候不是很好。或者说，它只是在车轱辘话，很少看到真正的「生成式内容」。所以理解文心一言的底层模型逻辑上并不是这么简洁的，很可能也加入了很多中间层的处理，也就是把文章里完整的词组、句子甚至段落也当成了可检索的对象，并且直出了（还要考虑一些指向性的关键词触发）。所以这里就会出现在同一组对话中，如果你突然做了场景变更，文心一言就难以跳出这个边界的范围。那么如果我们需要一个不同的场景回答，就需要新建一组对话。

比如我新建了一组对话，没有加上画这个关键词做条件触发，那么就是文生文的结果。

我以为我找到了窍门，所以我又返回了Kimi，告诉他，画：10 个字不同字体的福字。结果还是文生文。

豆包

再次使用豆包来生成，最近用豆包比较多，觉得豆包文生文，文生图，对于场景的理解，对于概念的叙述性都很强。我已经逐步从文心一言替换到 Kimi，现在又替换到豆包，作为 AI 常用工具了。

先来看结果：帮我生成图片：生成 10 个不同字体的福字。

为了避免重复，我直接把场景“图片”这个要求先加上了。所以给的结果是图片，这个是符合要求的。

我是要 10 个不同字体，数量上不精准符合要求。但大总比少要少。

最后就是不同字体：肉眼对比了一下，有近一半的字体应该是相同的。

相对于 Kimi和文心一言，豆包生成的结果还是令人满意的，至少在便利性上面来说，一次就能解决问题。搜索了一下关于豆包的 AI 功能，在 24 年的 12 月份智能AI助手豆包升级文生图能力，支持一键生成指定文本。用户可以在生图提示词中加入文本要求，如“一张带有‘新年快乐’的图”，即可生成带有指定文字的图片。

那么根据这样的要求，我又重新提出了一个指令：一张带有“福”的图。结果令人意想不到。

豆包生成的图片，更加具有美感，不光是字体样式有了变化，连带图案也有了新的变化。这里猜测，豆包应该是在推理模块增加了一些场景关联。比如福字，在过年时候的使用场景，是有寓意的代表。那么单纯一个字的结果是不能满足用户需要的，所以可以增加一个装饰性的设计。也就是说豆包能理解对话之间的关系、场景布局以及链路的整体含义。其次，豆包是具有复杂推理能力，不仅能更好地识别内容，还能根据所识别的文字和图像信息进行复杂的逻辑计算。

在回到我们最开始的主题：生成 100 个福字。豆包给出了近乎满意的结果（70 来个）。

Midjourney 和 StableDiffusion

这里有小伙伴会说了，国外的MJ和 SD 不是很强大吗，为啥不用呢。其实我在写文章最开始的时候也是考虑了这俩软件，毕竟之前用来做过一些比较特殊的内容。但不知道为啥今天一直登录不上去，折腾了一下没办法操作，也就放弃了。

二、AI的理解与未来

随着 AI 技术的不断发展，未来我们有望看到更强大的通用人工智能出现。这将使 AI 能够在更多领域发挥作用，如科学研究、艺术创作等。量子计算技术的发展也可能为 AI 带来巨大的计算能力提升，加速模型的训练和优化。如果说计算机还是一个机械化的工具，那么 AI 就是自动化的升级应用。计算机毕竟需要人去设定指令，需要人去下达指令；而 AI 则是具有一定的思考性，能够拟人定义，能够做出自一定的自我决策。

AI 作为一项具有深远影响力的技术，已经在众多领域展现出巨大的应用潜力和价值。通过深入理解 AI 的技术原理和应用场景，我们能够更好地把握这一技术带来的机遇，推动各行业的创新发展。然而，AI 的广泛应用也面临着诸多挑战，需要政府、企业、科研机构和社会各界共同努力，加强技术研发、完善法律法规、培养专业人才，以确保 AI 技术的健康、可持续发展。

展望未来，AI 将继续深入渗透到各个领域，与其他新兴技术如物联网、区块链、量子计算等融合发展，创造更多的创新应用和商业模式。我们有理由相信，AI 将为人类社会带来更加美好的未来。

最后放上三张来自大设AI特效字工具生成的福字，祝福大家新年快乐～