为了集福,我生成了100个福字
一年一度的集五福又开始了,不过有了AI的帮助,我们可以直接自己生成福字,不用再考虑到处找“福”字的问题。这篇文章,我们来看看作者测试的效果,AI的表现如何。 临近过年啊,一年一度的集福大战又双叒叕拉开帷幕啦!之前家人不理解,说弄这个能给几百块钱啊,我说没有,人均几块钱,或者十几块钱的样子吧,运气好了,能有个几十左右吧。然后妈妈给我拿了 100 块钱,说:放下手机,去打扫卫生。 将近 40 岁的年纪啊,还被这么一个小小的利益给拿捏了。当集福已成为习惯,越是到了年底,就会不由自主的想起来这个游戏。看到 “福” 字就像被施了定身咒,挪不动脚,眼睛直勾勾地盯着,满心想着赶紧掏出手机扫一扫,说不定就能扫到稀缺福卡。我也完全被这股集福热潮给 “拿捏” 得死死的,深陷其中,无法自拔。 但,一天了不起能找到十几二十多个福字,概率还是很低的。如果说依靠数量取胜,那为什么我不能先给自己生成 100 个福,让就扫个过瘾呢。 一、工具先行 说干就干,我一头扎进了互联网的海洋,开始疯狂搜索如何利用 AI 生成福字的方法 。 我先是考虑使用专门的图形设计软件,如 photoshop 、Illustrator 、CorelDRAW,毕竟咱是做设计出身的,这几个软件基础功能还是掌握的。专业的设计图形软件功能强大,可以通过直接选择字体生成,后面再进行配图就可以了。但万事开头难啊,第一步安装软件,就花费了我好几个小时。打开软件后,发现一脸的茫然,毕竟十多年没有碰过了,我觉得我和这三个软件关系很熟,都是铁汁,但这三个软件对我一脸的茫然。又是一个小时,只生成了几个,还要排版,调整,眼瞅着天都黑了,我这点产出量,还不如直接用搜索得到的结果快呢。 但,大活人哪能让尿给憋死啊。于是我放弃了专业的图形软件,改用 AI 工具来实现我的需求。 Kimi 我现打开了常用了kimi,发现kimi默认界面没有生图功能。给了我一段字体类型的介绍,然后又给我一些网页搜索结果。这 AI,和我想象的有点不不一样啊。不是说 AI 能够代替人类写作、画画和思考吗,这也没理解我的意思,也没达到我的要求啊。 虽然能够解决问题,但这次的结果不满意,放弃~ 文心一言 因为文心一言本质上也是文生文的 AI 工具,所以我在开始指令的时候,直接添加了场景的条件“画”。很多小伙伴都说自己对 AI 软件熟悉,但大多数都是在常用的基础上,还有一些细节技巧的东西也需要知道和了解。 相对于Kimi的回答,文心一言的答案才是我这个场景需要的。虽然只生成了 9 个(大概率是排版的问题),虽然在同一个对话中我更改了场景,让其解释这 10 个福字都是使用什么字体,没有给我生成答案,而是继续生成福字。但相对于第一目标而言,结果还是令人满意的。 文心一言似乎对上下文关联的理解有时候不是很好。或者说,它只是在车轱辘话,很少看到真正的「生成式内容」。所以理解文心一言的底层模型逻辑上并不是这么简洁的,很可能也加入了很多中间层的处理,也就是把文章里完整的词组、句子甚至段落也当成了可检索的对象,并且直出了(还要考虑一些指向性的关键词触发)。所以这里就会出现在同一组对话中,如果你突然做了场景变更,文心一言就难以跳出这个边界的范围。那么如果我们需要一个不同的场景回答,就需要新建一组对话。 比如我新建了一组对话,没有加上画这个关键词做条件触发,那么就是文生文的结果。 我以为我找到了窍门,所以我又返回了Kimi,告诉他,画:10 个字不同字体的福字。结果还是文生文。 豆包 再次使用豆包来生成,最近用豆包比较多,觉得豆包文生文,文生图,对于场景的理解,对于概念的叙述性都很强。我已经逐步从文心一言替换到 Kimi,现在又替换到豆包,作为 AI 常用工具了。 先来看结果:帮我生成图片:生成 10 个不同字体的福字。 为了避免重复,我直接把场景“图片”这个要求先加上了。所以给的结果是图片,这个是符合要求的。 我是要 10 个不同字体,数量上不精准符合要求。但大总比少要少。 最后就是不同字体:肉眼对比了一下,有近一半的字体应该是相同的。 相对于 Kimi和文心一言,豆包生成的结果还是令人满意的,至少在便利性上面来说,一次就能解决问题。搜索了一下关于豆包的 AI 功能,在 24 年的 12 月份智能AI助手豆包升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求,如“一张带有‘新年快乐’的图”,即可生成带有指定文字的图片。 那么根据这样的要求,我又重新提出了一个指令:一张带有“福”的图。结果令人意想不到。 豆包生成的图片,更加具有美感,不光是字体样式有了变化,连带图案也有了新的变化。这里猜测,豆包应该是在推理模块增加了一些场景关联。比如福字,在过年时候的使用场景,是有寓意的代表。那么单纯一个字的结果是不能满足用户需要的,所以可以增加一个装饰性的设计。也就是说豆包能理解对话之间的关系、场景布局以及链路的整体含义。其次,豆包是具有复杂推理能力,不仅能更好地识别内容,还能根据所识别的文字和图像信息进行复杂的逻辑计算。 在回到我们最开始的主题:生成 100 个福字。豆包给出了近乎满意的结果(70 来个)。 Midjourney 和 StableDiffusion 这里有小伙伴会说了,国外的MJ和 SD 不是很强大吗,为啥不用呢。其实我在写文章最开始的时候也是考虑了这俩软件,毕竟之前用来做过一些比较特殊的内容。但不知道为啥今天一直登录不上去,折腾了一下没办法操作,也就放弃了。 二、AI的理解与未来 随着 AI 技术的不断发展,未来我们有望看到更强大的通用人工智能出现。这将使 AI 能够在更多领域发挥作用,如科学研究、艺术创作等。量子计算技术的发展也可能为 AI 带来巨大的计算能力提升,加速模型的训练和优化。如果说计算机还是一个机械化的工具,那么 AI 就是自动化的升级应用。计算机毕竟需要人去设定指令,需要人去下达指令;而 AI 则是具有一定的思考性,能够拟人定义,能够做出自一定的自我决策。 AI 作为一项具有深远影响力的技术,已经在众多领域展现出巨大的应用潜力和价值。通过深入理解 AI 的技术原理和应用场景,我们能够更好地把握这一技术带来的机遇,推动各行业的创新发展。然而,AI 的广泛应用也面临着诸多挑战,需要政府、企业、科研机构和社会各界共同努力,加强技术研发、完善法律法规、培养专业人才,以确保 AI 技术的健康、可持续发展。 展望未来,AI 将继续深入渗透到各个领域,与其他新兴技术如物联网、区块链、量子计算等融合发展,创造更多的创新应用和商业模式。我们有理由相信,AI 将为人类社会带来更加美好的未来。 最后放上三张来自大设AI特效字工具生成的福字,祝福大家新年快乐~ 借鉴文章:1天100张福字海报,真的有人接吗…… 图片生成:Kimi、文心一言、豆包、大社 内容生成:豆包(50%),手打(50%)。 专栏作家 老虎~色,公众号:产品经理有话说,人人都是产品经理专栏作家。13年产品经理经历,涉及商业设计、业务转型、产品架构定义、个成成长等方面。自学AIGC落地应用,目前在鸿蒙场景做产品服务工作。 本文原创发布于人人都是产品经理。未经许可,禁止转载 题图来自 Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
一年一度的集五福又开始了,不过有了AI的帮助,我们可以直接自己生成福字,不用再考虑到处找“福”字的问题。这篇文章,我们来看看作者测试的效果,AI的表现如何。
临近过年啊,一年一度的集福大战又双叒叕拉开帷幕啦!之前家人不理解,说弄这个能给几百块钱啊,我说没有,人均几块钱,或者十几块钱的样子吧,运气好了,能有个几十左右吧。然后妈妈给我拿了 100 块钱,说:放下手机,去打扫卫生。
将近 40 岁的年纪啊,还被这么一个小小的利益给拿捏了。当集福已成为习惯,越是到了年底,就会不由自主的想起来这个游戏。看到 “福” 字就像被施了定身咒,挪不动脚,眼睛直勾勾地盯着,满心想着赶紧掏出手机扫一扫,说不定就能扫到稀缺福卡。我也完全被这股集福热潮给 “拿捏” 得死死的,深陷其中,无法自拔。
但,一天了不起能找到十几二十多个福字,概率还是很低的。如果说依靠数量取胜,那为什么我不能先给自己生成 100 个福,让就扫个过瘾呢。
一、工具先行
说干就干,我一头扎进了互联网的海洋,开始疯狂搜索如何利用 AI 生成福字的方法 。
我先是考虑使用专门的图形设计软件,如 photoshop 、Illustrator 、CorelDRAW,毕竟咱是做设计出身的,这几个软件基础功能还是掌握的。专业的设计图形软件功能强大,可以通过直接选择字体生成,后面再进行配图就可以了。但万事开头难啊,第一步安装软件,就花费了我好几个小时。打开软件后,发现一脸的茫然,毕竟十多年没有碰过了,我觉得我和这三个软件关系很熟,都是铁汁,但这三个软件对我一脸的茫然。又是一个小时,只生成了几个,还要排版,调整,眼瞅着天都黑了,我这点产出量,还不如直接用搜索得到的结果快呢。
但,大活人哪能让尿给憋死啊。于是我放弃了专业的图形软件,改用 AI 工具来实现我的需求。
Kimi
我现打开了常用了kimi,发现kimi默认界面没有生图功能。给了我一段字体类型的介绍,然后又给我一些网页搜索结果。这 AI,和我想象的有点不不一样啊。不是说 AI 能够代替人类写作、画画和思考吗,这也没理解我的意思,也没达到我的要求啊。
虽然能够解决问题,但这次的结果不满意,放弃~
文心一言
因为文心一言本质上也是文生文的 AI 工具,所以我在开始指令的时候,直接添加了场景的条件“画”。很多小伙伴都说自己对 AI 软件熟悉,但大多数都是在常用的基础上,还有一些细节技巧的东西也需要知道和了解。
相对于Kimi的回答,文心一言的答案才是我这个场景需要的。虽然只生成了 9 个(大概率是排版的问题),虽然在同一个对话中我更改了场景,让其解释这 10 个福字都是使用什么字体,没有给我生成答案,而是继续生成福字。但相对于第一目标而言,结果还是令人满意的。
文心一言似乎对上下文关联的理解有时候不是很好。或者说,它只是在车轱辘话,很少看到真正的「生成式内容」。所以理解文心一言的底层模型逻辑上并不是这么简洁的,很可能也加入了很多中间层的处理,也就是把文章里完整的词组、句子甚至段落也当成了可检索的对象,并且直出了(还要考虑一些指向性的关键词触发)。所以这里就会出现在同一组对话中,如果你突然做了场景变更,文心一言就难以跳出这个边界的范围。那么如果我们需要一个不同的场景回答,就需要新建一组对话。
比如我新建了一组对话,没有加上画这个关键词做条件触发,那么就是文生文的结果。
我以为我找到了窍门,所以我又返回了Kimi,告诉他,画:10 个字不同字体的福字。结果还是文生文。
豆包
再次使用豆包来生成,最近用豆包比较多,觉得豆包文生文,文生图,对于场景的理解,对于概念的叙述性都很强。我已经逐步从文心一言替换到 Kimi,现在又替换到豆包,作为 AI 常用工具了。
先来看结果:帮我生成图片:生成 10 个不同字体的福字。
为了避免重复,我直接把场景“图片”这个要求先加上了。所以给的结果是图片,这个是符合要求的。
我是要 10 个不同字体,数量上不精准符合要求。但大总比少要少。
最后就是不同字体:肉眼对比了一下,有近一半的字体应该是相同的。
相对于 Kimi和文心一言,豆包生成的结果还是令人满意的,至少在便利性上面来说,一次就能解决问题。搜索了一下关于豆包的 AI 功能,在 24 年的 12 月份智能AI助手豆包升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求,如“一张带有‘新年快乐’的图”,即可生成带有指定文字的图片。
那么根据这样的要求,我又重新提出了一个指令:一张带有“福”的图。结果令人意想不到。
豆包生成的图片,更加具有美感,不光是字体样式有了变化,连带图案也有了新的变化。这里猜测,豆包应该是在推理模块增加了一些场景关联。比如福字,在过年时候的使用场景,是有寓意的代表。那么单纯一个字的结果是不能满足用户需要的,所以可以增加一个装饰性的设计。也就是说豆包能理解对话之间的关系、场景布局以及链路的整体含义。其次,豆包是具有复杂推理能力,不仅能更好地识别内容,还能根据所识别的文字和图像信息进行复杂的逻辑计算。
在回到我们最开始的主题:生成 100 个福字。豆包给出了近乎满意的结果(70 来个)。
Midjourney 和 StableDiffusion
这里有小伙伴会说了,国外的MJ和 SD 不是很强大吗,为啥不用呢。其实我在写文章最开始的时候也是考虑了这俩软件,毕竟之前用来做过一些比较特殊的内容。但不知道为啥今天一直登录不上去,折腾了一下没办法操作,也就放弃了。
二、AI的理解与未来
随着 AI 技术的不断发展,未来我们有望看到更强大的通用人工智能出现。这将使 AI 能够在更多领域发挥作用,如科学研究、艺术创作等。量子计算技术的发展也可能为 AI 带来巨大的计算能力提升,加速模型的训练和优化。如果说计算机还是一个机械化的工具,那么 AI 就是自动化的升级应用。计算机毕竟需要人去设定指令,需要人去下达指令;而 AI 则是具有一定的思考性,能够拟人定义,能够做出自一定的自我决策。
AI 作为一项具有深远影响力的技术,已经在众多领域展现出巨大的应用潜力和价值。通过深入理解 AI 的技术原理和应用场景,我们能够更好地把握这一技术带来的机遇,推动各行业的创新发展。然而,AI 的广泛应用也面临着诸多挑战,需要政府、企业、科研机构和社会各界共同努力,加强技术研发、完善法律法规、培养专业人才,以确保 AI 技术的健康、可持续发展。
展望未来,AI 将继续深入渗透到各个领域,与其他新兴技术如物联网、区块链、量子计算等融合发展,创造更多的创新应用和商业模式。我们有理由相信,AI 将为人类社会带来更加美好的未来。
最后放上三张来自大设AI特效字工具生成的福字,祝福大家新年快乐~
借鉴文章:1天100张福字海报,真的有人接吗……
图片生成:Kimi、文心一言、豆包、大社
内容生成:豆包(50%),手打(50%)。
专栏作家
老虎~色,公众号:产品经理有话说,人人都是产品经理专栏作家。13年产品经理经历,涉及商业设计、业务转型、产品架构定义、个成成长等方面。自学AIGC落地应用,目前在鸿蒙场景做产品服务工作。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自 Unsplash,基于CC0协议
你的反应是什么?