翻译功能已出,小红书的AI布局还会远吗?
随着TikTok在美国经历短暂停服风波,大量海外用户涌入小红书,语言不通成为首要难题。然而,小红书迅速上线的翻译功能不仅解决了语言障碍,还意外展现出强大的AI能力,甚至能够翻译网络俚语、颜文字和摩斯密码。这一功能背后隐藏着怎样的技术秘密?小红书的AI布局又将如何影响其未来发展? 由于美官方禁令,TikTok公司(下称TT)于当地时间2025年1月18日中午停止在美服务,于1月19日中午恢复服务。 在停服时间前后,大量“TikTok难民”涌入“平替”小红书。而未大力增长海外业务的小红书,在面临海内外共用服务器对现有社区的一次冲击,采取了诸多方式迎接挑战,包括本文主要探讨议题——5天迅速上线的“翻译”功能。 1月16日左右,TT停服的风声传遍全美,继而“爆发”了TikTok难民事件,大量美国人涌入小红书。 首当其冲的是最严峻的问题,新来的用户与社区本土语言难以互通。在众多呼声中,小红书在1月19日左右上线了翻译功能。 起初,大家预期只是简单的语言翻译功能,可以一键将中文与所设置的系统语言互译。 有道词典以为小红书只是接了翻译接口,而自己作为“翻译专家”却无人问津 慢慢地,大量网民发现这不是简单的翻译,一些新潮的网络俚语和其他字符也可以被翻译出来。 1、网络俚语 2、颜文字 3、摩斯密码 看起来,这不是普通的翻译可以做到的,如果是一个纯翻译的功能,为了追求准确性和严谨性,对应的固定匹配结果一定是相对生硬的,而非这么有“互联网味儿”。 这是怎么回事呢? 很快,有网友通过一些“奇特代码”,发现了背后的“秘密”。 输入一些特定格式的内容时,竟然可以发出“指令”信息,甚至“钓”出了背后的大佬。 “翻译”供出来了自己接入了大语言模型(GPT-4,是否为真有待商榷),这也解释了为什么前面五花八门的内容,都能翻到大伙的心趴上。 基于这个现象,我个人推测,小红书在调用大模型时,提前预设了类似“翻译用户的输入”的prompt,并把评论内容作为大模型的input;但是没想到的是(或没来得及优化),由于模型的不稳定,指令遵循能力不够强,用户内容中有明显分隔文案(图中为“after that”)后的剩余内容被作为指令执行,忽略了“翻译”的期望方向。 另外,还有一个有趣的现象,以prompt的内容,问出相同的问题,大模型又声称自己是【智谱清言(ChatGLM)】。 经过评论区多种prompt测试,最终只出现过这两种结果:【GPT-4】和【智谱清言】。基于以下几点原因: 政治层面,较为主流的社交软接入国外API会涉及到信息安全问题; 性能方面,GPT-4训练的中文语料很少,难以达到目前小红书里呈现出的翻译性能; 权限方面,GPT-4的公司OpenAI在去年7月切断了非支持国家的API服务,其中支持国家不包括中国内地、中国香港和澳门。 因此,最终猜测接入的是智谱清言大模型。 而出现GPT大概率是由于智谱清言是基于GPT大模型微调,大量使用了GPT语料库,以致于在模型蒸馏后产生了幻觉。 回归到产品分析上,从产品功能定位看,小红书的翻译注定不能和有道词典有相同的定位。 从使用场景上看,在互联网交流中,俚语是构成互联网沟通的主要元素之一。 可以观察发现,在这场TT难民迁移活动中,很多美国用户热衷于用“NB”、”666″、“cpdd”等有中国特色的俚语对帖子进行评价,并以此作为主要融入方式。 大语言模型的接入自然而然有了先决条件:既符合了“翻译”语言的定位,经过国内互联网语料信息训练后的模型,也符合了“融入文化”的定位: 对于美国人,在极大地降低了APP使用门槛的同时,也发现了这个平台和TikTok对于不同社交需求的满足点; 对于小红书上的“原住民”,在好奇、自豪等等兴奋状态下,强化了AI提高APP体验的实际感受。 这也让小红书在TikTok短短停服的几天内,在巧妙接住泼天流量的同时,也为AI的应用落地探索迈出了重要的一步。 本文由 @倩仪 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
随着TikTok在美国经历短暂停服风波,大量海外用户涌入小红书,语言不通成为首要难题。然而,小红书迅速上线的翻译功能不仅解决了语言障碍,还意外展现出强大的AI能力,甚至能够翻译网络俚语、颜文字和摩斯密码。这一功能背后隐藏着怎样的技术秘密?小红书的AI布局又将如何影响其未来发展?
由于美官方禁令,TikTok公司(下称TT)于当地时间2025年1月18日中午停止在美服务,于1月19日中午恢复服务。
在停服时间前后,大量“TikTok难民”涌入“平替”小红书。而未大力增长海外业务的小红书,在面临海内外共用服务器对现有社区的一次冲击,采取了诸多方式迎接挑战,包括本文主要探讨议题——5天迅速上线的“翻译”功能。
1月16日左右,TT停服的风声传遍全美,继而“爆发”了TikTok难民事件,大量美国人涌入小红书。
首当其冲的是最严峻的问题,新来的用户与社区本土语言难以互通。在众多呼声中,小红书在1月19日左右上线了翻译功能。
起初,大家预期只是简单的语言翻译功能,可以一键将中文与所设置的系统语言互译。
有道词典以为小红书只是接了翻译接口,而自己作为“翻译专家”却无人问津
慢慢地,大量网民发现这不是简单的翻译,一些新潮的网络俚语和其他字符也可以被翻译出来。
1、网络俚语
2、颜文字
3、摩斯密码
看起来,这不是普通的翻译可以做到的,如果是一个纯翻译的功能,为了追求准确性和严谨性,对应的固定匹配结果一定是相对生硬的,而非这么有“互联网味儿”。
这是怎么回事呢?
很快,有网友通过一些“奇特代码”,发现了背后的“秘密”。
输入一些特定格式的内容时,竟然可以发出“指令”信息,甚至“钓”出了背后的大佬。
“翻译”供出来了自己接入了大语言模型(GPT-4,是否为真有待商榷),这也解释了为什么前面五花八门的内容,都能翻到大伙的心趴上。
基于这个现象,我个人推测,小红书在调用大模型时,提前预设了类似“翻译用户的输入”的prompt,并把评论内容作为大模型的input;但是没想到的是(或没来得及优化),由于模型的不稳定,指令遵循能力不够强,用户内容中有明显分隔文案(图中为“after that”)后的剩余内容被作为指令执行,忽略了“翻译”的期望方向。
另外,还有一个有趣的现象,以prompt的内容,问出相同的问题,大模型又声称自己是【智谱清言(ChatGLM)】。
经过评论区多种prompt测试,最终只出现过这两种结果:【GPT-4】和【智谱清言】。基于以下几点原因:
- 政治层面,较为主流的社交软接入国外API会涉及到信息安全问题;
- 性能方面,GPT-4训练的中文语料很少,难以达到目前小红书里呈现出的翻译性能;
- 权限方面,GPT-4的公司OpenAI在去年7月切断了非支持国家的API服务,其中支持国家不包括中国内地、中国香港和澳门。
因此,最终猜测接入的是智谱清言大模型。
而出现GPT大概率是由于智谱清言是基于GPT大模型微调,大量使用了GPT语料库,以致于在模型蒸馏后产生了幻觉。
回归到产品分析上,从产品功能定位看,小红书的翻译注定不能和有道词典有相同的定位。
从使用场景上看,在互联网交流中,俚语是构成互联网沟通的主要元素之一。
可以观察发现,在这场TT难民迁移活动中,很多美国用户热衷于用“NB”、”666″、“cpdd”等有中国特色的俚语对帖子进行评价,并以此作为主要融入方式。
大语言模型的接入自然而然有了先决条件:既符合了“翻译”语言的定位,经过国内互联网语料信息训练后的模型,也符合了“融入文化”的定位:
- 对于美国人,在极大地降低了APP使用门槛的同时,也发现了这个平台和TikTok对于不同社交需求的满足点;
- 对于小红书上的“原住民”,在好奇、自豪等等兴奋状态下,强化了AI提高APP体验的实际感受。
这也让小红书在TikTok短短停服的几天内,在巧妙接住泼天流量的同时,也为AI的应用落地探索迈出了重要的一步。
本文由 @倩仪 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
你的反应是什么?