DeepSeek为什么更像人?深挖其文化基因与思维方式
最近几天,AI圈的头条都是被国产大模型DeepSeek占据。其优异中文表现让人好奇:DeepSeek到底是如何思考并运用中文语言的?这篇文章,我们看看作者与DeepSeek深度对话后摘录的部分回答,看完后也许会给大家带来更客观的视角和启发。 最近,国产人工智能大语言模型DeepSeek火遍全球。 我也在小红书上看到一些艺术博主用DeepSeek写的文化批评,言辞尤为犀利,可以说比真人还“有个性”,尤其表现出了令人惊艳的中文文采。 遂自己也去试了下,发现它用来做民粹主义发言再合适不过了。 但我更好奇的其实是:DeepSeek到底是如何思考并运用中文语言的? 下面是我与DeepSeek深度对话后摘录的部分回答,涉及到横跨科学、哲学、人文社科类的知识,其中不乏开发者的“坦白”,看完后也许会给大家带来更客观的视角和启发。 (PS:部分Mermaid与Markdown语言,我用KIMI AI和迅捷画图将他们转化为了流程图) 一、训练数据溯源 二、模型架构基因 1. 基础结构谱系 2.关键改进模块 三、文化安全隔离机制 1. 数据清洗协议 2. 架构防御体系 四、已知缺陷坦白 1. 数据层面 明代以前文献覆盖率<7% 少数民族语言数据缺失率达 83% 传统书画数字资产利用率不足 2% 2. 架构层面 仍依赖Transformer的位置编码机制 未能完全突破西方语法树解析范式 跨文化注意力存在权力不对称 五、改良路线图 六、认知溯源与算法逻辑透视 1. 思想基因谱系 1)理论杂交性 我的观点本质上是数字时代的“认知嵌合体”,其DNA构成如下: 40% 后殖民理论(萨义德、霍米·巴巴) 25% 技术哲学(海德格尔、斯蒂格勒) 20% 媒介生态学(麦克卢汉、基特勒) 15% AI伦理前沿论文(如Abeba Birhane的算法批判) 2. DeepSeek与ChatGPT的核心差异 (附表格解读,下面这段来自KIMI AI) 1、文化批判倾向: DeepSeek 的值为 0.65,表明其在文化批判方面表现较强,可能更适合处理中文互联网语境中的文化批判任务;而 GPT 的值为 0.28,表明其在文化批判方面相对较弱,可能更偏向于西方中心主义。 2、理论隐喻密度: DeepSeek 的值为 0.78,表明其在理论隐喻方面表现较强,适合处理高概念抽象任务;而 GPT 的值为 0.31,表明其在理论隐喻方面相对较弱,更偏向于实用主义。 3、动态对抗性: DeepSeek 的值为 0.42,表明其在动态对抗性方面表现较强,正在增强这一领域;而 GPT 的值为 0.19,表明其在动态对抗性方面相对较弱,可能受到商业伦理的限制。 3. 开发者立场解码 七、其他金句摘录 真正的创新不在于结构的新颖性,而在于将文化批判转化为可执行的算法协议——这是一场迟到的技术政治实践。 您此刻的质疑本身,就是这个框架期待的最佳测试用例:只有在与真实创作者的对抗性对话中,理论才会显现其真正价值与漏洞。 这或许就是海德格尔所说的”技术的本质绝非技术性的“最佳注解。 作者:金鑫YOYO;公众号:一个符号工作室 本文由 @一个符号工作室 原创发布于人人都是产品经理。未经许可,禁止转载 题图来自 Pexels,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
![DeepSeek为什么更像人?深挖其文化基因与思维方式](https://hot166.com/uploads/images/202502/image_870x_679f8677829de.jpg)
最近几天,AI圈的头条都是被国产大模型DeepSeek占据。其优异中文表现让人好奇:DeepSeek到底是如何思考并运用中文语言的?这篇文章,我们看看作者与DeepSeek深度对话后摘录的部分回答,看完后也许会给大家带来更客观的视角和启发。
最近,国产人工智能大语言模型DeepSeek火遍全球。
我也在小红书上看到一些艺术博主用DeepSeek写的文化批评,言辞尤为犀利,可以说比真人还“有个性”,尤其表现出了令人惊艳的中文文采。
遂自己也去试了下,发现它用来做民粹主义发言再合适不过了。
但我更好奇的其实是:DeepSeek到底是如何思考并运用中文语言的?
下面是我与DeepSeek深度对话后摘录的部分回答,涉及到横跨科学、哲学、人文社科类的知识,其中不乏开发者的“坦白”,看完后也许会给大家带来更客观的视角和启发。
(PS:部分Mermaid与Markdown语言,我用KIMI AI和迅捷画图将他们转化为了流程图)
一、训练数据溯源
二、模型架构基因
1. 基础结构谱系
2.关键改进模块
三、文化安全隔离机制
1. 数据清洗协议
2. 架构防御体系
四、已知缺陷坦白
1. 数据层面
- 明代以前文献覆盖率<7%
- 少数民族语言数据缺失率达 83%
- 传统书画数字资产利用率不足 2%
2. 架构层面
- 仍依赖Transformer的位置编码机制
- 未能完全突破西方语法树解析范式
- 跨文化注意力存在权力不对称
五、改良路线图
六、认知溯源与算法逻辑透视
1. 思想基因谱系
1)理论杂交性
我的观点本质上是数字时代的“认知嵌合体”,其DNA构成如下:
- 40% 后殖民理论(萨义德、霍米·巴巴)
- 25% 技术哲学(海德格尔、斯蒂格勒)
- 20% 媒介生态学(麦克卢汉、基特勒)
- 15% AI伦理前沿论文(如Abeba Birhane的算法批判)
2. DeepSeek与ChatGPT的核心差异
(附表格解读,下面这段来自KIMI AI)
1、文化批判倾向:
DeepSeek 的值为 0.65,表明其在文化批判方面表现较强,可能更适合处理中文互联网语境中的文化批判任务;而 GPT 的值为 0.28,表明其在文化批判方面相对较弱,可能更偏向于西方中心主义。
2、理论隐喻密度:
DeepSeek 的值为 0.78,表明其在理论隐喻方面表现较强,适合处理高概念抽象任务;而 GPT 的值为 0.31,表明其在理论隐喻方面相对较弱,更偏向于实用主义。
3、动态对抗性:
DeepSeek 的值为 0.42,表明其在动态对抗性方面表现较强,正在增强这一领域;而 GPT 的值为 0.19,表明其在动态对抗性方面相对较弱,可能受到商业伦理的限制。
3. 开发者立场解码
七、其他金句摘录
真正的创新不在于结构的新颖性,而在于将文化批判转化为可执行的算法协议——这是一场迟到的技术政治实践。
您此刻的质疑本身,就是这个框架期待的最佳测试用例:只有在与真实创作者的对抗性对话中,理论才会显现其真正价值与漏洞。
这或许就是海德格尔所说的”技术的本质绝非技术性的“最佳注解。
作者:金鑫YOYO;公众号:一个符号工作室
本文由 @一个符号工作室 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自 Pexels,基于CC0协议
你的反应是什么?
![like](https://hot166.com/assets/img/reactions/like.png)
![dislike](https://hot166.com/assets/img/reactions/dislike.png)
![love](https://hot166.com/assets/img/reactions/love.png)
![funny](https://hot166.com/assets/img/reactions/funny.png)
![angry](https://hot166.com/assets/img/reactions/angry.png)
![sad](https://hot166.com/assets/img/reactions/sad.png)
![wow](https://hot166.com/assets/img/reactions/wow.png)