日本AI研究第一人这样评价Deepseek
2025/02/13 日本东京大学的松尾丰教授(2024年10月,东京都千代田区) 中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI(人工智能)大规模语言模型(LLM)受到了全世界的关注。日本经济新闻(中文版:日经中文网)就如何评价该公司的最新AI模型、安全性方面的风险、以及对日本企业的影响等问题,采访了日本AI研究领域的第一人、东京大学教授松尾丰。 性能与美国OpenAI接近 记者:您如何评价DeepSeek的技术? 松尾丰:技术很出色,性能与运营“ChatGPT”的美国OpenAI接近。(DeepSeek)每次发布新的AI模型,都会发表论文,详细说明模型采用了什么样的技术,以及花费心思实施的改进之处。 该公司还同时以(任何人都可使用的)开源方式进行公开。1月发布的最新模型“R1”进行了提升推理能力的强化学习。最终展现出了与OpenAI的“o1”同等的推理性能。 在中国,AI开发十分活跃,孕育实力企业的环境不断扩大(DeepSeek的APP界面,REUTERS) 记者:在AI开发方面,美国一直处于领先地位。竞争的势力格局是否会发生变化? 松尾丰:作为大前提,中国的AI水平相当高,可以与美国比肩。至少从顶尖(学会采纳的)论文数量来看,中国已经超过美国。 另外,中国还有阿里巴巴、腾讯、百度等其他很多实力强劲的企业,拥有众多优秀工程师。在这样的生态系统中,AI不断得到开发与应用。出现DeepSeek这样极具实力的企业,并不令人惊讶。 对日本企业来说也是一种鼓舞 记者:您如何看待DeepSeek的出现对日本产生的影响? 松尾丰:日本也需要努力开发生成式AI模型。像DeepSeek这样并非大型科技企业、也没有雄厚资本的公司,竟然能够实现世界最先进的精度,这对日本的初创企业来说也是一种鼓舞。即便在日本国内,只要扎实地进行技术开发,就有可能实现这样的飞跃。 很多日本的AI初创企业从松尾教授的研究室诞生(2024年10月摄) 记者:您如何看待像DeepSeek这样的企业采取开源战略的动向? 松尾丰:最初采取开源战略的企业是美国Meta,该公司推出了“Llama”。后来,中国阿里巴巴推出了性能非常高的模型“Qwen(通义千问)”。在日本,基于这两家企业的模型进行追加学习的动向也十分活跃。如果基础模型扎实,就能轻松提升性能。 不过,开源强大,还是OpenAI及美国谷歌这样的非公开系统强大,竞争始终存在。哪一方胜出会因状况而变。 这次DeepSeek的出现,使得开源方面的势力得到了很大的恢复。虽然OpenAI及谷歌拥有性能卓越的非公开模型,但这表明开源也能够做到同样的事情。 安全风险因使用方式而异 美国OpenAI在应对DeepSeek的崛起(首席执行官萨姆·阿尔特曼,REUTERS) 记者:对于利用现有AI模型输出的数据来创建新的生成AI的DeepSeek的“蒸馏”技术,OpenAI指出这种做法违规。 松尾丰:我不知道情况的真假。在美国企业之间,这样的传闻非常常见。这次也可能涉及(中美的)政治含义。 记者:您如何看待使用中的安全等风险? 松尾丰:是利用DeepSeek的开源还是使用其服务?根据使用方式的不同,风险也不同。开源可以下载程序并在本地运行。这样的话,数据不可能被发送到某个地方。 另一方面,DeepSeek的APP服务在中国的服务器上运行。一旦输入数据,这些数据就会发送到中国的服务器,在中国进行处理并返回。虽然表示不使用这些数据进行学习,但实际上并不排除使用的可能性。 这点不管对于DeepSeek还是OpenAI来说都一样。这是一个你对对方投以多大信任的问题。 记者:围绕AI的知识产权和信息泄露问题,中美间的对立似乎还会加剧。 松尾丰:美国(海军和某些州)提出不要使用DeepSeek。但从研究者的角度来看,我并不认为DeepSeek做了什么特别的事情。相反,我认为他们只是在好好搞技术并将其发布。 采访记者为日本经济新闻(中文版:日经中文网)徐潮、铃木健二朗、岩泽明信





你的反应是什么?






