RAG实践篇(三):向量检索的AI应用,让知识“活起来”
向量检索技术正在成为RAG智能问答的“隐形功臣”,让很多企业/专业领域繁复庞大的知识库真正“活起来”,而作为产 […]
向量检索技术正在成为RAG智能问答的“隐形功臣”,让很多企业/专业领域繁复庞大的知识库真正“活起来”,而作为产品经理,理解他的“有效”和“有限性”,能真正地将这个检索技术为产品所用。
产品经理小明收到一家大型科技公司的RAG项目需求:要构建一个用于员工QA的智能chatbot产品。
公司希望这个产品既能回答常见的、标准的公司政策问题(如“如何申请出差津贴”、“公司的年假福利是什么样的?”),同时又能应对各类复杂的、非标准化问题(如“跨团队合作的最佳实践是什么?”)。
作为产品经理,小明与开发讨论起技术实现。
开发摸着下巴,若有所思:“标准化问题还好说,但如果问题复杂,还是非标准化的。需要模型有更强的语义检索能力,可以在知识库里找到最合适用户的答案。咱们就用向量检索技术来做吧。”
聊到这里,小明也不免好奇,向量技术究竟是什么?它在RAG的实践中起到什么作用?
这篇文章会介绍向量技术在RAG中的应用,其核心概念、实践流程以及在产品中的具体应用场景。
一、向量:让“文本”可以被计算
在机器学习领域,向量是一组用数字表示的数学对象,通常用于描述一个文本、图像或其他数据的语义特征。这些数字是从深度学习模型中提取的,能够捕捉文本或数据的含义,并用这种形式来表示语义关系。
你可以把“向量”想象成一个坐标点,处于一个高维空间中(比如3维空间、100维空间甚至更高)。在这个空间中,语义相似的内容会靠得更近,而语义差异大的内容则会距离更远。
例如,“如何申请年假?” 和 “怎么请假?”这两个问题的表达方式是不同的,但语义非常接近。如果用向量表示,它们会被映射到一个高维向量空间中相邻的区域,从而使得计算机知道它们含义相近。而“公司年假政策是什么?”和“跨团队合作的最佳实践是什么?”,虽然语法结构有点相似,但含义天差地别,在向量空间中会有较远的距离。
二、在RAG里的应用
RAG主要通过“检索 + 生成”两个阶段结合来处理复杂的问题,简单来说,它的步骤可以概括为:
- 问题理解(Query Understanding) 用户输入问题后,系统首先通过自然语言处理模型将问题转化为模型可理解的形式。
- 知识检索(Knowledge Retrieval) RAG会利用检索技术(如向量检索或传统关键词检索)从知识库中提取与问题语义相关的内容。
- 内容生成(Answer Generation) RAG通过生成式AI模型(如GPT-4、Claude)将检索到的内容与用户问题结合,生成自然语言回答。
- 答案输出(Response Output) 最终生成的回答会以用户可以理解的形式输出。
由此可以看到,向量技术是语义检索的核心。RAG需要从一个庞大的知识库中找到与用户问题最相关的内容,然后再将这些内容传递给模型进行回答。而向量的作用是把用户的问题和知识库内容都转化为高维语义向量,并通过数学方法找到两者之间的距离。
具体应用:
- 向量化过程: 用户输入问题“年假如何申请?” → 转化为向量 V1 知识库中存储的文本片段“年假申请流程:登录HR系统申请” → 转化为向量 V2 向量检索通过计算 V1 和 V2 的距离,判断它们的语义是否相关,距离越近,匹配度越高。
- 实际输出: RAG通过向量检索找到匹配的内容后,将这段知识传递给生成模型,生成回答:“请登录HR系统,通过‘请假申请’模块提交年假申请。”
三、亮点和局限
作为AI产品经理,了解向量检索的“能做什么”和“不能做什么”也很重要。
亮点
向量检索的最大亮点是可以理解用户输入中的语义。要知道在传统的关键词检索中,对复杂句式或词语变形无法很好的处理。而向量检索可以通过语义相似性轻松解决,比如用户提问“我想请年假应该怎么做?”,系统也能准确理解,并返回相关内容。
也正因此,它能更加游刃有余地处理非结构化数据,比如长文本、对话记录等。而在企业的知识库中,知识信息往往都是以文档或长段落的形式存储的。通过向量检索,就可以将这些复杂内容进行语义分割,检索出与用户问题相关的段落。比如,当一个员工想知道“跨部门协作有哪些最佳实践?”时,系统可以直接从企业的管理文档中把“跨部门协作”的有关段落提取出来就能回答。
局限
向量检索的本质是基于“相似度”的匹配,但相似度高并不等于答案相关性高。比如,用户提了问题“年假申请需要哪些材料?”,由于知识库里并没有“年假申请材料”的相关知识。模型可能就会提供提供一段“年假政策”的内容,因为这是它所能检索到的“相似度”系数最高的内容了。像这种“语义相似度高但不正确”的情况,就会影响用户体验。
另外,由于向量检索是基于语义相似度的匹配。而用户的问题是横跨多个领域或者多个主题的时候,语义的向量分布就比较“稀疏”。比如用户提问“AI在医疗和教育中的应用区别是什么?”。向量的相似度检索可能只能找到“AI与医疗”或“AI与教育”单独相关的内容,但难以整合两者的区别进行回答。结果它就只会返回到单一行业进行回答,而忽略问题的整体意图。
结语
总体来说,向量检索正在成为RAG智能问答的“隐形功臣”,让很多企业/专业领域繁复庞大的知识库真正“活起来”,而作为产品经理,理解他的“有效”和“有限性”,能真正地将这个检索技术为产品所用。
本文由 @AI 实践干货 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
你的反应是什么?