chatGPT与传统搜索结合创建新一代搜索引擎
点火三周 人气:0正文
不到40天,ChatGPT的日活量已突破千万!而当年同样引起轰动的Instagram达到这一成就足足花了355天。
这代表着我们正在广泛且快速地接受被chatGPT重新定义的知识查询与获取的方式。
而这个需求在过去的20年中,是由类似google,baidu这样的搜索引擎所定义和满足的。现在,范式革 命正在出现。这也是为什么google对于chatGPT与微软走得很近,如此紧张的原因。
因为chatGPT与必应的结合,必然会带来一场新的革 命,甚至可能是颠覆式的。本文将尝试讨论如何构建基于人工智能语言理解和AIGC的搜索引擎的可能,来提前一窥未来。
为什么我们会更接受chatGPT的模式
我们可以先从传统搜索引擎来看,我们是怎么进行交互的。
我们在搜索框中输入我们想要查询或者感兴趣的关键字,或者描述。
而后搜索引擎在搜索时的工作步骤大致如下:
- 接收用户的查询请求
- 利用索引(Index)来快速定位包含关键字的网页
- 排序和排名(Ranking),使用各种因素(如网页内容、链接等)来决定搜索结果的排列顺序
- 返回排名最高的搜索结果给用户
需要筛选的列表
在没有chatGPT之前,我们大多数时候是非常满足这种一次性的交互的。我们可以通过多次独立的搜索最终获取我们需要的答案。
但chatGPT出现之后,游戏的方式被改变了。它解决的主要问题在于:
- 自然语言处理能力强:chatGPT可以理解自然语言查询,并回答相关问题,而搜索引擎通常只能处理简单的关键词查询。
- 上下文认知能力:chatGPT可以根据用户提供的上下文信息来理解查询并回答问题,搜索引擎通常只针对单次查询进行回答。
- 交互性强:chatGPT可以进行更加深度的交互和延展交互,而搜索引擎通常只返回一组搜索结果。
- 更好的用户体验:chatGPT可以生成易于理解的结果,而搜索引擎返回的结果通常是一些网页链接,需要用户自己去浏览。
这样,无论是从知识获取的效率,还是深度交互和延展上,我们都获得了极大的满足和提升。
更接近人类交互的方式:明确、直接
我们不再需要筛选结果,不需要点击网页等待跳转,不再需要分割多次查询,可以直接延伸交互,甚至是可以纠错。形象点的描述,搜索引擎更像是一本高效实时的字典,而chatGPT更像是一个知识渊博的老师,能跟你交流,告诉你想要知道的知识,虽然它可能犯错。但一样的,搜索引擎也可能犯错,毕竟有邪恶的SEO的存在,或者本身就是包含了错误内容的答案。
chatGPT相对于搜索引擎的不足之处
我们提到的可能的范式革 命的出现,并不是用chatGPT这样的聊天机器人直接取代搜索引擎。因为chatGPT并不能取代搜索引擎,ChatGPT是一个大型语言模型,它相对于搜索引擎有以下不足之处:
- 准确性:尽管ChatGPT已经被训练了大量的数据,具有很高的回答率,但它仍然存在错误和误导信息的可能。(但搜索引擎同样存在错误和误导)
- 数据更新:ChatGPT在训练时截止到2021年
- 知识范围:ChatGPT的知识是有限的,没有搜索引擎的知识库那么丰富
- 生成速度:与搜索引擎相比,生成结果的速度可能更慢,因为需要计算和生成结果
- 推理能力:搜索引擎可以根据查询词进行关键字匹配,但ChatGPT不具备这样的推理能力
但正如最开始提到的,ChatGPT的模式正在被广泛且快速的接受,因为它弥补了传统搜索引擎在理解和交互上的不足,一旦我们适应了新的事物,陈旧与低效的方式总会被替代,就如电子相机替代机械相机,因为我们可以美图,可以交互。
chatGPT与传统搜索引擎结合
正如Keras之父所说,“搜索与生成根本就是两个问题,原理上就决定了两者无法相互取代。”我们要做不是用chatGPT
取代搜索引擎,Keras之父没有说完的是:生成式AI和搜索引擎是互补关系,我们需要的是结合两者优势的新一代工具。
这种新型搜索引擎将利用chatGPT等生成式AI负责交互的部分:利用chatGPT的语言理解能力来更好地理解用户的查询,也将利用chatGPT的生成能力,给我们组织更明确和直接的内容,并记录上下文,开展更有深度和延展性的交互。
而搜索引擎将隐藏在交互接口的背后,并使用传统搜索引擎的索引和排名算法来为AI提供补充和校准。
这种结合将帮助提高搜索体验和满足用户的查询需求。
其具体工作原理可以如下:
- 查询解释:使用chatGPT或类似的语言模型来解释查询的意图(包括是否是包含上下文的互动式交互),判断是否是chatGPT无法回答的问题或是否是最新信息的检索。
- 搜索结果获取:当查询是chatGPT无法回答的问题时,使用传统搜索引擎来获取最相关的网页。
- 搜索结果理解:使用chatGPT或类似的语言模型来理解搜索结果并生成易于理解的结果。
- 结果生成模块:将语言理解和排名的结果结合生成最终的搜索结果,并记录上下文
这种方式能够更好地理解用户的查询意图,并为用户提供更准确的搜索结果,提高搜索体验。
同时,可以在界面上明确的告知结果生成的过程,并包含搜索引擎介入时的相关网页链接。当用户认为结果并不准确,或并非最新的结果时,可以反馈,以帮助AI增强学习。
架构示意图如下:
架构示意图
因此,交互会看起来像这样,当交互搜索引擎无法直接回答时,将给客户提供网页链接,并根据预处理模型的理解,以及客户反馈,通过增强学习来强化AI模型的能力,学习新的知识。
期望中的交互搜索
总结
以前,科学家的研究成果到应用于大众生活,这条路很远很长。但AI领域,一个算法的研究,可能第二天就能影响我们的生活。这种现象是因为AI技术的发展速度非常快,新算法的研究成果可以在短时间内迅速被应用到各个领域,并产生实际影响。与传统科学研究相比,AI研究成果的落地速度要快得多;AI在改变我们生活方式和工作方式方面发挥的作用,会以我们想象不到的方式到来。
不要觉得这很遥远,可能在不远的几个月内,你将体验到这种新的搜索引擎。
对于我们普通人来说,AI技术将带来一场内在的社会变革,我们无需深入掌握人工智能的奥秘,但如果能将它应用到日常生活和工作中,你的效率和生活质量将比那些不使用AI的人大大提高。只需要将其作为日常生活和工作的一个工具,就能够发挥其强大的威力,使你超越从未使用AI的人!
加载全部内容