AI搜索技术架构:解析MindSearch与Augur的设计
MindSearch简介
MindSearch 是由中科大与上海人工智能实验室联合推出的开源AI搜索引擎框架,旨在解决用户在日常生活中遇到的各种问题。该框架具备与Perplexity.ai Pro相同的性能,支持广泛的知识探索,并通过透明的解决方案路径提高了回复的可信度。MindSearch采用多种用户界面,包括React、Gradio、Streamlit和本地调试,以满足不同用户的需求。此外,它采用动态图构建过程,将用户查询分解为子问题节点,并根据WebSearcher的搜索结果逐步扩展图。
MindSearch的原理分析
MindSearch的设计基于多智能体框架。这个框架通过将推理和检索过程的不同方面分配给专门的agent,大大减轻了每个单个agent的负载。
任务规划与实现
在MindSearch中,任务规划通过LLM来完成,采用了一种创新的方法:将Python编程语言的灵活性,通过代码生成和执行来完成复杂的任务规划。这一过程是通过迭代完成的,WebPlanner会根据搜索结果动态添加新的节点,直到任务完成。
代码块示例
web_search_graph = WebSearchGraph()
web_search_graph.add_root_node('用户查询')
Augur:美团的在线预估框架
在美团的Transformer概念,通过分离IO和计算,提升了特征抽取的性能。
Augur的功能特点
Augur通过分布式、无状态的设计,实现了高效的模型预估能力。其核心在于特征的处理逻辑,分为ContextLevel和DocLevel特征。Augur的异步非阻塞流程大大提高了资源利用率,使单机服务容量提升超过100%。
特征计算示例
ReadKV('feature_exp', '_id', '_id', 'binarybusinesstime', 'STRING')
MindSearch与其他AI搜索引擎的比较
在深度、广度和生成响应的准确性三个方面,MindSearch的表现与ChatGPT-Web、Perplexity.ai(Pro)进行了比较。评估结果显示,MindSearch在处理复杂任务时具有显著优势。此外,MindSearch通过对InternLM2.5-7B-Chat模型进行微调,提供了与GPT4相媲美的效果。
美团搜索的AI化历程
美团在搜索AI化的过程中,经历了从传统检索引擎到AI搜索引擎的升级。其架构主要由搜索数据平台、在线检索框架及云搜平台、在线AI服务及实验平台三大体系构成。核心组件包括模型训练平台Poker和在线预估框架Augur,支持商户、外卖、内容等核心搜索场景的业务指标提升。
Augur与Poker的结合
Augur与Poker的结合为美团的搜索业务提供了强大的支持。Poker作为搜索实验平台,通过在线预估服务管理模块,简化了模型和特征的管理流程,提高了算法迭代的效率。Augur的在线预估框架与Poker的管理平台共同构成了一个高效的搜索实验平台。
总结与未来展望
AI搜索技术架构正在快速发展,MindSearch和Augur为我们展示了未来搜索技术的可能性。通过多智能体协作和高效的特征处理,AI搜索引擎能够更好地满足用户的搜索需求。未来,随着技术的进一步发展,我们可以期待更多创新的AI搜索解决方案出现。
FAQ
-
问:MindSearch的核心优势是什么?
- 答:MindSearch采用多智能体框架,通过动态图构建和细粒度的网络搜索,提高了搜索的深度和广度,提供了更高质量的搜索结果。
-
问:Augur如何提升模型预估的性能?
- 答:Augur通过分布式、无状态设计,结合特征处理的优化,实现了高效的模型预估,使得单机服务容量提升超过100%。
-
问:如何在搜索业务中应用Augur和Poker?
- 答:通过Augur的在线预估框架和Poker的管理平台,用户可以快速进行模型和特征的管理,实现高效的搜索策略迭代。
-
问:美团搜索AI化的主要挑战是什么?
- 答:主要挑战在于特征的高效抽取和模型预估的快速迭代,以及在保证性能的同时实现业务的快速扩展。
热门API
- 1. AI文本生成
- 2. AI图片生成_文生图
- 3. AI图片生成_图生图
- 4. AI图像编辑
- 5. AI视频生成_文生视频
- 6. AI视频生成_图生视频
- 7. AI语音合成_文生语音
- 8. AI文本生成(中国)
最新文章
- 什么是Unified API?基于未来集成的访问
- 使用JWT和Lambda授权器保护AWS API网关:Clerk实践指南
- 宠物领养服务:如何帮流浪毛孩找到温馨的新家?
- Python调用IP地址归属地查询API教程
- Java API 开发:构建可重用的接口,简化系统集成
- Python 实现检测空气质量:实时监测城市空气污染指数
- 亚马逊礼品卡API全解析:企业激励与客户参与优化指南
- 地理实时地图:技术解析与现代应用实践
- Duolingo API 使用指南:语言学习与智能应用的融合实践
- 超级英雄尽在掌握:超级英雄数据API的超能力
- 了解API端点:初学者指南
- API版本控制:URL、标头、媒体类型版本控制