Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

SEARXNG

Answer

以下是关于 SEARXNG 的相关信息:

  • 行业解决方案:
    • 服务和业务助手:行业包括互联网、制造、游戏,场景有对客服务、对内助手、产品搜索和推荐,业务关注点为回答准确率、数据覆盖范围,关键功能需求包括丰富的文档/多媒体/数据库支持、多数据源打通、文档 Meta 信息增强、搜索过滤、大模型召回判定。
    • 个人助理:行业涵盖互联网、教育、游戏、社交,场景有闲聊助手、情感陪伴、学习助手,业务关注点为回答准确率、业务数据关联性、人设契合度、多模态,关键功能需求有 Prompt 优化、多模态数据上传、互联网搜索、音频/视频交互。
    • 多模态文件交互和数据处理:行业有互联网、教育、安防,场景包括视频理解和信息抽取、作业批改,业务关注点是成本、延迟、多场景适配度,关键功能需求为自定义文件解析设置、视觉解析增强、企业级数据管理。
    • 服务和业务助手案例:
      • 内部业务助手:使用企业内部规章制度、部门结构、产品介绍等文档构建知识库,通过 RAG 智能体进行内部知识问答,数据多源、异构,复杂文档解析视觉增强,提供更好的文档理解,已灰度上线,需要提供 uid,白名单开启。
      • 医疗助手/法律助手/智能导购:构建领域内知识库,为普通用户提供基础的医疗/法律知识,给出准确的就医建议/法律援助建议,在相似度阈值判定的基础上,引入大模型的智能分析能力。系统首先通过相似度阈值筛选出初步的搜索结果,然后利用大模型对这些结果进行深入分析,判断它们与用户查询的关联程度。结合了规则性和智能性,判定准确度高;判定速度略慢;产生额外的大模型调用费用。适合需要高度定制化和智能化搜索服务的场景,有效减少了企业场景海量数据情况下的数据混淆和模型幻觉问题。
  • 工具:
    • 关于 AI 搜索的看法:
      • AI 搜索引擎是一个持续雕花的过程,在提升准确度方面有很多事情可做,如 Prompt Engineering/Query Rewrite/Intent Detection/Reranking 等,每个步骤都存在不少问题,如用 function calling 去做 Intent Detection 会遇到识别准确度低的问题,用 llamaindex+embedding+Vector DB 做 Reranking 会遇到排序效率低下的问题。
      • AI Search+Agents+Workflows 是趋势,AI Search 做通用场景,通过 Agents 做垂直场景,支持个性化搜索需求,通过 Workflows 实现更加复杂的流程编排,使用 GPTs 做出的提示词应用或知识库挂载型应用价值点较薄。
      • 个人不太看好垂直搜索引擎,因为用户的搜索需求多样,垂直搜索引擎自建 index 索引工程投入大,效果不一定比接 Google API 好,且接入的信息源有限。
      • AI 搜索是一个巨大的市场,短时间内很难形成垄断,海外 Perplexity 一家独大,国内 Kimi/秘塔小范围出圈,各家的产品体验和市场占有率未达到绝对领先,后来者仍有机会。
      • AI 搜索引擎需要尽早考虑成本优化,主要支出在于大模型的 token 成本和搜索引擎的 API 请求费用,成本优化是个持续的过程,比如可以自行部署 SearXNG 来降低搜索成本,部署开源模型来降低大模型的 API 调用成本。
  • 趋势研究:
    • 社交平台在生成式 AI 时代的影响:平台可能更侧重于提供 AI 难以替代的体验,如即时的社交互动、社区讨论和原创短视频娱乐内容等以维系用户黏性。像百度这样同时经营搜索和信息流的公司在尝试双管齐下,社交平台未来或将调整广告产品结构,开发新的原生广告形式以适应 AI 时代的消费习惯。小红书等平台也有可能开发 AI 辅助的内容创作和搜索功能,为用户提供更加智能的笔记摘要和个性化推荐,维持其生态活力。总体而言,广告主、媒体和平台都必须重新思考自己的定位与策略,在强化自身核心优势的同时,主动拥抱生成式 AI 所带来的变革。
Content generated by AI large model, please carefully verify (powered by aily)

References

2. 行业解决方案

|场景|行业和场景举例|业务关注点|关键功能需求||-|-|-|-||服务和业务助手|行业:互联网、制造、游戏场景:对客服务、对内助手、产品搜索和推荐|•回答准确率•数据覆盖范围|•丰富的文档/多媒体/数据库支持•多数据源打通•文档Meta信息增强•搜索过滤•大模型召回判定||个人助理|行业:互联网、教育、游戏、社交场景:闲聊助手、情感陪伴、学习助手|•回答准确率•业务数据关联性•人设契合度•多模态|•Prompt优化•多模态数据上传•互联网搜索•音频/视频交互||多模态文件交互和数据处理|行业:互联网、教育、安防场景:视频理解和信息抽取、作业批改|•成本•延迟•多场景适配度|•自定义文件解析设置•视觉解析增强•企业级数据管理|[heading2]服务和业务助手案例[heading3]内部业务助手[content]使用企业内部规章制度、部门结构、产品介绍等文档构建知识库,通过RAG智能体进行内部知识问答数据多源、异构,复杂文档解析视觉增强,提供更好的文档理解已经灰度上线,需要提供uid,白名单开启阿里云内部产品助手:[heading3]医疗助手/法律助手/智能导购[content]构建领域内知识库,为普通用户提供基础的医疗/法律知识,给出准确的就医建议/法律援助建议在相似度阈值判定的基础上,引入大模型的智能分析能力。系统首先通过相似度阈值筛选出初步的搜索结果,然后利用大模型对这些结果进行深入分析,判断它们与用户查询的关联程度。结合了规则性和智能性,判定准确度高;判定速度略慢;产生额外的大模型调用费用。适合需要高度定制化和智能化搜索服务的场景。有效减少了企业场景海量数据情况下的数据混淆和模型幻觉问题

工具:我做了一个 AI 搜索引擎

1.AI搜索引擎是一个持续雕花的过程。特别是在提升准确度这个问题上,就有很多事情可以做,比如Prompt Engineering/Query Rewrite/Intent Detection/Reranking等等,每个步骤都有不少坑。其中用function calling去做Intent Detection就会遇到识别准确度很低的问题。用llamaindex+embedding+Vector DB做Reranking也会遇到排序效率低下的问题。1.AI Search+Agents+Workflows是趋势。AI Search做通用场景,通过Agents做垂直场景,支持个性化搜索需求。通过Workflows实现更加复杂的流程编排,有机会把某类需求解决的更好。使用GPTs做出的提示词应用或知识库挂载型应用,价值点还是太薄。1.我个人不是太看好垂直搜索引擎。一定程度上,垂直搜索引擎可以在某个场景做深做透,但是用户的搜索需求是非常多样的,我不太可能为了搜代码问题给A产品付费,再为了搜旅游攻略给B产品付费。垂直搜索引擎自建index索引,工程投入比较大,效果不一定比接Google API要好,而且接入的信息源太有限。1.AI搜索是一个巨大的市场,短时间内很难形成垄断。海外Perplexity一家独大,国内Kimi/秘塔小范围出圈。各家的产品体验,市场占有率还没有达到绝对的领先,后来者依然有机会。1.AI搜索引擎需要尽早考虑成本优化。主要支出在于大模型的token成本和搜索引擎的API请求费用。成本优化是个持续的过程,比如可以自行部署SearXNG来降低搜索的成本,部署开源模型来降低大模型的API调用成本。

[趋势研究] Deep Research - 推荐算法落幕? 生成式AI时代的搜索复兴

另一方面,平台可能更加侧重于提供AI难以替代的体验,例如即时的社交互动、社区讨论和原创短视频娱乐内容等,以维系用户黏性。像百度这样同时经营搜索和信息流的公司,则在尝试双管齐下:一方面在手机百度等产品中强化推荐信息流内容,另一方面推出整合文心一言的创新搜索服务,提供聊天式搜索体验,以提升用户留存。社交平台未来或将调整广告产品结构,开发新的原生广告形式以适应AI时代的消费习惯。例如,当用户在平台内进行搜索时,搜索结果页可以增设竞价广告位;或者利用生成式AI为广告主自动生成多样化的创意素材,实现广告内容与用户兴趣的更精准匹配[digiday.com](https://digiday.com/marketing/social-media-platforms-fuel-ai-ad-rush-with-new-creative-tools/#:~:text=Social%20media%20platforms%20fuel%20AI,potential%20ad%20copy%2C%20but)。小红书已经成为许多用户搜索生活消费指南的渠道,其社区沉淀了海量的用户笔记,用户既可以通过算法推荐发现有趣内容,也常常主动搜索关键词获取具体经验分享。在生成式AI的趋势下,小红书等平台也有可能开发AI辅助的内容创作和搜索功能,为用户提供更加智能的笔记摘要和个性化推荐,维持其生态活力。总体而言,广告主、媒体和平台都必须重新思考自己的定位与策略,在强化自身核心优势的同时,主动拥抱生成式AI所带来的变革。这场由技术驱动的广告生态重组中,充满挑战亦孕育机遇。