Chat with Wiki - WayToAGI

以下是关于 SEARXNG 的相关信息：行业解决方案：服务和业务助手：行业包括互联网、制造、游戏，场景有对客服务、对内助手、产品搜索和推荐，业务关注点为回答准确率、数据覆盖范围，关键功能需求包括丰富的文档/多媒体/数据库支持、多数据源打通、文档 Meta 信息增强、搜索过滤、大模型召回判定。个人助理：行业涵盖互联网、教育、游戏、社交，场景有闲聊助手、情感陪伴、学习助手，业务关注点为回答准确率、业务数据关联性、人设契合度、多模态，关键功能需求有 Prompt 优化、多模态数据上传、互联网搜索、音频/视频交互。多模态文件交互和数据处理：行业有互联网、教育、安防，场景包括视频理解和信息抽取、作业批改，业务关注点是成本、延迟、多场景适配度，关键功能需求为自定义文件解析设置、视觉解析增强、企业级数据管理。服务和业务助手案例：内部业务助手：使用企业内部规章制度、部门结构、产品介绍等文档构建知识库，通过 RAG 智能体进行内部知识问答，数据多源、异构，复杂文档解析视觉增强，提供更好的文档理解，已灰度上线，需要提供 uid，白名单开启。医疗助手/法律助手/智能导购：构建领域内知识库，为普通用户提供基础的医疗/法律知识，给出准确的就医建议/法律援助建议，在相似度阈值判定的基础上，引入大模型的智能分析能力。系统首先通过相似度阈值筛选出初步的搜索结果，然后利用大模型对这些结果进行深入分析，判断它们与用户查询的关联程度。结合了规则性和智能性，判定准确度高；判定速度略慢；产生额外的大模型调用费用。适合需要高度定制化和智能化搜索服务的场景，有效减少了企业场景海量数据情况下的数据混淆和模型幻觉问题。工具：关于 AI 搜索的看法： AI 搜索引擎是一个持续雕花的过程，在提升准确度方面有很多事情可做，如 Prompt Engineering/Query Rewrite/Intent Detection/Reranking 等，每个步骤都存在不少问题，如用 function calling 去做 Intent Detection 会遇到识别准确度低的问题，用 llamaindex+embedding+Vector DB 做 Reranking 会遇到排序效率低下的问题。 AI Search+Agents+Workflows 是趋势，AI Search 做通用场景，通过 Agents 做垂直场景，支持个性化搜索需求，通过 Workflows 实现更加复杂的流程编排，使用 GPTs 做出的提示词应用或知识库挂载型应用价值点较薄。个人不太看好垂直搜索引擎，因为用户的搜索需求多样，垂直搜索引擎自建 index 索引工程投入大，效果不一定比接 Google API 好，且接入的信息源有限。 AI 搜索是一个巨大的市场，短时间内很难形成垄断，海外 Perplexity 一家独大，国内 Kimi/秘塔小范围出圈，各家的产品体验和市场占有率未达到绝对领先，后来者仍有机会。 AI 搜索引擎需要尽早考虑成本优化，主要支出在于大模型的 token 成本和搜索引擎的 API 请求费用，成本优化是个持续的过程，比如可以自行部署 SearXNG 来降低搜索成本，部署开源模型来降低大模型的 API 调用成本。趋势研究：社交平台在生成式 AI 时代的影响：平台可能更侧重于提供 AI 难以替代的体验，如即时的社交互动、社区讨论和原创短视频娱乐内容等以维系用户黏性。像百度这样同时经营搜索和信息流的公司在尝试双管齐下，社交平台未来或将调整广告产品结构，开发新的原生广告形式以适应 AI 时代的消费习惯。小红书等平台也有可能开发 AI 辅助的内容创作和搜索功能，为用户提供更加智能的笔记摘要和个性化推荐，维持其生态活力。总体而言，广告主、媒体和平台都必须重新思考自己的定位与策略，在强化自身核心优势的同时，主动拥抱生成式 AI 所带来的变革。