Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何正确的向AI大模型提问

Answer

向 AI 大模型正确提问可以参考以下方法:

  1. 对于利用 Embedding 技术增强 GPT 能力的过程,OpenAI 发布的相关文档指出,可通过两步搜索来实现。具体步骤包括:
    • 准备搜索数据(仅一次):
      • 搜集数据:获取需要的数据,包括公开数据或者私有的数据。
      • 切块:将文档切分成短小的部分。
      • 嵌入:通过 OpenAI API 对切块的数据进行 Embedding 结果。
      • 存储:存储 Embedding 结果,对于大型数据集的 Embedding 结果,可以使用向量数据库进行保存。
    • 搜索(每次查询一次):给定用户问题,从 OpenAI API 生成查询的 embeddings,使用 embeddings 按照与查询相关性对文本部分进行排序,推荐使用余弦相似性作为距离函数。
    • 提问(每次查询一次):将问题和最相关的部分插入到发送给 GPT 的消息中返回 GPT 的答案。
  2. Embedding 具有多种作用,如搜索(其中结果按与查询字符串的相关性进行排名)、聚类(其中文本字符串按相似性分组)、建议(建议包含相关文本字符串的项目)、异常检测(识别出相关性很小的离群值)、多样性测量(分析相似性分布)、分类(其中文本字符串按其最相似的标签分类)。
  3. 关于 RAG(检索增强生成),它是一种结合了检索和生成的技术,可以让大模型在生成文本时利用额外的数据源,从而提高生成的质量和准确性。其基本流程如下:
    • 首先,给定一个用户的输入,例如一个问题或一个话题,RAG 会从一个数据源中检索出与之相关的文本片段,例如网页、文档或数据库记录,这些文本片段称为上下文。
    • 然后,RAG 会将用户的输入和检索到的上下文拼接成一个完整的输入,传递给一个大模型,例如 GPT。这个输入通常会包含一些提示,指导模型如何生成期望的输出,例如一个答案或一个摘要。
    • 最后,RAG 会从大模型的输出中提取或格式化所需的信息,返回给用户。如果您想构建能够利用私有数据或实时数据进行推理的 AI 应用,需要用特定的信息来增强模型的知识,将相关信息检索并插入到模型的输入中。
Content generated by AI large model, please carefully verify (powered by aily)

References

认识大模型 Embedding 技术加实战

针对上面的问题,OpenAI发布过这样一篇文档,说明如何使用两步搜索来增强GPT的能力:搜索:搜索内部的知识库,检索相关文本。请求:将检索到的文本内容部分发送给GPT大模型,并向其提出问题。具体的操作步骤如下:1、准备搜索数据(仅一次)1)搜集数据:获取需要的数据,公开数据或者私有的数据2)切块:将文档切分成短小的3)嵌入:通过OpenAI API对切块的数据进行Embedding结果,4)存储:存储Embedding结果,对于大型数据集的Embedding结果,可以使用向量数据库进行保存。2、搜索(每次查询一次)给定用户问题,从OpenAI API生成查询的embeddings使用embeddings,按照与查询相关性对文本部分进行排序❝距离函数推荐使用:余弦相似性3、提问(每次查询一次)将问题和最相关的部分插入到发送给GPT的消息中返回GPT的答案[heading3]Embedding共有哪些作用[content]搜索(其中结果按与查询字符串的相关性进行排名)聚类(其中文本字符串按相似性分组)建议(建议包含相关文本字符串的项目)异常检测(识别出相关性很小的离群值)多样性测量(分析相似性分布)分类(其中文本字符串按其最相似的标签分类)

开发:LangChain应用开发指南-大模型的知识外挂RAG

原创AI小智AI小智2023-12-11 08:10发表于湖北AI大模型能够处理广泛主题的文本生成,但模型知识只能基于它们训练时使用的公开数据。如果你想构建能够利用私有数据或实时数据进行推理的AI应用,你需要用特定的信息来增强模型的知识。将相关信息检索并插入到模型的输入中,即检索增强生成(Retrieval Augmented Generation,RAG)。在本文中,我们将介绍如何使用LangChain开发一个简单的RAG问答应用。我们将依次介绍典型的问答架构,讨论相关的LangChain组件,并展示如何跟踪和理解我们的应用。[heading3]RAG的基本概念[content]RAG是一种结合了检索和生成的技术,它可以让大模型在生成文本时利用额外的数据源,从而提高生成的质量和准确性。RAG的基本流程如下:首先,给定一个用户的输入,例如一个问题或一个话题,RAG会从一个数据源中检索出与之相关的文本片段,例如网页、文档或数据库记录。这些文本片段称为上下文(context)。然后,RAG会将用户的输入和检索到的上下文拼接成一个完整的输入,传递给一个大模型,例如GPT。这个输入通常会包含一些提示(prompt),指导模型如何生成期望的输出,例如一个答案或一个摘要。最后,RAG会从大模型的输出中提取或格式化所需的信息,返回给用户。

开发:LangChain应用开发指南-大模型的知识外挂RAG

原创AI小智AI小智2023-12-11 08:10发表于湖北AI大模型能够处理广泛主题的文本生成,但模型知识只能基于它们训练时使用的公开数据。如果你想构建能够利用私有数据或实时数据进行推理的AI应用,你需要用特定的信息来增强模型的知识。将相关信息检索并插入到模型的输入中,即检索增强生成(Retrieval Augmented Generation,RAG)。在本文中,我们将介绍如何使用LangChain开发一个简单的RAG问答应用。我们将依次介绍典型的问答架构,讨论相关的LangChain组件,并展示如何跟踪和理解我们的应用。[heading2]RAG的基本概念[content]RAG是一种结合了检索和生成的技术,它可以让大模型在生成文本时利用额外的数据源,从而提高生成的质量和准确性。RAG的基本流程如下:首先,给定一个用户的输入,例如一个问题或一个话题,RAG会从一个数据源中检索出与之相关的文本片段,例如网页、文档或数据库记录。这些文本片段称为上下文(context)。然后,RAG会将用户的输入和检索到的上下文拼接成一个完整的输入,传递给一个大模型,例如GPT。这个输入通常会包含一些提示(prompt),指导模型如何生成期望的输出,例如一个答案或一个摘要。最后,RAG会从大模型的输出中提取或格式化所需的信息,返回给用户。

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
我想做一个,基于我个人知识库的chatbot,以供我随时搜索和提问,且优先搜索知识库内的内容而非联网搜索,你有什么建议吗?
以下是为您提供的关于创建基于个人知识库的 chatbot 的建议: 1. 选择合适的平台和工具:例如可以考虑使用飞书智能伙伴创建平台(Aily)或扣子(https://www.coze.cn/home)等。 2. 数据分段储存:由于大模型的上下文长度有限制,需要将上传的资料根据特定符号或字符长度进行分段,如将 8000 字文档按每 800 字分成一个片段储存。 3. 增强检索:当用户输入问题,大模型会根据相似度检索出若干最相关的数据片段,再据此生成答案,这一技术称为 RAG(检索增强生成)。 4. 配置知识库: 在 Bot 内使用知识库: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,如最大召回数量、最小匹配度、调用方式等。 在工作流内使用 Knowledge 节点: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入工作流页面,并打开指定的工作流。 在左侧基础节点列表内,选择添加 Knowledge 节点。 5. 注意使用限制:单用户最多创建 1000 个知识库,文本类型知识库下最多支持添加 100 个文档,单用户每月最多新增 2GB 数据,累计上限是 10GB。 此外,知识库可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复,也可以在工作流中添加知识库节点,成为工作流中的一环。
2025-04-14
如何更好地进行提问,使得AI回复的准确性更高?
以下是一些能让您更好地进行提问,从而提高 AI 回复准确性的方法: 1. 明确角色和任务:例如,指定 AI 为某一特定领域的专业人士,并明确其需要完成的具体任务。 2. 清晰阐述任务目标:让 AI 清楚了解您期望得到的结果。 3. 提供详细的上下文和背景信息:包括相关的案例、事实等,帮助 AI 理解问题的来龙去脉。 4. 提出具体且详细的需求和细节性信息:使用清晰、具体的语言,避免模糊不清的表述。 5. 明确限制和不需要的内容:避免 AI 给出不必要或不符合要求的回答。 6. 确定回答的语言风格和形式:如简洁明了、逻辑严谨等。 7. 讲清楚背景和目的:在提问时,梳理清楚背景信息和提问目的,使 AI 更好地理解问题上下文。 8. 学会拆解环节、切分流程:将复杂任务分解成更小、更具体的环节,以便 AI 更精确执行。 9. 了解 AI 的工作原理和限制:有助于更好地设计问题,使其能提供有用答案。 在信息检索和回答生成过程中: 1. 系统会对检索器提供的信息进行评估,筛选出最相关和最可信的内容,并对信息的来源、时效性和相关性进行验证。 2. 消除多个文档或数据源中的冗余内容,防止在生成回答时出现重复或相互矛盾的信息。 3. 分析不同信息片段之间的逻辑和事实关系,构建结构化的知识框架,使信息在语义上更连贯。 4. 将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 5. 必要时进行语义融合,合并意义相近但表达不同的信息片段。 6. 最后,将整合好的上下文信息编码成适合生成器处理的格式,传递给大语言模型,由其生成准确和连贯的答案。
2025-04-04
我是一名日语大四学生,我要利用我的开题报告结合deepseek完成一篇论文初稿,请问怎么向deepseek提问
要向 DeepSeek 提问以结合您的开题报告完成论文初稿,您可以遵循以下正确的提问模板: 1. 赋予角色(选填):对 DeepSeek 赋予一个特定的角色,以便它能更专业地回答您的问题。 2. 背景/现状(必填):提供尽可能详细的背景信息,例如您的开题报告的主题、研究目的、已有的研究进展等,以使 DeepSeek 更好地理解您的问题。 3. 需求/目标(必填):明确告诉 DeepSeek 您的需求,比如您希望它根据开题报告提供论文大纲、分析相关数据、提供文献综述等,提出的需求越明确获得的答案越有价值。 4. 补充要求:您还可以提出关于回答的格式、风格、字数等方面的要求。 例如:您可以这样提问“我赋予您论文撰写助手的角色,我的开题报告主题是关于日本文化在现代社会中的变迁,目前我已经完成了初步的文献收集和分析,我的目标是请您根据这份开题报告为我生成一个详细的论文大纲,要求大纲结构清晰,逻辑连贯,具有一定的创新性”。
2025-03-31
我是一名日语大四学生,我要利用我的开题报告和文献综述结合deepseek完成一篇论文初稿,请问怎么向deepseek提问
向 DeepSeek 提问时,可遵循以下万能通用的提问公式:提示词=赋予角色+背景/现状+目标/需求+补充要求。 1. 赋予角色(选填):对 DeepSeek 赋予一个特定的角色,以便它能更专业地回答您的问题。 2. 背景/现状(必填):提供尽可能详细的背景信息,以使它更好地理解您的问题,并为您提供更准确的答案。例如您是日语大四学生,正在进行开题报告和文献综述相关工作。 3. 需求/目标(必填):明确告诉 DeepSeek 您的需求,比如完成一篇结合开题报告和文献综述的论文初稿。 4. 补充要求:例如指定写作风格要具有吸引力、友好性和幽默感等。 另外,在使用 DeepSeek 时还需注意: 对于像“仅通过东方集团的历年公开财务数据,分析这家公司的潜在投资机会和风险”这样的特定需求,可能需要进一步追问以获得更满意的结果。 与 DeepSeek 交流时,在其提供方法建议后,可以追问背后的方法论。 对于创作类的需求,如脱口秀段子,可以结合特定人物的特点和风格,并指定主题和字数等要求。
2025-03-31
不懂得提问ai,得出的答案总是不满意,又得费很多时间自己改
以下是一些关于如何向 AI 提问以获得满意答案的建议: 1. 避免追问 AI,因为这可能导致回答越来越离谱。可以使用 ChatGPT 的 temporary chat 功能,保证 AI 在没有任何记忆的情况下生成最新鲜的回答。 2. 当 AI 回答不理想时,可以告诉它退一步,重新审视整个结构,设想从零开始如何设计,以获得更简洁、直观的解决方案。 3. 如果 AI 自己猜测并修改问题,可让它依据日志判断问题所在。 4. 对于刚开始接触 AI 的用户,很多时候答案不符合预期并非 AI 能力问题,而是用户没有把问题和要求描述清楚。在提问时要把背景描述完整,把要求解释清楚,包括细节。 5. 推荐使用 5W1H 方法充分说明信息,即说清楚为什么(Why)、做什么(What)、啥时候(When)、涉及谁(Who)、在哪里(Where)、怎么做(How)。 6. 可以使用引号、分隔符号以及“首先、其次、最后”等连接词来组织 Prompt,赋予 AI 明确的角色,如专注于民商事法律领域的律师等。 7. 按照【设定角色+任务目标+上下文和背景信息+(正面要求)详细需求和细节性信息+(负面要求)限制和不需要的内容+回答的语言风格和形式】的格式进行提问。 8. 讲清楚背景和目的,例如律师在处理交通事故案件时,清晰描述案件事实、法规等。 9. 学会提出好问题,使用清晰、具体的语言,避免模糊表述,了解 AI 的工作原理和限制,以提高回答准确性。 10. 在应用 AI 之前,对工作流程进行细致拆解,将复杂任务分解成更小、更具体的环节,以便 AI 更精确执行。
2025-03-26
我一个如何向ai提问
向 AI 提问可以采用以下方法: 1. 给 AI 设定一个角色:只需加上“你是一个XXXX角色”,这句话蕴含了角色应了解的背景和输出要求。因为不同角色背景不同,AI 明确角色后能更好地应对问题。 2. 举例子:很多时候,通过举实际例子能更有效地说明要求,使 AI 准确了解您的需求。 3. 连续提问:现在的 AI 能处理多轮对话,对于一个问题可连续提问,根据回复不断细化要求。 4. 当不知道如何提问时,可以直接问 AI 如何提问,然后用它产生的问题再问它。 在软件开发面试中,可观察候选人: 1. 如何向 AI 提问。 2. 如何判断 AI 代码的正确性。 3. 如何调整 AI 生成的代码。 市场营销面试中,让候选人用 AI 生成营销文案,并问“为什么用这个 Prompt”,观察其是否能调整提示词、判断 AI 生成内容的质量。 产品管理面试中,让候选人用 AI 解析用户反馈,提炼产品改进建议,考察其是否能验证 AI 结论的准确性,并提出优化方案。 面试时,可以问以下 AI 相关问题快速判断候选人是否真正懂 AI: 1. “你遇到过 AI 给出明显错误答案的情况吗?你是怎么处理的?” 2. “最近有没有新出的 AI 工具或功能是你学习并实际应用的?能举个例子吗?” 3. “如果 AI 生成的内容和你的预期不符,你会怎么优化它?” 4. “你觉得 AI 目前有哪些无法解决的业务难题?遇到这些问题你会怎么做?” 有效评估候选人的 AI 能力,需要综合考虑其在上述方面的表现。
2025-03-26
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
如何正确的向deepseek提问来辅助我写一篇文献
以下是向 DeepSeek 提问来辅助写文献的正确方法: 1. 借助 AI 分析好的文章: 找出您最喜欢的文章,投喂给 DeepSeek R1(适合大多数有推理模型的 AI)。 第一次询问:请从写作角度分析这篇文章。 第二次询问:请再从读者角度分析这篇文章。 第三次询问:这篇文章还存在什么缺点和不足,有什么改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 2. 让 AI 对您写的文章进行点评: 表述为“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。” 3. 根据文章内容对作者进行心理侧写: 表述为“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。” 此外,还有用 DeepSeek 扮演一本书的作者辅助阅读书籍的案例,比如在读项飚的《跨越边界的社区》时,让 DeepSeek 解释作者为什么这么写,它会从时代背景的张力、浙江村的实践智慧、方法论上的颠覆等层面进行剖析。
2025-02-20
deepseek如何正确使用
以下是关于 DeepSeek 正确使用的相关信息: 媒体报道和网络文章: 归藏的 AI 工具箱:海外敲代码,国内写唐诗:Deepseek R1 爆火后的现象思考,链接:https://mp.weixin.qq.com/s/mm9QXITLIynK0Vve3hnP7Q 卫夕指北:变天!——由一个惊艳例子引发对 DeepSeek 的 10 条思考,链接:https://mp.weixin.qq.com/s/04VnIY8IIKBM2BS9zxNQ6Q 鹤竹子:这才是 DeepSeek 的正确使用方式!你还在用 GPT 那套就废了,春节前最后预警,链接:https://mp.weixin.qq.com/s/z29jvMOJp0GZXPkKrgBwMA 和菜头槽边往事:它们都比 deepseek 好,我知道,链接:https://mp.weixin.qq.com/s/jlOvlC7Sp_Xyz8PSBM1bA 具体使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现:同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(对作者来说有难度)和 Markdown(运行下来似乎不是很稳定)。 完整提示词:v 1.3 特别鸣谢:李继刚(【思考的七把武器】在前期为作者提供了很多思考方向)、Thinking Claude(这个项目是作者现在最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源)、Claude 3.5 Sonnet(最得力的助手)
2025-02-11
我几乎是一个AI小白,只能日常跟AI对话,让AI回答我的问题,我希望能系统的了解AI,认识AI,学会正确使用AI,让AI帮助我提高效率,希望你能给出学习建议
以下是为您提供的系统学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 与大语言模型交流的技巧: 对话尽量具体、丰富、少歧义,多说有用的。 假想特定场景,明确希望获得的内容。 把大模型当作大学生,指明方向,拆解任务,教其一步一步操作。 7. AI 教育方面: 以 Khanmigo AI 为例,AI 教师应具有友善和支持的性格,语言简明,不直接给答案,而是通过适当提问帮助学生独立思考,根据学生知识水平调整问题,检查学生是否理解,警惕学生滥用帮助等。
2025-02-10
在coze工作流中,怎样利用下一个代码节点合并前两个代码节点的输出,并以正确的格式输入传入飞书多维表格插件节点
在 Coze 工作流中利用下一个代码节点合并前两个代码节点的输出并以正确格式传入飞书多维表格插件节点的步骤如下: 1. 搭建整理入库工作流: 3.4 大模型节点:提取稍后读元数据。根据对稍后读阅读清单的元数据期望设置大模型节点,使用 MiniMax 6.5s 245k,设置最大回复长度至 50000 以完整解析长内容网页,用户提示词需相应设置。 3.5 日期转时间戳。后续的飞书多维表格插件节点在入库日期字段时只支持 13 位时间戳,需使用「日期转时间戳time_stamp_13」插件进行格式转化,具体设置明确。 3.6 大模型节点:把稍后读元数据转换为飞书多维表格插件可用的格式。飞书多维表格插件目前(2024 年 08 月)只支持带有转义符的 string,以 Array<Object>格式输入,所以要将之前得到的元数据数组进行格式转换,大模型节点配置及用户提示词需相应设置。 3.7 插件节点:将元数据写入飞书表格。添加「飞书多维表格add_records」插件,设置{{app_token}}与{{records}}参数。 3.8 结束节点:返回入库结果。「飞书多维表格add_records」插件会返回入库结果,直接引用该信息用于通知外层 bot 工作流的入库是否成功。 2. 搭建选择内容推荐流: 4.1 开始节点:输入想阅读的内容主题。收到用户输入的“想看 xxx 内容”这类指令开始流程,无需额外配置。 4.2 变量节点:引入 bot 变量中保存的飞书多维表格地址,添加变量节点并设置。 4.3 插件节点:从飞书多维表格查询收藏记录。添加「飞书多维表格search_records」插件,设置{{app_token}}参数,并在{{app_token}}引用变量节点的{{app_token}},输出结果的{{items}}里会返回需要的查询结果,也可在这一步定向检索未读状态的收藏记录。 4.4 大模型节点:匹配相关内容。为处理稳定采用批处理,对检索出来的收藏记录逐个进行相关性匹配,用户提示词可优化以提升匹配精准度。 搭到这里,别忘了对整个工作流进行测试。
2025-01-09
如何快速正确的学习ai做自媒体
以下是关于如何快速正确地学习 AI 做自媒体的建议: 一、了解 AI 基本概念 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 1. 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。同时,一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 1. 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 2. 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 1. 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 2. 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,关于如何用 AI 进行英语学习和数学学习: 英语学习 1. 利用 AI 写作助手(如 Grammarly)进行英语写作和语法纠错,改进英语表达和写作能力。 2. 使用语音识别应用(如 Call Annie)进行口语练习和发音纠正,获取实时反馈和建议。 3. 使用自适应学习平台(如 Duolingo),利用 AI 技术量身定制学习计划,提供个性化的英语学习内容和练习。 4. 利用智能对话机器人(如 ChatGPT)进行英语会话练习和对话模拟,提高交流能力和语感。 数学学习 1. 使用自适应学习系统(如 Khan Academy),结合 AI 技术提供个性化的数学学习路径和练习题,根据能力和需求精准推荐。 2. 利用智能题库和作业辅助工具(如 Photomath),通过图像识别和数学推理技术获取数学问题的解答和解题步骤。 3. 使用虚拟教学助手(如 Socratic),利用 AI 技术解答数学问题、提供教学视频和答疑服务,帮助理解和掌握数学知识。 4. 参与交互式学习平台(如 Wolfram Alpha)的数学学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 通过结合 AI 技术和传统学习方法,可以更高效、更个性化地进行英语学习和数学学习,并取得更好的学习效果。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-04
如何让AI协助我思考观点是否正确
要让 AI 协助您思考观点是否正确,可以参考以下内容: 1. 认识到 AI 可能存在的问题: AI 可能会“产生幻觉”,生成看似合理但错误的内容,甚至连续且良好地撒谎,所以对其输出的内容需要全面检查。 AI 不会真正解释自己,给出的关于思考过程的回答可能是编造的,理解系统中的偏见也很困难。 利用 AI 工具时要对输出负责,避免不道德地使用来操纵或作弊。 2. 利用 AI 辅助写作课题的步骤和建议: 确定课题主题:明确研究兴趣和目标,选择有价值和创新性的主题。 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关文献和资料。 分析和总结信息:利用文本分析工具提取关键信息和主要观点。 生成大纲:使用写作助手生成包括引言、文献综述等部分的大纲。 撰写文献综述:借助 AI 工具确保内容准确完整。 构建方法论:根据需求利用 AI 建议的方法和技术设计研究方法。 数据分析:若涉及数据处理,使用相关 AI 工具。 撰写和编辑:利用写作工具并检查语法和风格。 生成参考文献:使用文献管理工具生成正确格式。 审阅和修改:用审阅工具检查逻辑性和一致性,根据反馈修改。 提交前的检查:确保课题原创性并调整格式。 但要记住,AI 只是辅助,不能替代研究者的专业判断和创造性思维,应保持批判性思维,保证研究质量和学术诚信。 3. 提升自身认知能力以更好判断 AI 协助的结果: 像给大脑升级系统一样不断学习和训练,提升认知能力。 认清常见的“思维陷阱”,如确认偏误(倾向于寻找支持已有观点的信息)、锚定效应(易受第一印象影响)等。 锻炼逻辑思维,学习逻辑推理,识别错误论证。 掌握数据分析能力,对接触到的数字和统计数据保持警惕,不盲目相信。
2024-12-24