Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想看到一些AI agent的开放源,怎么才能看到

Answer

以下是一些 AI Agent 的开源项目及相关信息:

此外,还有以下开源项目:

Content generated by AI large model, please carefully verify (powered by aily)

References

大圣:胎教级教程:万字长文带你使用Coze打造企业级知识库

LLM可以成为AI Agent的“大脑”主要是因为它具备了以下的关键能力1.复杂语言理解:LLM经过大规模数据训练,具备理解和处理自然语言的能力,包括语法、句法以及言外之意。2.丰富的世界知识:训练数据覆盖广泛的知识域,模型可以连结不同的信息片段,进行知识推理和应用。3.上下文感知:能够根据上下文信息做出响应,连贯地处理对话或相关任务,这在处理持续的交互中非常重要。4.生成能力:不仅能够理解信息,还能够创建回答、文章甚至代码,这在任务自动化中尤为重要。5.适应不同场景:通用性和可定制性使得LLM能够适应各种不同的应用场景和需求,类似于大脑如何通过学习适应新环境。6.持续学习能力:一些LLM可通过进一步训练根据反馈学习和提升,类似于大脑通过经验学习。[heading2]1.5 AI Agent的开源项目[content][AutoGPT](https://github.com/Significant-Gravitas/AutoGPT)[BabyAGI](https://github.com/yoheinakajima/babyagi)[MetaGPT](https://github.com/geekan/MetaGPT)[GPT Researcher](https://github.com/assafelovic/gpt-researcher)[AI-16Z的AI-town](https://github.com/a16z-infra/ai-town)[斯坦福的AI-Town](https://github.com/joonspk-research/generative_agents)[ChatDev](https://github.com/OpenBMB/ChatDev)

12月26日 AI资讯汇总

DeepSeek-V3-Base宣布开源。685B参数,256个专家动态路由,效率与性能兼备在aider多语言编程测评超过Claude 3.5 Sonnet-20241022和Gemini Exp-1206。?地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main[heading3]智谱开源新的GUI Agent:CogAgent-9B-20241220[content]CogAgent仅依赖于屏幕截图作为输入(无需HTML等文本表征),可以根据用户指定的任意任务,结合过往的操作历史,预测下一步的GUI操作。在GUI感知、推理预测准确性、动作空间完善性、任务的普适和泛化性上得到了大幅提升,能够接受中英文双语的屏幕截图和语言交互。1.模型基座和结构升级:使用更强大的视觉语言模型GLM-4V-9B作为基座模型,大幅提升模型的基座图像理解性能。2.视觉处理模块优化:实现了更高效统一的视觉处理模块,支持1120*1120原生高分辨率图像输入。3.数据集丰富与完善4.预训练策略优化,后训练策略改进,模型推理及思维链优化此版CogAgent模型已被应用于智谱AI的GLM-PC产品?地址:https://cogagent.aminer.cn/blog#/articles/cogagent-9b-20241220-technical-report申请内测:[https://cogagent.aminer.cn/home](https://cogagent.aminer.cn/home)如有任何问题请联系后台~电子邮箱:alolg@163.com

GPTs 、中间层、Chatbot虚拟社交、AI Agent, 大模型应用最新方向解析

准确的来说,AI Agent指的是一种智能代理系统,它接近人类的大脑,可形成记忆、达成行动规划、自动交互、主动预测。目前AI Agent的概念在市场上并没有达成共识,存在被广泛滥用的现象。(很多Chatbot应用给Bot冠以“智能体”的名称,准确的说是对Agent的误用)[heading3]AI Agent应用的特点:[content]个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测Dot App在对话中了解用户喜好,随后为用户推荐新的咖啡店自主完成任务:Auto GPT:用户输入一个目标后,可自主执行任务、递归地开发和调试代码多Agent协作斯坦福大学的SmallVille(小镇)项目,现已开源25个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活Fixie AI在收到用户请求后启动多个负责不同模块的Agent进行数据查询和传递,最终生成邮件内容给客户回复博主林亦LYi的《AI炒股?我开了一家员工全是AI的公司,自动帮我炒股》就在某种程度上实现了多Agent协作的能力:目前,AI Agent应用大多集中在2B场景,面向个人消费者的产品少之又少。一方面是高度智能化的Agent能力需要打磨,概念落地还有较长一段距离;一方面是AI和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
AI Agents(智能体)
AI 智能体(Agents)是人工智能领域中一个重要的概念: 1. 从 AGI 的发展等级来看,智能体不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 2. 作为大模型的主要发展方向之一,智能体中间的“智能体”其实就是大模型(LLM)。通过为 LLM 增加工具、记忆、行动、规划这四个能力来实现。目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。 3. 从智能体的起源探究来看,心灵社会理论认为智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,每个层次由多个 Agent 负责,每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。同时存在专家 Agent、管理 Agent、学习 Agent 等不同类型的 Agent 及其相应功能。从达特茅斯会议开始讨论人工智能,到马文·明斯基引入“Agent”概念,“AI”和“Agent”就彻底聚齐,往后被称之为 AI Agent。
2025-04-15
B端AI Agent
以下是关于 B 端 AI Agent 的相关知识: 一、概念定义 1. 智能体(Agent)简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。随着 ChatGPT 与 AI 概念的爆火,出现了很多相关新名词,如 bot 和 GPTs 等。AI 大模型是技术,面向用户提供服务的是产品,因此很多公司关注 AI 应用层的产品机会。 C 端案例:如社交方向,用户注册后先捏一个自己的 Agent,然后让其与他人的 Agent 聊天,两个 Agent 聊到一起后真人再介入;还有借 Onlyfans 入局打造个性化聊天的创业公司。 B 端案例:字节扣子和腾讯元器若为面向普通人的低代码平台,类似 APP 时代的个人开发者,那么帮助 B 端商家搭建 Agent 就类似 APP 时代专业做 APP 的。 2. 智能体开发平台:最早接触到的扣子 Coze 是通过一篇科技报道,如 2 月 1 日,字节正式推出 AI 聊天机器人构建平台 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。国内还有很多智能体开发平台,如 Dify.AI,但个人较常用的是扣子,所以常对比字节扣子和腾讯元器。 3. 关注智能体的原因:目前 AI Agent 的概念在市场上未达成共识,存在被滥用现象。AI Agent 指的是一种智能代理系统,接近人类大脑,可形成记忆、达成行动规划、自动交互、主动预测。其应用具有个性化、自主完成任务、多 Agent 协作等特点。目前 AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品少,一方面是高度智能化的 Agent 能力需打磨,概念落地有距离;另一方面是 AI 和娱乐消费诉求结合少,主要带来生产方式和效率变革,个人消费者方向目前只看到“私人助理”场景。
2025-04-15
有关 ai agent 的科普文章
以下是为您提供的关于 AI Agent 的科普内容: AI Agent 是一个融合了多学科精髓的综合实体,包括语言学、心理学、神经学、逻辑学、社会科学和计算机科学等。它不仅有实体形态,还有丰富的概念形态,并具备许多人类特有的属性。 目前,关于 AI Agent 存在一些情况。例如,网络上对其的介绍往往晦涩难懂,让人感觉神秘莫测,其自主性、学习能力、推理能力等核心概念,以及如何规划和执行任务、理解并处理信息等方面,都像是笼罩在一层神秘面纱之下。 另外,以国与国之间的外交为例来解释相关协议。假设每个 AI 智能体(Agent)就是一个小国家,它们各自有自己的语言和规矩。各国大使馆试图互相沟通、做生意、交换情报,但现实中存在诸多问题,如协议各异、要求不同等。 如果您想了解更多关于 AI Agent 的详细内容,可访问: 。
2025-04-15
,AI agent 发展趋势,技术状态,商业模式
以下是关于 AI Agent 的发展趋势、技术状态和商业模式的相关信息: 发展趋势: 2024 年内,办公场景“AI 助手”开始有良好使用体验,实时生成的内容开始在社交媒体内容、广告中出现。 2025 2027 年,接近 AGI 的技术出现,人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 技术状态: 目标实现基于 ReAct、SFT、RAG、强化学习等实现自主规划能力的 AI Agent,构建具备认知、决策智能的 Agent 智能体框架。 专注文本/多模态大模型、AI Agent 技术创新与应用。 商业模式: 依据不同类型销售市场的特点,结合一站式 AI 搭建平台将销售部署的产品化和模版化,让企业更容易落地和应用 AI 能力。 销售智能体 Blurr.AI 占位交易环节,解决 2B 销售获客的痛点,且具有向前后端环节延展的势能。
2025-04-13
AGENT
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,既可以是软件程序,也可以是硬件设备。 智能体具有以下特点: 1. 自主系统:通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到某种目标。 2. 关键组成部分: 规划:将大型任务分解为更小、可管理的子目标,有效处理复杂任务。 反思和完善:对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 记忆:包括短期记忆,用于所有的上下文学习;长期记忆,通过利用外部向量存储和快速检索实现长时间保留和回忆信息。 工具使用:学习调用外部 API 来获取模型权重中缺失的额外信息。 以下是一些与智能体相关的资源目录: 关于 2025AGENT 智能体全球创作大赛: 1. 报名:通过→首页的“立即参赛”按钮进入报名页面,填写相关信息并提交即可,且参赛完全免费。 2. 提交作品:在本网站直接提交,若采用 flowith 搭建了 Agent 可以在微博、小红书、即刻平台发布,并@Flowith 官方,可获得额外会员奖励。 3. 奖项设置:设有金、银、铜奖和多个单项奖,获奖后将获得组委会颁发的奖金和证书,需保证联系方式准确以便联系。 4. 知识产权归属:参赛作品的知识产权归参赛者所有,但组委会有权在宣传和展示中使用参赛作品。
2025-04-12
AI workflow在企业中是否比Agent应用价值和场景更多
AI workflow 和 Agent 在企业中的应用价值和场景各有特点。 Agentic Workflows 具有以下优势: 1. 灵活性、适应性和可定制性:能够根据任务难度进行调整和演变,通过组合不同模式实现定制,在需求和复杂性增长时进行迭代升级。 2. 在复杂任务上的性能提升:将复杂任务分解为更小、可管理的步骤,显著优于确定性的零样本方法。 3. 自我纠正和持续学习:能够评估自身行为,完善策略,从过去经验中学习,在每次迭代中变得更有效和个性化。 4. 操作效率和可扩展性:可以高精度自动化重复任务,减少人工操作和运营成本,还能轻松扩展。 Agentic Workflow 的应用场景包括原子设计模式的组合、与人类反馈循环集成等。例如,Agentic RAG 在检索增强生成流程中引入了一个或多个 AI Agents,在规划阶段可进行查询分解等操作,还能评估数据和响应的相关性和准确性。 一般来说,Workflow 是一系列旨在完成特定任务或目标的相互连接的步骤。最简单的工作流是确定性的,遵循预定义步骤序列。有些工作流利用大模型或其他 AI 技术,分为 Agentic 和非 Agentic 两类。非 Agentic 工作流中,大模型根据指令生成输出。Agentic Workflow 是由单个或几个 AI Agents 动态执行的一系列连接步骤,被授予权限收集数据、执行任务并做出决策,利用 Agents 的核心组件将传统工作流转变为响应式、自适应和自我进化的过程。 综上所述,不能简单地说 AI workflow 在企业中比 Agent 应用价值和场景更多,这取决于企业的具体需求和任务特点。
2025-04-09
AI 领导力课程在哪里可以看到
您可以在以下网址查看 AI 领导力课程:https://www.ailingdaoli.com/ 。该课程包含多个核心模块、精选课时、实践价值等内容,如 AI 思维、AI 素养的培养,涵盖逻辑、抽象、创造等思维的训练,以及对课程大纲、学习效果、学习收获、课程价格等方面的介绍。
2025-04-09
我想在飞书云中用DeepSeek-R1模型提取链接中的信息,请问如何写指令呢?我刚刚进行了尝试,发现提取出的信息和我点开链接看到的信息不一致,这个问题又该如何解决呢?
在飞书云中使用 DeepSeekR1 模型提取链接中的信息并解决提取信息不一致的问题,您可以参考以下内容: 对于指令编写: 虽然 R1 推理能力较强,但您想表达的不一定完全与模型吻合,因此建议多加清晰指令。 模糊指令优化方面,比如对于宽泛需求可添加维度约束,如原句“写小说”可修正为“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”;对于主观表述可量化标准,如原句“写得专业些”可修正为“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 迭代优化法包括首轮生成获取基础内容、特征强化(如加强第三段的技术细节描述)、风格调整(如改用学术会议报告语气,添加结论部分)、最终校验(检查时间逻辑一致性,列出可能的事实性错误)。 对于提取信息不一致的问题: 信息幻觉:追加请标注所有不确定陈述,并提供验证方法。 格式偏离:使用严格遵循以下模板:第一行...第二行... 深度不足:触发请继续扩展第三章节内容,添加案例佐证。 另外,关于获取字节火山 DeepSeek 系列 API 完整教程及使用方法: 1. 注册并登录火山引擎,点击立即体验进入控制台。 2. 创建一个接入点,点击在线推理创建推理接入点。 3. 为接入点命名为 DeepSeekR1。 4. 若有提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议一路开通(免费)。 5. 确认无误后,点击“确认接入”按钮。 6. 自动返回创建页面,复制多出的接入点名为“DeepSeekR1”的推理点 ID 并保存。 7. 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】。 8. 若已有 API key 直接查看并复制,没有则点击【创建 API key】。 9. 复制并保存好 API key。 在实现新闻播报自动化工作流方面: 第一步是内容获取,输入新闻链接,系统自动提取核心内容。开始节点的入参包括新闻链接和视频合成插件 api_key。添加网页图片链接提取插件,获取网页里的图片。接着利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片。然后使用链接读取节点,将文字内容提取出来。在提取链接后面接上一个大模型节点,用 DeepSeekR1 模型生成有吸引力的口播内容。若想加上自己的特征,可在提示词里写“开头加上‘这里是伊登 AI’之类的个性化台词防伪”。
2025-03-18
我是小白,刚看到这个论坛,应该怎么开始 学习
对于刚接触 AI 领域的小白,以下是一些开始学习的建议: 1. 选择合适的开始方式: 本地部署:如果您的电脑是 M 芯片的 Mac 电脑(Intel 芯片出图速度非常慢,因此不建议)或者 2060Ti 及以上显卡的 Windows 电脑,可以选择本地部署。强烈建议在配有 N 卡的 Windows 电脑上进行。 在线平台:对于电脑不符合要求的小伙伴可以直接使用在线工具,在线工具分为在线出图和云电脑两种,前者功能可能会受限、后者需要自己手动部署,大家根据实际情况选择即可。 配台电脑:非常不建议一上来就配主机,因为大概率会变成游戏机或者吃灰(土豪请随意)。玩几个月后还对 AI 有兴趣的话再考虑配个主机。主机硬盘要大,显卡预算之内买最好,其他的随意。 2. 学习基础课程: 先验经验:需要熟练使用文生图、图生图;需要有一定的逻辑思考能力以及推理能力;适合炼丹新人、小白。 课程安排:课程大约 70 80%是理论和方法论的内容,大部分练习会在课外跟大家沟通、练习。只有少部分必要内容会在课上演示。 3. 学习路径: 必学、必看内容是基础课,主要是为了解决环境问题和软件安装不上的问题。 建炉是针对不同炼丹方式提供了不同的炼丹工具的安装教程。 正式的内容部分分为了数据集预处理、模型训练以及模型调试及优化三个部分。 另外,您的 AI 之旅可以从 prompt 开始。在开始时,您可能更多的是临时捏一些 prompt 解决具体的问题,随着学习的深入,可以将 prompt 规范、抽象用以让 AI 拟人。在这个过程中,您需要花一些时间和做一些准备,多参与社区交流,社区中很多门槛问题都已经有了解决方案。
2025-03-05
如何看到人类与AI
人类与 AI 的关系具有多面性: 人类是工具的创造者,具有与生俱来的理解和创造驱动力,不断创造出更强大的工具,如电力、晶体管、计算机、互联网,AGI 也是人类进步的又一工具。长期来看,人类创新推动生活各方面繁荣改善,未来经济增长令人期待,十年后每个人的成就可能超越现在最具影响力的个人。 在这个时代,人类需要保持创造热情,这是与 AI 在动机上的最大差异。人类要提供立意与想法,具备抽象化和具象化能力,善于叙事和引导,并对 AI 做出的选择进行关键决策,还要深刻理解 AI 系统的工作方式与边界。AI 不再是威胁,而是伙伴,能帮助人类发挥潜力。 人类的独特价值在于能为 AI 的创造注入灵魂,避免 AI 对人类文化进行“高斯模糊”,导致独特风格被平均掉。当人类积极使用 AI 时,能将独特性留在共创作品中,保留个体独特性的世界对人类才有意义。
2025-02-13
我想学习ai提示词,但是我看到最新的deepseek好像不用提示词也可以写出很好的文案,那我还需要学习提示词吗
学习 AI 提示词是有必要的。提示词是给大语言模型的输入文本,用于指定模型应执行的任务和生成的输出,能“提示”模型做什么。设计高质量提示词需根据目标任务和模型能力精心设计,良好的提示词可让模型正确理解需求并给出符合预期的结果。 了解大模型的特性以及具备清晰表述自己需求和任务的能力,才能用好这个工具。 不过也有人持反对观点,认为像打字和写作一样,方法论不是关键,不断尝试和大模型交互就是最佳方法。但在与大模型交互时,用 Markdown 格式清晰表达问题有助于模型更好地理解用户意图,其具有结构清晰、格式化强调、适用性广等优点。 像 DeepSeek 这样的推理型大模型,更懂人话,不需要用户提供详细的步骤指令或特定的提示词模板,用自然语言描述真实场景和具体需求即可。还可以通过一些方式让 DeepSeek 的回答更符合需求,如让其“说人话”、激发深度思考、进行文风转换等。 总之,尽管有些模型可能不太依赖提示词,但学习提示词仍有助于您更好地与各类模型进行交互,并更有效地获得满意的结果。
2025-01-28
可开源的AI工具是什么意思,我可以看到她的代码吗
可开源的 AI 工具是指其源代码可以被公开获取和使用的人工智能工具。这意味着您有机会查看和研究其代码的实现方式。 以下为您列举一些常见的可开源的 AI 工具: 1. CodeGeeX:由智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,能快速生成代码,提升开发效率。 2. :一个带 Web 界面简单易用的声音克隆工具。可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。 3. :一个开源的音频、音乐和语音生成整合工具包。 4. :一键部署私人 GPT/LLM 的聊天机器人。支持语音合成、多模态和可扩展的插件系统,可以联网、画图、爬虫等。 5. :能够利用爬虫,自动抓取与整合指定 URL 地址中的各种信息,并生成一个 output.json 的数据文件。将其喂给 ChatGPT,便可快速定制您的专属 GPT,打造个人知识库或者智能助理。 6. :给 AI 看一眼截屏,便能直接生成代码。该项目可借助 GPT4 Vision 的能力,直接给您将屏幕截图转换为 HTML/Tailwind CSS,并利用 DALLE 3 的图像生成能力,生成外观相似的图像。 7. :可在命令行终端,直接调用与展示各种大模型能力。实现了视频和照片编辑、系统配置更改、自动生成并运行 Demo 源码,AI 一对一聊天问答等功能。 需要注意的是,不同的开源 AI 工具在功能和适用场景上可能会有所不同,您可以根据自己的需求选择最适合您的工具。
2025-01-20
我想看到国内在coze平台上的一些AI agent的开放源,怎么才能看到
以下是一些国内的 Agent 构建平台及 Coze 平台的相关信息: Agent 构建平台: Coze:是新一代一站式 AI Bot 开发平台,集成丰富插件工具,涵盖从基础文本处理到高级机器学习功能,还有众多符合平民生活化的插件,如新闻资讯、天气预报、出行必备、生活便利等方面的插件。 Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景方面表现出色。 要查看 Coze 平台上的 AI agent 开源内容,您可以通过以下途径尝试:在相关的技术社区、开源代码托管平台(如 GitHub 等)上进行搜索,或者关注 Coze 平台的官方网站及开发者论坛获取相关信息。但需注意,开源内容的获取可能受到平台规定和开发者授权的限制。
2025-01-12
我想看到在coze平台上的一些AI agent的开放源,怎么才能看到
在 Coze 平台上,以下是一些 AI Agent 的开源项目: 此外,以下是一些常见的 Agent 构建平台: Coze:新一代的一站式 AI Bot 开发平台,集成丰富插件工具,适用于构建各类问答 Bot。 Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景。 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。
2025-01-12
关于图转视频的开放的api
以下是一些关于图转视频的开放 API 信息: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API: API 官网:https://openapi.mobvoi.com/ 语音合成(TTS)API 地址:https://openapi.mobvoi.com/pages/soundlibrary 语音合成(TTS)操作文档:https://openapi.mobvoi.com/document?name=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%EF%BC%88TTS%EF%BC%89 使用 GPT 的视觉功能和 TTS API 处理和讲述视频: 原文作者:Kai Chen 发表于 Nov 6, 2023 Open in Github 在 Github 中打开:https://github.com/openai/openaicookbook/blob/main/examples/GPT_with_vision_for_video_understanding.ipynb 原文链接:https://cookbook.openai.com/examples/gpt_with_vision_for_video_understanding 示例包括: 使用 GPT4 获取视频的描述 使用 GPT4 和 TTS API 为视频生成画外音 详细示例链接:https://cookbook.openai.com/examples/gpt_with_vision_for_video_understanding1usinggptsvisualcapabilitiestogetadescriptionofavideo
2024-10-20
RAG应用的案例,结合本地知识库和开放搜索
以下是一些 RAG 应用的案例: 1. 用户向 ChatGPT 查询最近引起广泛关注的事件,如 OpenAI 首席执行官的突然解雇和复职,由于 ChatGPT 预训练数据的限制缺乏对最新事件的了解。RAG 通过从外部知识库中检索最新的文档摘录来解决这一问题,获取相关新闻文章并与最初的问题合并成丰富的提示,使 ChatGPT 能够合成知情的回答,展示了其通过实时信息检索增强模型响应能力的过程。 2. 在本地知识库的搭建中,利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。RAG 应用可抽象为 5 个过程:文档加载,从多种来源加载文档;文本分割,把文档切分为指定大小的块;存储,包括将切分好的文档块嵌入转换成向量形式并存储到向量数据库;检索,通过检索算法找到与输入问题相似的嵌入片;输出,把问题及检索出来的嵌入片一起提交给 LLM,让其生成更合理的答案。 3. 在了解 RAG 全貌时,其流程分为离线数据处理和在线检索两个过程。离线数据处理目的是构建知识库这本“活字典”,在线检索则是利用知识库和大模型进行查询的过程。以构建智能问答客服这一最经典的应用场景为例,可深入了解 RAG 所有流程中的“What”与“Why”。
2024-10-20
开放式提示词,封闭式提示词,引导式提示词的联系与区别,请画表格描述
|提示词类型|联系|区别| |||| |开放式提示词|都是提示词的不同形式,旨在引导模型生成相应的输出|没有明确的限制和指向,给予模型较大的创作空间| |封闭式提示词| |具有明确的限制和具体的指向,模型的输出范围较窄| |引导式提示词| |在一定程度上引导模型的输出方向,但又不像封闭式那么严格|
2024-09-07
什么是开放式提示词
开放式提示词通常指具有开放和自由特质的表述。例如在音乐风格中,“Open”指的是开放和自由的音乐风格,通常具有宽广和无拘无束的特质,典型用于表现开放和自由情感的音乐作品,如 John Lennon's《Imagine》,关联流派有 Rock、Pop、Classic Rock 等。在教学场景中,好老师会擅长用简单而充满哲理的语言给学生带来开放性的想象。在哲学沉思中,任务是讨论给定主题的一个哲学概念或思想实验,通过简要解释该概念,呈现主要论点和含义,并提出开放式问题来鼓励批判性思维。
2024-09-07