Navigate to WaytoAGI Wiki →
Home/All Questions
可灵视频提示词怎么写
以下是关于可灵视频提示词的写法: 1. 上传基础视频: 点击页面下方的【Pikaddition】按钮。 拖拽或点击上传本地视频。 若自己没有视频,可在“templates”板块使用官方示例视频做测试。 2. 添加主角图片:点击【Upload Image】上传角色图片文件。 3. 编写视频提示词: 若需要参考角色在视频里的相关互动,需在输入框用英文描述期望效果(支持 Emoji 辅助),然后点击生成按钮。 Pika 会提供一段默认 prompt,若无特殊想法,可直接使用。 建议在自己的提示词尾部加入官方提供的默认提示词,效果会更好。 提示词公式参考: 事件驱动句式:As... 空间锁定技巧:使用场景物体作坐标轴:on the.../behind the.../from the... 动态呼应原则:角色动作与视频元素联动:swaying with.../reacting to.../matching... 核心逻辑:Pikadditions 的核心功能是用户上传实拍视频和角色图片,AI 将角色动态融入视频中。因此,提示词需要具体描述角色在视频中的动作、互动和场景匹配。 此外,对于 Adobe Firefly 的提示词技巧: 明确且具体描述,尽量使用更多词汇来具体描述光线、摄影、色彩、氛围和美学风格。 提示词公式:镜头类型描述+角色+动作+地点+美学风格。 镜头类型描述:相机的视角是什么?它是如何移动的?示例:“一个特写镜头,缓慢推近。” 角色描述:角色是谁?他们长什么样子?他们穿着什么?他们的情绪如何?示例:“一只体型庞大的北极熊,拥有明亮的白色毛皮,看起来若有所思。” 动作:角色在场景中做什么?示例:“北极熊正轻柔而自信地走向它之前在冰面上打开的一个洞,准备在冰面下捕猎。” 地点:角色在哪里?天气如何?地形是怎样的?示例:“地点是一片荒凉的雪地;远处灰蒙蒙的云朵缓慢移动。” 美学风格:这是什么类型的镜头?氛围是怎样的?景深如何?示例:“电影感、35mm 胶片、细节丰富、浅景深、散景效果。” 构建提示词时,建议限制主题数量,过多的主题(超过四个)可能会让 Firefly 感到困惑。
2025-03-12
开发者ai的知识有哪些
以下是关于开发者 AI 的一些知识: 一个 9 岁小男孩创建了“超级飞机百科”的 AI 机器人,它是飞机专家,能通过语音、文字等形式对话,呈现多种形式的内容,通过识别对话内容等实现智能搜索、归纳总结,以多维度呈现答案,涵盖飞机的类型、构造、原理、飞行技术等方面。其技术实现原理包括设定人设与回复逻辑,添加“抖音视频/get_vedio”和“必应搜索/bingWebSearch”插件实现搜索调用功能,添加文本和表格实现个性化问题的调用解答。 Inworld AI 可以使 NPC 能够自我学习和适应,具有情绪智能。它具有实时语音功能,可配置安全性、知识、玩家档案、关系和第四堵墙等功能,能与各种游戏引擎和其他游戏开发工具无缝对接,还能帮助品牌创建交互性强的 AI 角色,无需编码。 关于被动学习,如像 GPT 这类工具能帮助用户提出更好的问题,具有追问和上下文功能,普通人可基于上下文不断追问提出更好的问题,但在追问过程中用户可能会放弃,需要在产品中做好引导。
2025-03-12
什么模型
以下为一些常见的模型: 智谱·AI 开源模型: WebGLM10B:利用百亿参数通用语言模型(GLM)提供高效、经济的网络增强型问题解答系统,旨在通过将网络搜索和检索功能集成到预训练的语言模型中,改进现实世界的应用部署。代码链接: WebGLM2B:代码链接: MathGLM2B:在训练数据充足的情况下,20 亿参数的 MathGLM 模型能够准确地执行多位算术运算,准确率几乎可以达到 100%,其结果显著超越最强大语言模型 GPT4 在相同测试数据上 18.84%的准确率。代码链接: MathGLM500M:模型下载: MathGLM100M:模型下载: MathGLM10M:模型下载: MathGLMLarge:采用 GLM 的不同变体作为骨干来训练 MathGLM,包括具有 335M 参数的 GLMlarge 和 GLM10B。此外,还使用 ChatGLM6B 和 ChatGLM26B 作为基座模型来训练 MathGLM。这些骨干模型赋予 MathGLM 基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。模型下载: OpenAI 模型: GPT4 Beta:一组改进 GPT3.5 的模型,可以理解和生成自然语言或代码 GPT3.5:一组改进 GPT3 的模型,可以理解并生成自然语言或代码 DALL·E Beta:可以在给定自然语言提示的情况下生成和编辑图像的模型 Whisper Beta:可以将音频转换为文本的模型 Embeddings:一组可以将文本转换为数字形式的模型 Codex Limited Beta:一组可以理解和生成代码的模型,包括将自然语言转换为代码 Moderation:可以检测文本是否敏感或不安全的微调模型 GPT3:一组可以理解和生成自然语言的模型 Qwen 2 模型: 包括 5 种尺寸的预训练和指令调整模型,分别是 Qwen20.5B、Qwen21.5B、Qwen27B、Qwen257BA14B 和 Qwen272B。 除英语和中文外,还接受过另外 27 种语言的数据训练。 在大量基准评估中表现出最先进的性能,代码和数学性能显著提高,全面超越 llama3。 增大了上下文长度支持,最高达到 128K tokens(Qwen272BInstruct)。其中 72B 和 7B 可处理 128k 上下文,57BA14B 可处理 64k 上下文,0.5B 和 1.5B 可处理 32k 上下文。 在 MMLU、GPQA、HumanEval、GSM8K、BBH、MTBench、Arena Hard、LiveCodeBench 等国际权威测评中,Qwen272B 获十几项世界冠军,超过美国的 Llama3。
2025-03-12
当前国内有哪些AIGC应用
当前国内的 AIGC 应用主要有以下一些: 语言文本生成类: “悟道・天鹰”(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 文心一言(百度):大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。
2025-03-12
有没有接入微信消息的coze工作流案例
以下是一些接入微信消息的 Coze 工作流案例: 1. 【拔刀刘】自动总结公众号内容,定时推送到微信(附完整实操教程) 搭建工作流: 设置 Bot: 人设和回复逻辑:由于 Bot 主要依托于工作流,设置提示词,直接调用工作流,将 sum_weixin_2_2 替换为工作流的名称。 工作流:添加刚刚创建的工作流。 设置触发器:选择「定时触发」,选择触发的时间,比如每天 18 点,任务执行时输入工作流中开始节点的输入参数,如 key 为 Server 酱的 sendkey,rss_list 可以使用提供的测试数据。触发器在设定时间点根据输入项内容执行工作流,从而在微信收到推送的总结内容。可以同时设置多个触发器,最多 10 个,可推送给不同的人或分不同时间段给自己推送不同内容。 发布到飞书:点击右上角「发布」,注意渠道选择飞书,因为目前 Coze 平台触发器只对飞书渠道生效。 2. AI 实战:搭建信息情报官 Agent 先在 http://open.feishu.cn 上建飞书机器人,并添加知识库或多维表格编辑权限,获得机器人的 app_id 和 app_secret 以获取租用 token:tenant_access_token 来获取多维表格数据和编辑能力。 工作流一:通过微信文章链接进行文章解读成摘要报告,通过 LLM 能力,开源提示词如下。由于 Coze 使用 LLM 和批量执行任务延时的约束,建议不要同时处理太多文章(如 6 篇左右)。执行后将多维表格的文章状态转换成“已通知”并生成简报。 消息情报官 Bot:通过 Coze 建定时任务,执行工作流二,并添加其他如分析文章和搜索文章的能力,变成一个消息情报官的 Agent,发布到 Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等。可以构建多个分身,收集整理不同领域和行业的情报信息。 3. Bot 智能体|用 Coze 实现【多模态资讯的跨平台推送】 技术实现原理: Coze API 接入微信群 Bot:登录宝塔面板,在宝塔面板当中可视化控制云服务器,部署 docker 容器,启动 COW 项目与微信取得关联。chatgptonwechat(简称 CoW)项目是基于大模型的智能对话机器人,可以接入微信公众号、企业微信应用、飞书、钉钉,可选择多种模型,能处理文本、语音和图片,通过插件访问操作系统和互联网等外部资源。点击“Docker”中的“项目模板”中的“添加”按钮,将编译好的内容复制进来,在容器中创建容器,选择容器编排,填入模板和名称,确定。运行成功后点击容器,可看到运行的是两个服务,点击“wcandyaibot”后面的日志按钮,用微信扫码,手动刷新日志,看到 WeChat login success 即成功将 Bot 接入微信。
2025-03-12
coze工作流的相关教程。要求从入门到实操的最新资料
以下是关于 Coze 工作流从入门到实操的相关资料: 一、一泽 Eze 的教程 Step 1:制定任务的关键方法 1. 设计每个子任务的执行方法 阅读理解小作业:基于英文原文,精心策划 3 道符合 CET4 难度的阅读理解题目。每道题均提供 A、B、C、D 四个选项,正确答案所在选项顺序随机,题目和选项均以英文呈现。题目的参考格式如下: 1) A. B. C. D. 参考答案:针对 3 道题目,生成题目答案。预期格式如下: 1) 答案: 2) 答案: 3) 答案: 英文音频:根据原文,利用 TTS 技术朗读全文 全文对照精读:根据原文,按照以下格式,分段完成全文精读结果的输出: 音标: 中文释义: 英文例句: 例句翻译: 二、大圣的教程 二、Coze 使用教程 1. 工作流AI Agent 的内功心法 节点:工作流是由多个节点构成,节点是组成工作流的基本单元。节点的本质就是一个包含输入和输出的函数。 Coze 平台支持的节点类型: LLM(大语言模型):使用输入参数和提示词生成处理结果。 Code(代码):通过 IDE 编写代码处理输入参数,并返回输出值。 Knowledage(知识库):根据输入参数从关联知识库中召回数据,并返回。 Condition(条件判断):ifelse 逻辑节点,用于设计工作流内的分支流程,根据设置条件运行相应的分支。 Variable(获取变量):从 Bot 中获取变量作为参数在工作流中使用。 Database(数据库):在工作流中使用提前配置在 Bot 数据库中的数据。 2. 创建和使用工作流 这一块官方有现成的教程参考: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本还提供了一些示例,学习工作流强烈建议大家跟着实操一遍: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent 三、蓝衣剑客的教程 三、Coze 简介 1. 工作流 在典型应用场景中,入门级场景可能仅添加一个节点来构建简单工作流。例如,使用获取新闻插件构建一个获取新闻列表的工作流;使用大模型节点接收并处理用户问题等。 更进阶的场景则通过多个节点组合构建逻辑较复杂的工作流。例如,在搜索并获取指定信息详情的场景中,先通过插件能力进行关键词搜索、然后通过代码节点过滤指定信息、最后通过插件能力获取信息详情;或者在通过条件判断识别用户意图的场景中,通过大模型节点处理用户消息,并将消息分类后通过条件节点分别处理不同类型的消息。这些详细配置教程提供了实际操作指南以帮助理解和应用各种功能。
2025-03-12
提示词生成工具
以下是关于提示词生成工具的相关信息: Midjourney 提示词生成器: 仿照 GPTs 里的 MJ prompt 改了一版提示词,可用于 coze 或其他国内的 agent。 对节点无要求,画插图可不切节点,不挑模型,基本都能用。 方便之处在于若提示词懒得写全,可让 agent 补全润色,粘贴即可。 测试画面示例: 一个巨大鲸鱼头部的特写,鲸鱼的眼睛显示疲惫的神情,一个小女孩站在鲸鱼的旁边抚摸鲸鱼的脸,小女孩占画面比例很小,体现鲸鱼的巨大,吉卜力工作室风格。 一个乌克兰女孩的黑白写真照。 一个大型交响乐团在音乐厅里演奏。 Prompt 网站精选: 图像类 Prompt 网站: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney, img2prompt:根据图片提取 Prompt, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, NovelAI tag 生成器:设计类 Prompt 提词生成器, 魔咒百科词典:魔法导论必备工具,简单易用的 AI 绘画 tag 生成器, KREA:设计 AI 的 Prompt 集合站,create better prompts, 【SD】自动写提示词脚本 One Button Prompt: 在插件下方可添加提示词增加控制,如规定所画必须是猫或标准化质量提示词,帮助获得更符合期望的图片。 随机抽出的图像有好有坏,能启发灵感。 大模型换成二次元“AnythingV5”,主题设定为“人物”,在覆盖主题处填入相关提示词,如“一个肥胖的人”,其他全随机。 可通过图生图控制,如给定垫图,能联想构图和姿态相似的随机图片,相比图生图直接联想,图生图与原图相似度更高,此插件更天马行空。 设定主题“风景”,正向提示词给“房子”,在“工作流协助”中点击“生成一些提示词”,会随机生成 5 段提示词,任选一张发送到上方点击生成,渲染出来效果风格各异,可进行提示词修改调整。
2025-03-12
如何写好一个prompt
写好一个 prompt 可以参考以下建议: 1. 明确任务:清晰地定义任务,比如写故事时应包含背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,要在 prompt 中提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的表述,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在 prompt 中明确指出。 5. 使用示例:若有期望结果,可在 prompt 中提供示例,帮助 AI 模型理解需求。 6. 保持简洁:避免过多信息,以免 AI 模型困惑,导致生成不准确结果。 7. 使用关键词和标签:有助于 AI 模型理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整 prompt,可能需要多次迭代达到满意效果。 此外,在 Claude 3.5 中,一个“汉语新解”的 prompt 爆火,其写法使用了伪代码,让人们意识到 prompt 可以有新奇的写法。Anthropic 公司几位负责提示词的工程师们也对如何写好 prompt 进行了讨论。 在即梦 AI 视频生成中,prompt 是直接描述或引导视频生成的文本或指令,类似给 AI 的提示,包含主体、运动、风格等信息,作用十分重要,是表达需求的方式,影响视频内容和质量。您可以将其理解为把输入的文字变成对应的画面和运动形式。同时要注意在不同的生成方式(如图片生视频、文本生视频)中 prompt 的输入位置。
2025-03-12
agent和agi的区别
Agent 和 AGI 的区别主要体现在以下几个方面: Agent(智能体): 是执行特定任务的 AI 实体。 拥有复杂的工作流程,可以自我对话,无需人类驱动每一部分的交互。 由大型语言模型、记忆、任务规划以及工具使用等部分组成。 例如在斯坦福 25 人小镇案例中有所应用。 AGI(人工通用智能): 强调的是具备像人类一样广泛和通用的智能能力。 追求能够在各种不同的任务和领域中表现出高度智能的水平。 总的来说,Agent 更侧重于特定任务的执行和特定功能的实现,而 AGI 则是一个更宏观和全面的概念,旨在实现广泛的通用智能。
2025-03-12
agent和workflow的区别
智能体(Agent)和工作流(Workflow)的区别主要体现在以下几个方面: 1. 定义和功能: 智能体是由 LLM 动态指导自身流程和工具使用的系统,能够自主控制任务完成方式。 工作流是通过预定义代码路径来编排 LLM 和工具的系统。 2. 运行方式: 智能体可以长期独立运行,是全自动的系统,能使用各种工具完成复杂任务。 工作流中的子任务是人为编排的,属于手动编排。 3. 组成和特点: 工作流中的每个组块可以看成是一个函数,包括传统函数、调用第三方服务的函数和基于 LLM 的函数。由这三类函数组合而成的工作流被称为超函数,它不同于传统函数,形式上是用自然语言编写的程序,功能上可以模拟人的高阶思维。 智能体在架构上与工作流有所区分,其更强调自主性和动态性。 在实际应用中,工作流的灵活性和可控性能够将智能体能力的天花板往上顶一大截,例如可以在流程中加入人类 Knowhow、进行专家测试试跑、引入图的概念灵活组织节点等。评价一个 Agent 平台好不好用,可以从基座模型的 function calling 能力、workflow 的灵活性以及平台创作者的 workflow 编写水平等方面考量。
2025-03-12