Navigate to WaytoAGI Wiki →
Home/All Questions
DeepSeek R1卡顿如何解决
以下是解决 DeepSeek R1 卡顿的方法: 1. 拥有扣子专业版账号:如果您还是普通账号,请自行升级或注册专业号后使用。 2. 开通 DeepSeek R1 大模型: 访问地址:https://console.volcengine.com/cozepro/overview?scenario=coze 打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务。 添加在线推理模型,添加后在扣子开发平台才能使用。 3. 创建智能体:点击创建,先完成一个智能体的创建。 4. 创建工作流: 创建一个对话流,命名为 r1_with_net。 开始节点,直接使用默认的。 大模型分析关键词设置:模型选择豆包通用模型lite,输入直接使用开始节点的 USER_INPUT 作为大模型的输入,系统提示词为“你是关键词提炼专家”,用户提示词为“根据用户输入`{{input}}`提炼出用户问题的关键词用于相关内容的搜索”。 bingWebSearch搜索:插件选择 BingWebSearch,参数使用上一个节点大模型分析输出的关键词作为 query 的参数,结果中 data 下的 webPages 是网页搜索结果,将在下一个节点使用。 大模型R1 参考搜索结果回答:在输入区域开启“对话历史”,模型选择韦恩 AI 专用 DeepSeek,输入包括搜索结果和开始节点的 USER_INPUT,开启对话历史并设置 10 轮。 结束节点设置:输出变量选择大模型R1 参考搜索结果回答的输出,回答内容里直接输出:{{output}}。 测试并发布工作流:输入测试问题,测试完成后直接发布工作流。 此外,您还可以通过以下途径获取更多相关信息: 1. 2 月 14 日 8 点直播进行中:火山引擎解决方案专家带大家在 Coze 搭建满血版 R1 bot,飞书会议直播结束,回放看: 2. 学习文档: 3. 模板更新了:
2025-03-20
入门级介绍
以下是关于入门级的介绍: 在 AI 产品经理方面,入门级能通过 WaytoAGI 等开源网站或一些课程了解 AI 的概念,使用 AI 产品并尝试动手实践应用搭建,对应的画像可能是喜欢听小宇宙 APP 的播客或浏览 AI 相关的文章。 在搭建微信机器人方面,入门级如 Stuart 的教程,教你用最简单的方式搭建微信机器人,网速好的话一个小时能搞定。
2025-03-20
微调
微调(Finetuning)是一种迁移学习技术,常用于深度学习中。其基本思路是先有一个在大量数据上预训练过的模型,该模型已学会一些基本模式和结构,如在自然语言处理中学会基本语法和单词语义,在图像识别中学会基本形状和纹理。然后在特定任务数据上继续训练该模型以适应新任务。 例如在情感分类任务中,可先使用大量语料库预训练模型,再用标注过的电影评论继续训练以判断情感;在图像分类任务中,先使用大量图片预训练模型,再用标注过的猫和狗的图片继续训练以区分二者。 微调具有以下优点:能利用预训练模型学到的知识,提高模型在特定任务上的性能。 微调还涉及超参数的选择,默认超参数适用于一系列用例,唯一需要的参数是训练文件。调整超参数通常可产生更高质量输出的模型,可能需要配置的内容包括: 1. 模型:可选择“ada”“babbage”“curie”或“davinci”之一。 2. n_epochs:默认为 4,指训练模型的时期数。 3. batch_size:默认为训练集中示例数量的 0.2%,上限为 256,是用于训练单个正向和反向传递的训练示例数。 4. learning_rate_multiplier:默认为 0.05、0.1 或 0.2,取决于 final batch_size,微调学习率是用于预训练的原始学习率乘以该乘数。 5. compute_classification_metrics:默认为假,若为 True,在每个 epoch 结束时在验证集上计算特定于分类的指标。 通过微调可从 API 提供的模型中获得更多收益,如比即时设计更高质量的结果、能够训练比提示中更多的例子、因更短的提示节省 Token、更低的延迟请求。 微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。还可继续微调微调模型以添加其他数据。 安装建议使用 OpenAI 命令行界面,需设置环境变量 OPENAI_API_KEY。
2025-03-20
教案提示词
以下是关于教案提示词的相关内容: 提示词模板: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru: 提示词语法: 根据自己想画的内容写出提示词,多个提示词之间使用英文半角符号。 一般而言,概念性的、大范围的、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述细节的关键词,大致顺序如:。 不过在模型中,每个词语本身自带的权重可能有所不同,如果模型训练集中较多地出现某种关键词,我们在提示词中只输入一个词就能极大地影响画面,反之如果模型训练集中较少地出现某种关键词,我们在提示词中可能输入很多个相关词汇都对画面的影响效果有限。提示词的顺序很重要,越靠后的权重越低。 关键词最好具有特异性,措辞越不抽象越好,尽可能避免留下解释空间的措辞。 可以使用括号人工修改提示词的权重,方法如:字符。 官方提供的提示词案例: Prompt:Miniature adorable monsters made out of wool and felt,dancing with each other,3d render,octane,soft lighting,dreamy bokeh,cinematic.(用羊毛和毛毡制成的微型可爱怪物,互相跳舞,3D 渲染,辛烷值,柔和的灯光,梦幻般的散景,电影) Prompt:Footage of a camera on a drone flying over a desert with wind blowing over the dunes creating waves in the sand below.(无人机上的摄像机飞越沙漠的镜头,风吹过沙丘,在下面的沙子上产生波浪) Prompt:Detailed extremely macro closeup view of a white dandelion viewed through a large red magnifying glass(通过一个大的红色放大镜看到的白色蒲公英的极其详细的微距特写视图)
2025-03-20
什么是 GRPO
GRPO(Group Relative Policy Optimization)是一种基于强化学习的算法,通常用于多智能体环境中的优化任务。以下是关于 GRPO 的详细介绍: 基础概念: 是用于多智能体环境优化的算法,多个智能体协同工作以优化目标函数。 强调通过分组策略方式优化不同组内智能体策略,提升整体表现。 例如,组间对比时,若组 A 平均奖励高于组 B,GRPO 会激励组 A 策略,同时推动组 B 向组 A 学习;还能均衡优化,避免单个智能体过优化,提升群体协作或跨任务泛化能力。参考论文:https://arxiv.org/pdf/2402.03300 ;DeepSeekMath:Pushing the Limits of Mathematical Reasoning in Open Language Models 计算步骤: Actor(LLM):左上角蓝色框表示大型语言模型(LLM),根据输入生成策略,输入标记为 q,表示当前状态或上下文。 Policy:Actor 生成策略分布πθ,表示在给定状态 q 和历史动作 a<t 下选择下一个动作 at 的概率分布。 分组和动作选择:策略被分成多个组,每个组对应一组动作选择,通过策略分布采样得到一系列动作。 奖励评估:每个动作对应一个奖励,表示动作效果或质量。 相对优势计算:计算每个动作的相对优势,公式为:\表示所有动作奖励的标准差。 相比其他算法的优劣势: 优势: 相对优势计算具有自适应性强、能实现局部优化与全局平衡的特点。 KL 散度约束可实现平稳过渡、防止过拟合。 能利用群体智慧,充分利用群体多样化信息找到更优解决方案。 劣势: 计算复杂度高,增加计算开销。 收敛速度较慢。 性能依赖初始策略,初始化敏感。 计算实例: 第五步:应用 KL 散度约束更新策略,调整策略的概率分布。 已知 ABC 策略初始概率分布为,根据相对优势调整后的权重通过指数函数转换并归一化。 例如,计算未归一化的权重:A 约为 2.178,B 为 1,C 约为 0.368。 归一化后新权重:A 约为 0.665,B 约为 0.245,C 约为 0.090。 结论:策略 A 总体优势最高,权重增加;策略 B 表现中等,权重基本不变;策略 C 表现较差,权重减少。在不同场景(不同组)的计算中,每个策略的权重会相应调整以获得更高分数。在文本生成阶段,可用来评估和调整不同生成策略(如贪婪搜索、随机采样、束搜索)的有效性,提高生成文本(尤其是复杂文本)的连贯性和多样性。DeepSeek 在 2024 年 4 月推出的 DeepSeekMath 模型中首次采用了 GPRO 算法。该模型专门针对数学推理与计算问题设计,通过结合 7B 参数和 GPRO 算法,其数学能力宣称超越需要千亿参数的 GPT4。之后的 V3 和 R1 也应用了 GPRO 提升模型的推理能力。
2025-03-20
AI公文写作
以下是关于 AI 公文写作的相关信息: AI 公文智能体: “学习强国公文助手”在文小言 APP 正式上线,具有文汇检索、AI 公文书写、AI 公文润色等功能。其具有权威的“学习强国”数据库背书,内容覆盖文汇、重要活动、重要会议、指示批示等。使用方式为下载文小言 APP 找寻学习强国公文助手。 AI 在工作流中的应用: 1. 拆解工作流程:做每件事之前思考 AI 能提供的帮助,如用 AI 拆解公众号写作的工作流,可通过提示词让 Claude 给出大致框架并进一步细化。建议将拆解出的工作流程用图表展示,如用 Xmind 画时间轴图。但对于画流程图,虽 AI 能帮忙但为了锻炼自己和效果考虑,不建议让 AI 画。 2. 给工作流武装上武器:先梳理传统工作流,再考虑 AI 赋能。以公众号写作为例,明确传统流程的各个环节,如选题、搜资料、列提纲、起标题、配图片、排版发布等,然后在相应环节引入 AI 工具辅助,如资料搜集可用 AI 搜索工具,写作环节可用 Claude 辅助,做图可用 AI 画图工具等。但要先理清传统工作流,否则盲目引入 AI 工具可能适得其反。AI 是为了更高效地达成业务目标服务,一切以业务逻辑为先。
2025-03-20
Stable Diffusion、MidJourney、DALL·E 这些生成式AI工具有什么区别
Stable Diffusion、Midjourney 和 DALL·E 这三个生成式 AI 工具主要有以下区别: 1. 开源性:Stable Diffusion 是开源的,用户可以在任何高端计算机上运行。 2. 学习曲线:Midjourney 的学习曲线较低,只需键入特定的提示就能得到较好的结果。 3. 图像质量:Midjourney 被认为是 2023 年中期图像质量最好的系统。 4. 应用场景:Stable Diffusion 特别适合将 AI 与来自其他源的图像结合;Adobe Firefly 内置在各种 Adobe 产品中,但在质量方面落后于 DALL·E 和 Midjourney。 5. 训练数据:这些工具都是使用大量的内容数据集进行训练的,例如 Stable Diffusion 是在从网络上抓取的超过 50 亿的图像/标题对上进行训练的。 6. 所属公司:DALL·E 来自 OpenAI。 在使用方面: 1. Stable Diffusion 开始使用需要付出努力,因为要学会正确制作提示,但一旦掌握,能产生很好的结果。 2. DALL·E 已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠,但图像质量比 Midjourney 差。 3. Midjourney 需要 Discord,使用时需键入特定格式的提示。
2025-03-20
做一个AI自媒体如何从零起步?选择什么方式?
要从零起步做一个 AI 自媒体,您可以参考以下方式: 1. 明确自身定位和目标受众:确定您的自媒体专注于 AI 的哪个领域,例如 AI 技术解读、AI 应用案例分享、AI 行业趋势分析等,并明确您希望吸引的受众群体。 2. 选择合适的平台:小红书和 B 站是不错的选择。小红书从种草平台逐渐变为知识社区,其知识属性适合 AI 创作者;B 站的用户活跃度也较高。 3. 内容创作: 初期可以从热门的 AI 话题入手,如过年时的剪纸、AI 相关视频等,以吸引流量和涨粉。 注重内容的独特性和价值,避免使用妖魔鬼怪类内容,以免后期难以扭转账号标签。 对于小红书,能发视频就发视频,因为其视频 UI 界面改版且推送机制变化,后续可能重点发力视频。 4. 账号搭建: 设计有记忆点和视觉冲击力的头像。 选择独特的账号名称,能体现个人或内容特点。 撰写有哲理或引人思考的简介。 保持封面统一,具有账号属性,体现商业化。 5. 运营策略: 账号初期应追热点,对热门内容进行分析和跟风创作。 最终要赢得用户信任,增强其对推荐内容的关注度。 6. 变现方式: 通过官方蒲公英平台接单,但平台会收取 10%手续费。 接受主流媒体约稿,虽然稿费可能较低但有背书作用。 总之,做 AI 自媒体需要不断学习和探索,持续提供有价值的内容,逐步扩大影响力和商业价值。
2025-03-20
AI克隆人声软件
以下为一些常见的 AI 克隆人声软件及相关操作步骤: Fish Audio: 1. 准备一段需要克隆的音频(可以是类似屈原的古风声音,或自行录制一段)。 2. 打开网站:https://fish.audio/zhCN/train/newmodel/ 。 3. 上传准备好的音频,按照指引完成声音克隆。 4. 进入声音库选择需要使用的声音,将第一步生成的文案输入,使用克隆好的声音生成对应的音频文件。 5. 下载生成的音频文件备用。 此外,还有以下相关信息: Elevenlabs.io 、speechify.com 等也可用于声音克隆。 可以在 Heygen 等网站自助购买服务,低成本制作自己的数字人分身。 在视频合成方面,可使用 Viggle.ai 网站,操作如下: 1. 在网上下载“回答我”的原视频。 2. 打开 Viggle.ai 网站,登录后进入视频合成功能(https://viggle.ai/createmix )。 3. 上传“回答我”原视频和第二步生成的人物形象图,生成新版本的“回答我”视频。 4. 预览效果,满意后下载合成好的新视频。 视频剪辑可使用剪映软件,步骤为: 1. 打开剪映软件(手机或电脑版均可)。 2. 导入合成好的新视频和生成的音频文件。 3. 将音频与视频时间轴对齐,确保声音和画面同步,添加字幕等。 4. 如需叠加特殊背景,可以导入自己的背景图(如楚国风景)。 5. 预览整个视频,检查效果,微调后导出最终视频(建议 MP4 格式)。
2025-03-20
我想学AI编程,用的电脑系统是WIN7,好多编程软件装不了吧,给我个建议
如果您使用的是 WIN7 系统且想学习 AI 编程,由于很多编程软件可能不支持该系统,以下是一些建议: 1. 考虑升级您的操作系统至 Windows7 以上版本,如 Windows10 或 Windows11,以获得更好的兼容性和支持。 2. 对于电脑硬件,系统要求 Windows7 以上,显卡要求为 NVDIA 独立显卡且显存至少 4G 起步,硬盘需留有足够的空间,最低 100G 起步(包括模型)。 3. 下载并更新 Nvidia 显卡驱动,下载地址:https://www.nvidia.cn/ geforce/drivers/ 4. 下载并安装所需环境,包括 Python、Git、VSCode: 安装 Python:https://www.python.org/downloads/release/python3119/ ,安装时选中“将 Python 添加到系统变量”。 安装 VSCode:https://code.visualstudio.com/Download 安装 Git:https://gitscm.com/download/win 安装 CUDA:https://developer.nvidia.com/cuda1220downloadarchive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_network 请注意,Mac 系统、AMD 显卡、低显卡的情况也可以安装使用,但可能功能不全,出错率偏高,严重影响使用体验,个人建议升级设备或者采用云服务器玩耍。
2025-03-20