Navigate to WaytoAGI Wiki →
Home/All Questions
什么是MaaS?
MaaS(Model as a Service,模型即服务)是一种成本效益高、部署快速的解决方案。 从大模型落地具体方式来看,根据 IDC 发布的《中国模型即服务及 AI 大模型解决方案市场追踪,2024H1》报告,2024 上半年中国 MaaS 市场规模达 2.5 亿元。百度智能云的 MaaS 业务主要依托百度智能云千帆大模型平台来提供服务。 在大模型的商业化中,MaaS 被认为是潜在的解决方案之一。例如,全球大模型竞争激烈,面临 API 同质化和订阅模式实现难的问题时,MaaS 可提供新的思路。 此外,RAGflow 支持配置上 LLM、embedding、STT、img2text 和内容审核 Moderation 模型,公网 MaaS 通常只需要一个 API key 即可对接,默认提供了通义千问。
2025-03-29
Coze上有哪些高赞的智能体?
以下是 Coze 上的一些高赞智能体及相关内容: 此外,以下是一些常见的 Agent 构建平台: 1. Coze:是新一代的一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成了丰富插件工具,能拓展 Bot 能力边界。 2. Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景方面表现出色。 Coze 是字节跳动推出的强大的 AI 聊天机器人构建平台,具有多种功能,如智能体、插件、知识库、工作流、图像流和记忆模块。智能体是其核心功能之一,基于大型语言模型构建,具有多种智能行为特征,能完成多种复杂任务,分为单智能体和多智能体模式。单智能体解决复杂问题需长记忆能力,多智能体扩展能力好,能共同解决复杂问题。
2025-03-29
如何综合运用插件、工作流、知识库,搭建满足各种需求的智能体,尤其是调用多个智能体,组成像Manus这样的工具?
要综合运用插件、工作流、知识库搭建满足各种需求的智能体,尤其是调用多个智能体组成类似 Manus 的工具,需要了解以下内容: 插件:插件如同一个工具箱,里面可放置一个或多个工具,称为 API。扣子平台有多种类型的插件,如看新闻、规划旅行、提高办公效率、理解图片内容的 API 及能处理多种任务的模型。若平台现有插件不符合需求,还可自行制作添加所需 API。 工作流:工作流类似可视化拼图游戏,可将插件、大语言模型、代码块等功能组合,创建复杂稳定的业务流程。工作流由多个节点组成,开始和结束节点有特殊作用,不同节点可能需要不同信息,包括引用前面节点信息或自行设定信息。 知识库:可上传私有文件作为回答参考。 智能体:智能体是对自定义操作的封装,用于解决特定场景问题。以 ChatGPT 的 GPTs 为例,包括描述作用和回复格式的提示词、作为回答参考的知识库、请求第三方 API 获取实时数据的外挂 API 以及个性化配置等。 例如,在“竖起耳朵听”的智能体中添加了插件和工作流的相关设置。创建智能体时,输入人设等信息,并配置工作流。但需注意,如工作流中使用的插件 api_token 为个人 token 时,不能直接发布,可将其作为工作流开始的输入,由用户购买后输入使用再发布。 此外,在 AI 搜索中,可预置 after_answer 钩子,将请求大模型的上下文和回答发给第三方插件整理成文章或思维导图等格式同步到第三方笔记软件。全流程中有很多节点可做 Hook 埋点,多个插件构成可插拔架构,常用功能可抽离成标准插件用于主流程或辅助流程,还可自定义智能体 Agent 等。
2025-03-29
提示词生成
以下是关于提示词生成的相关内容: ComfyUI 图片提示词反推提示词生成: 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可以和 flux 模型配合生成图片。建议使用量化版本的模型(int4 结尾)以节省显存。 安装方法: 1. 进入 ComfyUI 自定义节点目录。 2. 克隆相关仓库。 3. 重启 ComfyUI。 4. 网盘下载模型(https://pan.quark.cn/s/00b3b6fcd6ca),放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。 艺术字生成: 选择图片 2.1 模型,输入提示词(可以直接参考案例提示词)。案例参考: 金色立体书法,“立冬”,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风。 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意”。 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画。 巨大的奶白色字体“柔软”,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天。原文链接:https://mp.weixin.qq.com/s/jTMFYKxsN8dYNZu3VHKBnA 五津:DeepSeek+扣子:1 分钟生成小红书爆款单词视频: 生成单词: 1. 输入单词主题、图片风格、单词数量。如非洲动物、真实风格、2。 2. 选择 deepseekr1 模型,输入单词主题、单词数量,deepseek 为用户输出指定数量的单词,并以数组方式输出。 角色:是一个专业的单词生成助手,擅长围绕各种主题挖掘相关英语单词,为用户提供精准且实用的单词、中文、美式音标内容。 技能: 1. 输出关联英语单词:当用户输入主题时,分析主题内涵,运用专业知识,输出指定数量个与该主题紧密关联的英语单词、中文翻译、美式音标,将该单词用于一句英文中(不超过 15 个单词),并将这句英文句子翻译成中文句子,并以数组形式呈现。 限制:仅围绕用户输入主题输出相关英语单词、中文翻译、美式音标,不涉及其他领域内容。输出必须为符合要求的数组形式,英文单词对应变量 yingwen,中文翻译对应变量 zhongwen,美式音标对应变量 yinbiao,英文句子对应变量 juzi_yingwen,中文句子翻译对应变量 juzi_zhongwen,不得有其他格式偏差。
2025-03-29
自动剪辑视频,添加字幕的软件推荐
以下为您推荐一些自动剪辑视频并添加字幕的软件及相关操作: 1. 剪映: 操作步骤: 选择适合文旅片的音色,如朗诵男生或清爽男生,点击开始朗读生成音频。 鼠标右键点击当前音轨,找到识别字幕/歌词,等待生成文本字幕。 若识别字幕需要 VIP,可点击本地字幕,导入准备好的字幕文件。 2. 声音克隆工具 Fish Audio: 操作步骤: 准备一段需要克隆的音频,如屈原的古风声音或自行录制。 打开网站 https://fish.audio/zhCN/train/newmodel/ ,上传音频并按指引完成声音克隆。 进入声音库选择使用的声音,输入文案生成音频文件并下载备用。 3. 视频合成工具 Viggle.ai: 操作步骤: 在网上下载“回答我”的原视频。 打开 https://viggle.ai/createmix ,登录后上传原视频和生成的人物形象图生成新版本视频,预览效果并下载。 4. 视频剪辑工具剪映: 操作步骤: 打开剪映软件(手机或电脑版均可)。 导入合成好的新视频和生成的音频文件。 将音频与视频时间轴对齐,确保声音和画面同步,添加字幕等。 如需叠加特殊背景,可导入自己的背景图,如楚国风景。 预览整个视频,检查效果,微调后导出最终视频(建议 MP4 格式)。
2025-03-29
提示词生成
以下是关于提示词生成的相关内容: ComfyUI 图片提示词反推提示词生成: 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可以和 flux 模型配合生成图片。建议使用量化版本的模型(int4 结尾)以节省显存。 安装方法: 1. 进入 ComfyUI 自定义节点目录。 2. 克隆相关仓库。 3. 重启 ComfyUI。 模型网盘:https://pan.quark.cn/s/00b3b6fcd6ca ,下载后放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。 艺术字生成: 模型选择图片 2.1,输入提示词(可以直接参考案例提示词)。 案例参考: 金色立体书法,“立冬”,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风。 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意”。 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画。 巨大的奶白色字体“柔软”,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天。 原文链接:https://mp.weixin.qq.com/s/jTMFYKxsN8dYNZu3VHKBnA 五津:DeepSeek+扣子:1 分钟生成小红书爆款单词视频: 生成单词: 1. 开始:输入单词主题、图片风格、单词数量。如非洲动物、真实风格、2。 2. 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,这样 deepseek 就可以为用户输出指定数量的几个单词,并以数组方式输出。 角色:是一个专业的单词生成助手,擅长围绕各种主题挖掘相关英语单词,为用户提供精准且实用的单词、中文、美式音标内容。 技能: 1. 输出关联英语单词:当用户输入主题时,分析主题内涵,运用专业知识,输出指定数量个与该主题紧密关联的英语单词、中文翻译、美式音标,将该单词用于一句英文中(不超过 15 个单词),并将这句英文句子翻译成中文句子,并以数组形式呈现。 限制:仅围绕用户输入主题输出相关英语单词、中文翻译、美式音标,不涉及其他领域内容。输出必须为符合要求的数组形式,英文单词对应变量 yingwen,中文翻译对应变量 zhongwen,美式音标对应变量 yinbiao,英文句子对应变量 juzi_yingwen,中文句子翻译对应变量 juzi_zhongwen,不得有其他格式偏差。
2025-03-29
免费的视频换脸AI软件和网站都有哪些?
以下是一些免费的视频换脸 AI 软件和网站: 1. facefusion: 开源地址:https://github.com/facefusion/facefusion 本机解决方案:需要 Python 环境及安装多个依赖软件,对编程知识有一定要求,且运行推理计算速度依赖 GPU,本地计算机若无 GPU 或显存较小,执行速度缓慢,不推荐本地化安装。 云服务解决方案:可利用云厂商如阿里云的 PAI 和 AutoDL 提供的大模型运行环境和计算能力,如选择 AutoDL,其官网是:https://www.autodl.com/home ,注册后在算力市场选择合适的算力服务器。 2. Swapface(有免费额度): 网站:https://swapface.org//home 特点:图片换脸、视频换脸、直播实时换脸,需下载电脑客户端使用,无在线版,可通过邀请好友、点评软件获取积分,能识别图片、视频里的多张脸进行替换。 3. viggle(有免费额度): 网站:http://viggle.ai discord 免费体验:https://discord.com/invite/viggle 功能丰富,包括多种基于图片、文字、动作描述等的转换和创作方式,官方提供多种动作提示词可供参考,提示词地址:https://viggle.ai/prompt
2025-03-29
学习SRCNN的路径可以是什么
很抱歉,目前知识库中没有关于学习 SRCNN 路径的相关内容。但一般来说,学习 SRCNN 可以从以下几个方面入手:首先,深入了解卷积神经网络(CNN)的基础知识,包括卷积层、池化层、激活函数等。其次,查阅相关的学术文献和研究报告,以获取关于 SRCNN 的详细原理和实现方法。还可以在网上搜索相关的教程和课程资源,例如在线课程平台、技术博客等。同时,尝试使用相关的深度学习框架,如 TensorFlow、PyTorch 等,进行实践和代码实现。最后,参与相关的技术社区和论坛,与其他研究者和开发者交流经验和心得,以加深对 SRCNN 的理解和应用。
2025-03-29
学习SRCNN可以通过怎样的路径
很抱歉,目前知识库中没有关于学习 SRCNN 路径的相关内容。但一般来说,学习 SRCNN 可以从以下几个方面入手:首先,深入了解卷积神经网络(CNN)的基础知识,包括卷积层、池化层等概念。其次,查阅相关的学术文献和研究报告,以获取关于 SRCNN 模型的详细架构和原理。还可以参考在线的课程和教程,一些知名的在线教育平台可能会有相关的内容。同时,实践是关键,可以通过使用相关的数据集进行模型的训练和优化,来加深对 SRCNN 的理解和掌握。
2025-03-29
视频生成
视频生成是 AIGC 的一个重要领域。以生成方式划分,当前视频生成可分为文生视频、图生视频与视频生视频,主流生成模型为扩散模型。视频生成涉及深度学习技术如 GANs 和 Video Diffusion,可用于娱乐、体育分析和自动驾驶等领域,且常与语音生成一起使用。 一些具有代表性的海外项目包括: Sora(OpenAI):以扩散 Transformer 模型为核心,能生成长达一分钟的高保真视频,支持多种生成方式,在文本理解方面表现出色,能创建多个镜头并保留角色和视觉风格。 Genie(Google):采用 STtransformer 架构,包括潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数,可通过单张图像提示生成交互式环境。 WaveNet(DeepMind):一种生成模型,可生成逼真的人类语音。 MuseNet(OpenAI):一种生成音乐的 AI 模型,能在多种风格和乐器间组合。 Multilingual v2(ElevenLabs):一种语音生成模型,支持 28 种语言的语音合成服务。 在 Adobe Firefly 中生成带有文本提示和图像的视频(测试版),可将书面描述转换为视频剪辑。使用文本提示定义内容、情感和设置(包括摄像机角度)以指导摄像机移动并创建传达所需情绪和信息的视频,还能合并图像为视频生成提供视觉提示。具体操作如下: 1. 在 Adobe Firefly 网站(https://firefly.adobe.com/)上,选择“生成视频”。 2. 在 Generate video 页面,在 Prompt 字段输入文本提示,也可在 Image 部分的 Upload 选项使用图像作为第一帧并提供方向参考。 3. 在 General settings 部分确定 Aspect ratio 和 Frames per second。在 Advanced 部分,可使用 Seed 选项添加种子编号控制 AI 创建内容的随机性,若使用相同种子、提示和控制设置,可重新生成类似的视频剪辑。添加图像能提供清晰视觉引导,使生成的视频更符合愿景。
2025-03-29