Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

额,我想问下关于数字人相关的解决方案

Answer

以下是关于数字人的相关解决方案:

  • 摊位信息方面:包括 AI 肖像及写真、AIphone 创意手机壳、AI 照片转动漫、AI 如意写真、AI 数字人短视频和直播、爱原物 AI 设计、AI 摄影写真、量化 AI 助手应用、AI 玄学+珠宝、阿里无影 AI 云电脑和建筑设计、现场算 AI 塔罗牌等。
  • 算法驱动的数字人:开源代码仓库有 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition)、AI Agent(大模型有 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可用 LangChain 模块自定义)、TTS(如微软的 edge-tts、VITS、so-vits-svc)。人物建模模型可通过手动建模或 AIGC 方式生成人物动态效果。但简单构建方式存在如生成指定人物声音、TTS 音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等问题。
  • 剪映数字人“个性化”方案:剪映作为字节跳动旗下产品,在抖音平台广泛应用,海外版 CapCut 成绩优异。其具有声音克隆和公模数字人能力,搭配 facefusion 换脸技术可实现零成本口播数字人。制作流程为打开剪映,添加文本到文字轨道并修改,点击朗读进行声音克隆,选择数字人形象并换上克隆音色,最后一键智能生成字幕并调整文字样式校准。剪映下载地址:https://www.capcut.cn/ ;capcut 下载地址:https://www.capcut.com
Content generated by AI large model, please carefully verify (powered by aily)

References

摊位信息

|你的摊位活动主题和内容|摊位区域|摊位编号|摊位类型||-|-|-|-||AI肖像及写真,包括AI宠物守护肖像、婚纱写真、头像油画肖像|D|46|写真||A Iphone创意手机壳|D|三思边|手机壳||AI照片转动漫,Ai教学设计(杭州云谷)|D|48|教学||AI如意写真,AI创意蛋糕|D|49|写真||AI数字人短视频和直播,现场可以给大家极速克隆。|D|5|产品展示+数字人||爱原物AI设计,轻工消费品创意|D|50|产品演示||AI摄影写真,老照片修复|D|51,52|相片||量化AI助手应用<br>详细函数介绍:提供量化API中各个函数的详细说明和使用示例。<br>策略代码生成:根据您的具体需求,快速生成可用的量化策略代码。<br>错误解决方案:针对Python报错,提供可能的解决方案。<br>优化建议:帮助您优化策略代码逻辑,提升策略性能。|D|54|产品展示||AI玄学+珠宝|A|55|玄学||阿里无影AI云电脑?,AI建筑设计|E|56,57|产品展示||现场算AI塔罗牌,以及售卖AI做的猫猫塔罗牌,可能会有其他的AI文创|D|59|玄学+塔罗牌|

AI 数字人-定义数字世界中的你

上述算法开源的代码有很多,这里列出一些仓库供大家参考:ASR语音识别openai的whisper:https://github.com/openai/whisperwenet:https://github.com/wenet-e2e/wenetspeech_recognition(这是一个语音识别的接口集合,里面有不同实现的语音识别的接口):https://github.com/Uberi/speech_recognitionAI Agent大模型部分就比较多了,包括ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent部分可以使用LangChain的模块去做自定义,里面基本包含了Agent实现的几个组件(https://www.langchain.com/)TTS微软的edge-tts:https://github.com/rany2/edge-tts,只能使用里面预设的人物声音,目前接口免费。VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits系列可以自己训练出想要的人声。so-vits-svc:https://github.com/svc-develop-team/so-vits-svc,专注到唱歌上面,前段时间很火的AI孙燕姿。除了算法,人物建模模型可以通过手动建模(音频驱动)或者AIGC的方式生成人物的动态效果(例如wav2lip模型)实现,这样就完成了一个最简单的数字人。当然这种简单的构建方式还存在很多的问题,例如:如何生成指定人物的声音?TTS生成的音频如何精确驱动数字人口型以及做出相应的动作?数字人如何使用知识库,做出某个领域的专业性回答?

方案:剪映数字人“个性化“—无限免费私模数字人

大家好!我是卡尔,今天分享的是剪映口播数字人的私有化。PS:视频版本已经在路上,大家敬请期待Heygen的访问限制太强,正好剪映已经有了声音克隆和公模数字人两项能力,搭配facefusion的换脸技术,我们能轻松实现零成本的口播数字人[heading1]剪映做数字人的优势[content]剪映作为字节跳动旗下的产品,在抖音平台上,被广泛应用于短视频的创作和编辑中。剪映海外版CapCut登顶过美国App Store,在全球各国App Store和Google Play平台上的安装总量已超过2.5亿次,在美国市场内的安装总量接近950万次。剪映的“魔力”是什么?我们不妨来盘点一下剪映已有的AI功能这六大AI功能基本上解决了我们用数字人做视频的痛点,不需要反复跳出剪映,在编辑器里就能过完成脚本生成→语音克隆→数字人口播的环节。那下面就让我带大家手把手做一个数字人口播视频剪映下载地址:[https://www.capcut.cn/](https://www.capcut.cn/)capcut下载地址:[https://www.capcut.com](https://www.capcut.com)[heading1]制作流程[content]首先我们打开剪映,然后添加一个文本到文字轨道,并修改好需要朗读的文字;然后点击朗读,并进行声音克隆,剪映的声音克隆现在只用念一句话就可以完成克隆;克隆完成后,选择喜欢的数字人形象,并把自己的克隆音色换上去;最后,一键智能生成字幕,再自行调整文字样式并校准叫完成了。[heading1]成果视频

Others are asking
请问下现在最好的ai生成ppt的平台/软件是什么?
目前较好的 AI 生成 PPT 的平台/软件有以下几种: 1. 讯飞智文(https://zhiwen.xfyun.cn/):免费引导较好。 2. Mindshow.fun:支持 Markdown 导入。 3. kimi.ai:选 PPT 助手暂时免费且效果好。 4. Tome.app:AI 配图效果好。 5. Chatppt.com:自动化程度高。 6. 百度文库(https://wenku.baidu.com):付费效果好。 大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲。 2. 手动优化大纲。 3. 导入工具生成 PPT。 4. 优化整体结构。 此外,剪映的图文成片功能(只需提供文案,自动配图配音)也可辅助生成 PPT 相关内容。
2025-03-02
想问下有没有基于我的文本描述需求自动为我组建表格的ai工具
以下是一些基于文本描述需求自动为您组建表格的 AI 工具: 1. Excel Labs:这是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可在 Excel 中直接进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,通过聊天形式,用户告知需求后,Copilot 会自动完成任务,包括 Excel 中的数据分析和格式创建等。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户能通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-06
请问下想学习AI绘画,能推荐几个博主吗?
秋葉aaaki:喂饭区UP主大家都用他的SD一键安装包 麦橘:大模型制作者,玩SD一定会用大他的模型majicMIX 野菩萨:美学知识体系提炼|W AI合伙人 墨幽:大模型制作者,墨幽人造人 Nenly:B站喂饭up主,SD入门到入神 青龙圣者:B站喂饭up主,大模型训练教程 更多博主可以见:必须关注的AI绘画博主
2024-03-20
我想做电商主图,用什么ai
如果您想制作电商主图,可以考虑以下几种 AI 工具和方法: 1. Midjourney:通过输入相关关键词,如“Guerlain Perfume,plant flowers,top light.cean natural backaround with water,saturation color scheme.The productis bright,Motled shading,studo lighfing,contrast high precision,Fine gloss,Centered composition,Photography,HD4Krealism–q 2–v 5–s 750–ar 9:16”,生成图片后再进行后期修改调整和文字排版。 2. Stable Diffusion:对于运营网店的女装店主,可采用局部重绘的方法。先真人穿衣服拍照,获取真实质感的照片,选好真人照片风格的底模,如 majicmixRealistic_v7,再根据不同平台需求换头,如面向海外市场换白女头,然后在图生图下的局部重绘选项卡下涂抹自己替换的部分,并设置相关的 prompts 和 parameters,如“breathtaking cinematic photo,masterpiece,best quality,,blonde hair,silver necklace,carrying a white bag,standing,full body,detailed face,big eyes,detailed hands”。
2025-04-15
我想找一个好用的ai绘画,有什么推荐吗
以下是为您推荐的一些好用的 AI 绘画平台: 1. Midjourney:综合体验较好,尤其是其 v6 版本。 2. 可灵 AI:成熟的综合类工具。 3. 即梦 AI:成熟的综合类工具。 4. Krea:集成平台。 5. MewXAI:操作简单,功能丰富,包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址:https://www.mewxai.cn/
2025-04-15
我想让我的论文降低AIGC使用率,请问我有什么具体可以操作的办法
以下是一些降低论文中 AIGC 使用率的具体操作办法: 1. 使用 AIGC 论文检测工具: Turnitin:广泛使用的学术剽窃检测工具,增加了检测 AI 生成内容的功能。使用方法是上传论文,系统会自动分析文本并提供详细报告,标示出可能由 AI 生成的部分。 Copyscape:主要用于检测网络上的剽窃行为,虽不是专门的 AIGC 检测工具,但能发现可能被 AI 生成的重复内容。输入文本或上传文档,系统会扫描网络查找相似或重复内容。 Grammarly:提供语法检查和剽窃检测功能,其剽窃检测部分可帮助识别可能由 AI 生成的非原创内容。将文本粘贴到编辑器中,选择剽窃检测功能,系统会提供分析报告。 Unicheck:基于云的剽窃检测工具,适用于教育机构和学术研究,能检测 AI 生成内容的迹象。上传文档或输入文本,系统会分析并生成报告,显示潜在的剽窃和 AI 生成内容。 :专门设计用于检测 AI 生成内容的工具,使用先进算法分析文本,识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本,系统会提供详细报告。 :提供免费的 AI 内容检测工具,可识别文本是否由 AI 生成。将文本粘贴到在线工具中,点击检测按钮,系统会提供分析结果。 GPTZero:专门设计用于检测由 GPT3 生成内容的工具,适用于教育和出版行业。上传文档或输入文本,系统会分析并提供报告。 Content at Scale:提供 AI 内容检测功能,帮助用户识别文本是否由 AI 生成。将文本粘贴到在线检测工具中,系统会分析并提供结果。 此外,为了从根本上降低 AIGC 使用率,您还需要注重自身的思考和研究,确保论文内容是基于您的独立见解和深入分析。
2025-04-14
我想图生图,生成高清矢量图
以下是关于图生图生成高清矢量图的相关内容: ControlNet 参数: 预处理器:canny,模型:control_v11p_sd15_canny 预处理器:lineart_standard,模型:control_v11p_sd15_lineart 放大高清大图: 使用 Multi Diffusion + Tiled VAE + ControlNet Tile 模型 将生成的图片发送到图生图,关键词种子会一并发送过去,重绘幅度建议 0.35,太高图片细节会发生变化 Lora 生图: 点击预览模型中间的生图会自动跳转到相应页面 模型上的数字代表模型强度,可在 0.6 1.0 之间调节,默认为 0.8 可自己添加 lora 文件,输入正向提示词,选择生成图片的尺寸(横板、竖版、正方形) 采样器和调度器新手小白可默认,迭代步数在 20 30 之间调整,CFG 在 3.5 7.5 之间调整,随机种子 1 代表随机生成图 生成的图会显示在右侧,若觉得某次生成结果不错,想要微调或高分辨率修复,可复制随机种子粘贴到相应位置 确认合适的种子和参数想要高清放大,可点开高清修复,选择放大倍数,新手小白可默认算法,迭代步数建议在 20 30 之间,重绘幅度正常在 0.3 0.7 之间调整 高清修复: 文生图高清修复原理是命令 AI 按原来内容重新画一幅,新生成绘图和原绘图细节会不同,降低重绘幅度可更接近原图,如重绘幅度 0.7 时帽子和耳机有变化,0.3 时服饰细节接近但手部可能出现问题,可通过反复抽卡、图生图局部重绘或生成多张图片后 ps 合成等解决 由于高清修复渲染耗时长,建议先低分辨率抽卡刷图,喜欢的图再用随机种子固定进行高清修复 SD 放大: 文生图画好图后发送到图生图,点击脚本选择使用 SD 放大 重绘幅度设置 0.3,放大倍率为 2,图块重叠像素设置为 64,原图尺寸加上重叠像素,如 512x768 变为 576x832,重绘幅度要保持较低数值,否则可能出现新人物
2025-04-14
我想让DEEPSEEK帮我写一篇论文,题目已经定好了,怎么给他输入指令
以下是给 DeepSeek 输入指令以帮助您写论文的一些建议: 1. 采用结构化提示词: 优先保留专业领域术语和技术词汇,这些术语通常具有高信息价值。 对不同类型的信息设置权重,按优先级排序:任务定义>关键约束>专业术语>定量信息>方法论>背景。 以完整语义单元为基本保留单位,而非单个词语,确保压缩后的内容仍保持语义完整性。 避免详细指导思考过程,让模型自主生成思维链。 2. 高阶能力调用: 文风转换矩阵:例如“用鲁迅杂文风格写职场 PUA 现象”“将产品说明书改写成《史记》列传格式”“把这篇论文摘要翻译成菜市场大妈能听懂的话”。 领域穿透技术:如行业黑话破解“解释 Web3 领域的'胖协议瘦应用'理论”。 3. 场景化实战策略: 创意内容生成。 技术方案论证。 4. 效能增强技巧: 对话记忆管理:包括上下文锚定(如“记住当前讨论的芯片型号是麒麟 9010”)、信息回溯(如“请复述之前确认的三个设计原则”)、焦点重置(如“回到最初讨论的供应链问题”)。 输出质量控制:针对过度抽象、信息过载、风格偏移等问题,使用相应的修正指令。 5. 特殊场景解决方案: 长文本创作:可采用分段接力法,如“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应”。 敏感内容处理:使用概念脱敏法(如“用经济学原理类比说明网络审查机制”)或场景移植法(如“假设在火星殖民地讨论该议题”)。 在输入指令时,您需要清晰明确地描述论文的题目、研究目的、主要论点、关键论据、期望的结构和风格等重要信息,以便 DeepSeek 能够为您生成符合要求的内容。
2025-04-14
我想要通过建筑草图生成效果图,有什么工具和流程可以使用
以下是使用悠船工具将建筑草图生成效果图的流程和相关介绍: 1. 基础使用: 提示词:在右侧填写提示词,右上可下载对应图片。 参数调整:参数详解参考下方「参数详解」。注意任何点击都会重新生成图片,免费用户可能会提示超出套餐,所以别乱点。最右侧是所有生成图片的略缩图。 2. 图片调整: 变化:分为细微和强烈,细微改变幅度小,强烈改变幅度大。 高清:有“直接”和“创意”两种模式,“直接”表示啥都不变直接出高清,“创意”表示在图片基础上进行微小的优化调整。 风格变化:基于生成的图片作为上传图片(垫图)再创作。 拓展:可上下左右拓展图片。 缩放:指的是镜头,比如 2x 就是镜头拉远 2 倍。 局部重绘:选择区域要大一些,太小的无法进行修改。 3. 图像参考: 在悠船中可以利用垫图和提示词配合生成符合要求的建筑、风景、文物等。只需将图片复制到悠船的提示词框里面,并填写对应的提示词描述。
2025-04-14
我想建立一个知识库,自动生成解决方案
以下是关于建立知识库并自动生成解决方案的相关信息: smartBot 的应用场景: 1. 辅助使用者对某个行业/领域/问题进行深度解读和分析,并建立系统性的认知过程。 2. 根据预设流程,自动化形成对某个专业方向/领域/行业的系统化知识图谱。 基于知识图谱的问答系统: 1. 结合知识图谱中的丰富信息,能够提供精确且富有洞察力的答案,无论问题是关于具体事实还是复杂关系。 2. 以 Bilibili 知识区为核心,将分散的知识点整合成语义网络,涵盖广泛主题领域,揭示不同概念间潜在关系。 3. 对 Bilibili 知识区重点视频字幕进行数据清洗和分词处理,确保数据准确性和一致性。 4. 利用 NLP 技术解析和优化用户查询,自动补充或纠正模糊查询词,提高查询准确性和覆盖面。 5. 采用先进深度学习技术,对用户查询进行深入语义理解和上下文分析,提供更精准搜索结果。 知识库构建与业务完整性: 1. 从文档切片、向量化到数据入库,构建完整的知识库。 2. 结合检索模块和生成模块,提供从检索到生成的完整解决方案。 用 Coze 免费打造微信 AI 机器人的步骤: 1. 设计方面:确定功能范围。 2. 搭建步骤: 开始节点和结束节点由 coze 自动生成。 开始节点配置:输入变量名写“Question”,描述写“用户输入的问题”,变量类型选“String”。 知识库配置:将开始节点和知识库左侧节点连接,引用开始节点的变量“Question”,添加创建好的知识库,并将知识库右侧节点与结束节点左侧连接。 结束节点配置:用于输出 AI 机器人的最终结果,回答格式设置为“您的问题:{{question}} 问题的答案:{{answer}}”,定义“question”引用“开始节点的 Question”,“answer”引用“知识库节点的输出 output”,选择使用设定内容直接回答。 试运行测试:点击右上角“试运行”,输入问题后点击“运行”,查看工作流每一步的详细输入和输出。
2025-03-16
具身智能软硬件解决方案。
具身智能的软硬件解决方案包括以下方面: 算法层: 技术层级: 任务层级:可细分为任务级、技能级、动作级、基元级、伺服级,通常关注前四个级别。 解决方案层级:通常可拆分为大脑+小脑两个层级。大脑负责人机交互与规划决策,小脑负责运动控制及将语义信息理解转化为动作。 大脑侧:负责人机交互,能通过视觉在语义层面理解场景、任务等并进行决策。大模型的发展对大脑有促进作用,大脑的长期发展高度依赖多模态大模型。如 2024 年 3 月,有鹿机器人发布了基于 LPLM10B 的软硬件结合产品 Master 2000。 整机硬件方案:基于下游场景需求设计运动、感知、计算和通信硬件方案。具身智能厂商倾向于软硬件全流程自主控制,自己制作机体,原因包括机体和数据模式未统一,训练数据与机体构造紧密联系,以及考虑二级供应商是否成熟和整机利润。部分强大厂商如 Tesla 具备制作更底层电机、传感器的能力,软硬件一体化制造能带来更高利润。 智能类型:包括认知智能和物理智能。认知智能涉及思考、规划和决策能力,完全由大脑驱动;物理智能指机器人的感知和与环境的运动互动能力,感知环节由大脑侧算法实现,行动环节由小脑侧算法和硬件配合完成。 发展趋势: 人形化:外形向人类细部特征靠拢,功能具备真实人类运动、灵活和环境判断能力。 成本下降显著:核心零部件成本降低,人形机器人成本及售价呈下降趋势。 构成元素:包括大脑(意图理解、环境感知、规划决策)、小脑(运动控制、语义信息理解转化为动作)、整机硬件方案。
2025-03-07
使用豆包即梦和通义app绘制海报封面都是出现文字不对的情况,有哪些改进的或者是更好的解决方案
以下是针对使用豆包即梦和通义 app 绘制海报封面出现文字不对情况的改进和解决方案: 使用豆包即梦: 1. 为其他城市定制艺术字海报:可以使用豆包来生成个性化设计。豆包会根据城市特色和地标调整提示词,创造符合城市风格的艺术作品。 打开豆包网站 https://www.doubao.com/chat 。 输入对应内容获得城市的 AI 绘画提示词。 2. 优化海报细节: 利用即梦中的消除笔工具修正细节错误。例如,若生成图片中有元素不协调或小细节(如文字笔画、图案)错误,可用消除笔去除不需要的部分。 多抽卡获取更理想设计。AI 绘画核心在于多抽卡,若首次生成效果不佳,可多次尝试或调整提示词细节抽卡,直至找到满意设计。 希望这些方案能帮助您解决问题,创作出满意的海报封面。
2025-03-07
我想要获得短视频脚本创作到视频剪辑的解决方案
以下是从短视频脚本创作到视频剪辑的全面解决方案: 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户提供文本描述,Pictory 将帮助生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:AI 视频创作工具,能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 案例参考: 桂大羊提供了保姆级教程,基于大语言模型和绘图模型,探索了文生图到图生视频的创作实践。例如,在一带一路背景下丝绸之路这个角度的创作中,选择了大语言模型 chatgpt、kimi 进行剧本分镜设定,文生图 midjourney 生成视觉画面,图生视频选择即梦 dreamina 制作动态画面,suno 音乐编曲,ondoku 主角台词配音,视频剪辑使用剪映,部分音效在网上无版权下载或使用剪映自带音效。同时确立了时长(1 分钟左右的 AI 生成画面,加上闭幕不超过 2 分钟)和风格(大致定义为中国风)。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-04
deepseek经常服务器繁忙的解决方案?
以下是一些解决 DeepSeek 服务器繁忙的方案: 1. 尝试以下搜索网站: 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/ 硅基流动:https://siliconflow.cn/zhcn/ 字节跳动火山擎:https://console.partner.volcengine.com/auth/login?redirectURI=%2Fpartner%2F 百度云千帆:https://login.bce.baidu.com/ 英伟达:https://build.nvidia.com/deepseekai/deepseekr1 Groq:https://groq.com/ Chutes:https://chutes.ai/app 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabscom/6 Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 2. 可以通过以下步骤使用网页聊天解决: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 还可以使用以下网站(部分需要魔法,不做教学支持): 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/(bot.n.cn) 硅基流动:https://cloud.siliconflow.cn/i/RjJgQqae AskManyAI:https://dazi.co/login?i=7db38e6e 字节跳动火山引擎:https://console.volcengine.com/ark/region:ark+cnbeijing/experience 百度云千帆:https://console.bce.baidu.com/qian3an/modelcenter/model/buildIn/list 英伟达 NIM Groq:https://groq.com/ Fireworks:https://fireworks.ai/models/fireworks/deepseekr1 Chutes:https://chutes.ai/app/chute/ Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabs.com/ Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1
2025-02-20
TTS的最佳解决方案
以下是关于 TTS 的一些最佳解决方案: 在线 TTS 工具推荐: Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,能高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,可作为多种平台的应用使用,用于收听网页、文档、PDF 和有声读物。 Azure AI Speech Studio:https://speech.microsoft.com/portal ,提供了支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供了自定义的语音模型。 Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型。 TTS 音库制作和文本前端: 录音文本收集:在一个语种的语音合成建设之初,可同步收集该语种对应的大文本。录音文本的选择一般遵循以下原则: 音素覆盖:构建基础的文本前端,确保录音文本的音素或音素组合尽可能覆盖全。 场景定制:根据通用或特定场景需求,确保相关内容有所覆盖,并与需求方紧密沟通。 文本正确性:确保录音文本拼写无误,内容正确。 照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi: 接口请求域名:https://open.mobvoi.com/api/tts/v1 。 接口请求频率限制:5 次/秒。 可以将任意文本转化为语音,应用场景广泛,提供多种方言、发音人和风格,实时合成支持 SSML。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-07
想要做一节讲如何用智能体做企业数字化转型的课程,如何设计
以下是关于如何设计用智能体做企业数字化转型课程的建议: 一、参考案例 1. 李国宝的相关经验 具有丰富的从业经验,包括通信工程、数据通信网络培训、创业、网络安全解决方案及培训、AI 课程开发与培训等。 开发过面向不同群体的 AI 课程,如《数字化转型实践》面向传统企业数字化、AI 赋能转型。 2. 90 分钟从 0 开始打造你的第一个 Coze 应用课程 从零开始教学做应用界面,先基础教学,再涉及特定应用。 介绍当前承接业务,包括辅导、培训、定制及企业 AI 落地等。 挖掘用户对 AI 应用的功能需求,如对交互界面的需求。 二、课程设计要点 1. 对于企业管理者 AI 辅助决策:在小规模决策中使用 AI 分析工具,以其分析结果作为决策参考。 员工培训计划:制定 AI 工具使用的培训计划,帮助团队成员了解日常工作中如何有效利用 AI。 流程优化:识别公司中可能受益于 AI 自动化的重复性任务,从小流程开始测试 AI 解决方案的效果。 AI 伦理和政策:制定公司的 AI 使用政策,确保 AI 应用符合伦理标准和法律要求。 2. 对于教育工作者 AI 辅助教案设计:尝试使用 AI 帮助设计课程大纲或生成教学材料 ideas,为课程带来新视角。 个性化学习路径:探索使用 AI 分析学生学习数据,为不同学生制定个性化学习计划。 创新教学方法:考虑将 AI 工具整合到课堂活动中,如使用 AI 生成的案例研究或模拟场景。 AI 素养教育:开发简单的课程模块,教导学生了解 AI 基础知识、应用领域及其对社会的影响。 三、注意事项 无论面向哪个群体,都应记住:与 AI 协作是一个学习过程。从小处着手,保持好奇心和开放态度,会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。最重要的是,始终保持批判性思维,将 AI 视为强大的工具,而不是完全依赖的解决方案。
2025-04-18
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
,当前AI数字人发展的新态势,以及新技术和成果
当前 AI 数字人的发展呈现出以下新态势,并取得了一系列新技术和成果: 数字人简介: 数字人是运用数字技术创造的,虽现阶段未达科幻作品中的高度智能,但已在生活多场景中出现且应用爆发。业界对其尚无准确定义,一般可按技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要用于影视和直播带货,其表现质量与建模精细度及动捕设备精密程度相关,不过视觉算法进步使在无昂贵动捕设备时也能通过摄像头捕捉关键点信息实现不错效果。 B 端变现与创业方向: B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。自媒体创业需具备内容创新和差异化,内容成本低且更新迭代快。游戏创业可做轻量化游戏,结合 AI 技术满足放松和社交需求,专注垂类赛道避免与大厂竞争。影视创业在 25 年将是拐点,更多内容会采用 AI 技术。广告营销创业重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: AI 虚拟人从早期以首位为核心的宅文化虚拟偶像,发展到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人。虚拟人产业链包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。未来 3 10 年,AI 虚拟人是 Web 3.0 的风口,提前布局有潜力的赛道可迎接机遇,但创业对创业者综合能力要求极高。 未来展望: 数字人未来有很多应用场景,如家庭中的数字人管家、学校中的数字人老师、商场里的数字人导购等。未来还会有很多技术突破,如将五感数据和躯壳控制参数作为输入,次世代算法可自我迭代升级和自行演化躯壳控制方式。通过 Dify 搭建数字人的开源项目可展现低门槛高度定制数字人的基本思路,数字人的核心在于 Agent 即灵魂,如何在 Dify 上编排专属数字人灵魂值得体验。期望随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,AI 既能提供高质量信息,也能关注用户情绪。
2025-04-14
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-04-12
有没有免费制作数字人的网站?
以下是一些免费制作数字人的网站及使用方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。上传后效果如图所示,My Avatar处显示上传的照片。点开大图后,点击Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的Create vedio。选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击Generate vedio就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法:点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。软件会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成,可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,通过拖拽轨道右侧竖线使其与视频对齐。
2025-04-11
数字人讲解产品
以下是关于数字人讲解产品的相关内容: 电商方面: 1. 添加产品/介绍背景:若有自己的视频/图片素材可用,若无,可根据搜索添加。 2. 扣像结合背景:在剪映中把数字人扣下,导入视频,点击画面选择抠像,点击智能抠像,调整大小和位置。 3. 添加字幕和音乐:智能识别字幕,可搜索或手动添加喜欢的音乐。最终形成所需视频,可用于带货或讲解产品,也能应用于直播(直播可能收费,短视频可通过购买邮箱注册使用免费时长或直接购买会员版)。 XiaoHu.AI 日报 1 月 14 日相关: 1. 无需真人模特,上传产品图片,数字人即可手持产品进行口播展示。 2. 支持语音和口型同步,动作、姿势可定制,提供 1000+多国家数字人模特。 3. 覆盖全球 28+种语言,能快速生成产品宣传视频,省去拍摄烦恼。测试视频效果接近成熟,嘴型部分仍需微调。在线体验:
2025-04-11