Navigate to WaytoAGI Wiki →
Home/All Questions
deepseek使用教程
以下是字节火山 DeepSeek 系列 API 的完整教程及使用方法: 1. 申请免费额度和获取邀请码: 可以使用邀请码 D3H5G9QA 。 邀请链接:https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA ,邀请可拿 3000 万 tokens,畅享 671B DeepSeek R1。 即日起至北京时间 20250218 23:59:59,所有用户均可在方舟享受 DeepSeek 模型服务的价格优惠。DeepSeekR1、V3 模型,分别提供了 50 万免费额度和 API 半价活动(算下来 5 元有 100 万)。 2. 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ 。 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。 若有提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议,一路点击开通。 确认以下无误后,点击“确认接入”按钮。 自动返回创建页面,复制接入点的 ID 并保存。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有 API key 则点击【创建 API key】,复制并保存好。 3. API 使用方式: 飞书多维表格调用。 Coze 智能体调用。 浏览器插件调用。 4. 使用提示词: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 希望以上内容对您有所帮助。
2025-03-06
哪些软件可以将2D形象转换为3D
以下是一些可以将 2D 形象转换为 3D 的软件: 1. Kaedim:专注于从图像到 3D 的转换。 2. Mirage:专注于从文本到 3D 的转换。 3. Hypothetic:对从文本到 3D 的搜索以及从图像到 3D 的转换都感兴趣。 4. Nvidia 的 Get3D:专注于从图像到 3D 的转换。 5. Autodesk 的 ClipForge:专注于从文本到 3D 的转换。 6. Tripo AI:能够利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 7. Meshy:不仅支持文本生成 3D,还支持图片生成 3D 以及 AI 材质生成。 8. CSM AI:支持从视频和图像创建 3D 模型。 9. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成。 10. VoxCraft:能够将图像或文本快速转换成 3D 模型,并提供了图像到 3D、文本到 3D 和文本到纹理等多种功能。
2025-03-06
怎么创建属于自己的数字人
以下是创建属于自己的数字人的方法: 1. 利用剪映生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,剪映会生成对应音视频并添加到轨道中。 左下角会提示渲染完成时间,可点击预览按钮查看效果。 2. 增加背景图片: 删除先前导入的文本内容。 点击左上角“媒体”菜单,“导入”按钮选择本地图片上传。 点击图片右下角加号将图片添加到视频轨道(会覆盖数字人)。 点击轨道最右侧竖线向右拖拽,直到与视频对齐。 在显示区域拖动背景图的角将图片放大到适合尺寸,并将数字人拖动到合适位置。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 数字人“私有化”(换脸): 准备谷歌账号(可在淘宝或“”购买)。 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”。 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程: 课程内容: 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2025-03-06
有无财务人员可使用的大模型?
以下是一些财务人员可使用的大模型相关信息: 1. Coze 记账管家:通过大语言模型把用户输入的非结构化记账数据转变成结构化数据存入数据库。工作流程包括定义提示词,让大模型拆解识别记账事项、发生时间、变动金额等,并将其存入数据库。 2. 金融服务业中的应用: 客户服务代表:新的客户服务代表可使用经过过去 10 年银行部门客户服务通话训练的大语言模型,快速生成问题答案,减少培训时间。 贷款员:生成式 AI 模型可在相关系统数据上训练,贷款员提供客户名称即可生成贷款文件。 质量保证:生成式 AI 可加速银行和金融科技公司确保符合监管要求的过程。 3. 金融行业·大模型挑战赛:举办“2024 金融行业·大模型挑战赛”,整合公开金融数据打造多轮问答评测赛题,提供基础数据表,参赛选手需采用 GLM4 系列模型 API,可运用多种技术手段完成赛题,设有中文和英文测试集。主办单位为清华大学基础模型研究中心,有多个单位支持。
2025-03-06
如何开始学习AI
以下是关于如何开始学习 AI 的建议: 一、了解 AI 基本概念 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 1. 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。建议掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 1. 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 2. 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 对于中学生学习 AI 的建议: 1. 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识,包括基本概念、发展历程、主要技术(机器学习、深度学习等)以及在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目,参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 5. 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响。 此外,还有二师兄的 AI 学习经历供您参考: 二师兄在 2024 年 2 月过年后,在七彩虹的售后群中,因老哥分享用 AI 绘画的心得,要了 SD 秋叶安装包,下载了教学视频,迈出 AI 学习的第一步。3 月啃完 SD 的所有教程并开始炼丹。4 月与小伙伴探讨 AI 变现的途径,尝试用 GPT 和 SD 制作图文故事绘本、小说推文的项目。5 月因工作变动开启了无硬件支持的 AI 学习之路,加入 Prompt battle 社群,开始 Midjourney 的学习。
2025-03-06
最好的语音合成模型是什么?用于我录入语音,合成我自己的声音。
目前在语音合成领域,有多种优秀的模型。例如: ChatTTS:这是一个用于对话的生成式语音合成模型,生成的语音可以达到“以假乱真”的程度。但为防止被用于违法行为,作者在训练中添加了少量高频噪音并压缩了音质。 MiniMax AI 的 T2A01HD 语音合成模型:仅需 10 秒录音,就能实现高精度的声音克隆。生成的语音在音色、语调和情感表达上达到录音室级别,支持 17 种语言,提供 300 多种预置音色库,并支持多种音效调整。 语音合成包括将文本转换为可听声音信息的过程,一般由文本前端和声学后端两个部分组成。当代工业界主流语音合成系统的声学后端主要技术路线包括单元挑选波形拼接、统计参数和端到端语音合成方法,当代主要采用端到端声学后端。端到端声学后端一般包括声学模型和声码器两部分,同时也出现了直接从音素映射为波形的完全端到端语音合成系统。 您可以根据自己的需求选择适合的语音合成模型。例如,如果您希望快速实现高精度的声音克隆,可以考虑 MiniMax AI 的 T2A01HD 模型;如果您对对话场景的语音合成有需求,ChatTTS 可能是一个不错的选择。
2025-03-06
基于--cref的多个人物角色出现在一个画布中,具体该如何操作?我想要详细的步骤
基于 cref 在一个画布中放置多个人物角色的操作步骤如下: 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个箭头都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。 需要注意的是: cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加。 设置画布以描绘两个人的开场提示。 您的 cref 图像中应只包含一个角色。如果 cref 图像中有多个人物形象,Midjourney 将它们混合在一起,并混合到输出中。 语雀里面整理了 211 篇文档,共有 412731 字有关 AIGC 的相关文章,MJ 手册的规范使用说明,文章包含了很多大厂经验总结。无偿且标注了文章来源,地址:https://www.yuque.com/frannnk7/aidesign?《AIGC Design 手册》
2025-03-06
帮我总结一下最近一周值得关注的AI新闻
以下是最近一周值得关注的 AI 新闻: 2024 年 6 月,苹果发布了 AI 原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。 Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 现已上线,它知道如何在 Shopify 中执行任何操作,包括提取相关数据、操作新功能或创建报告。 Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。 2024 年 1 月,斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。
2025-03-06
Midjourney多人物在不同场景下的一致性
以下是关于 Midjourney 多人物在不同场景下一致性的相关内容: 参数局限性: 最好使用 Midjourney 生成的图像,因为其对自身输出的解读已优化,使用真实世界图像可能导致扭曲或不一致。 无法精确复制每一个小细节,AI 更倾向于关注更广泛的视觉特征。 不太适用于多人组合,通常会让组内所有人看起来相同。 实际应用案例: 分镜和漫画:在不同面板和场景中保持同一角色的一致性,不丧失角色核心身份。 角色设计:为角色创建不同版本,如不同服装、姿势或环境中的版本。 奇幻和叙事艺术:以视觉一致的方式描绘角色在旅程中的变化。 最佳结果的技巧: 使用清晰、放大的图片,其中角色面部特征清晰可见,最好正对镜头,有助于 AI 更好地解读关键面部特征。 从 cw 100 开始,若希望引入变化,可逐渐降低该值。 角色参考: Midjourney 中的 cref 是一个高级命令参数,允许用户在多张图像之间保持角色一致性。无论创作故事板还是创建不同场景中的角色变化,该命令参数能确保角色的核心视觉特征(如面部特征、发型和服装)在每次生成时得以保留。 频道说明: 您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。但可能会出现不连贯的结果,此时可尝试使用更高值的样式化(s),如 s 800。 多个角色的放置: cref 命令适用于单一主题、单一角色的图像。若计划在场景中添加多个角色,需要使用平移按钮来添加。 基于 cref 的多个角色放置到单个画布上的最佳方法是使用平移功能将新的画布与现有画布拼接在一起,每个新画布的部分都将有自己的 cref。 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头。⬆️⬇️⬅️➡️每个都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。
2025-03-06
上传ppt自动生产思维导图
以下是关于上传 PPT 自动生成思维导图的相关信息: 好用的 AI PPT 工具: Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等,网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 使用 Process ON 生成思维导图的思路和步骤: 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制,相对耗时。 导入方式: 复制最终大纲内容到本地 txt 文件,将后缀改为.md(若看不见后缀,自行搜索开启)。 打开 Xmind 软件,将 md 文件导入 Xmind 文件。 在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击“AI 帮我创作”。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若喜欢用 Process ON 且无会员,可在某宝买一天会员。 此外,Chat GPT 有多种应用,包括内容生成、聊天机器人、问答系统、文本摘要、机器翻译、群聊总结、代码生成、教育、浏览器插件、PDF 对话等,也能用于 PPT 生成。生成脑图的网址:https://xmind.ai/editor/
2025-03-06