Navigate to WaytoAGI Wiki →
Home/All Questions
ChatGPT
ChatGPT 是一种基于 GPT 架构的人工智能模型,由 OpenAI 开发。 它的工作原理是:从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本。具体来说,它能够从“提示”开始,继续生成“类似于训练内容”的文本。 其神经网络由大量简单元素组成,基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”(无循环等)。但这个过程能产生成功“类似于”网络、书籍等内容的文本,不仅语言连贯,且“说的话”遵循提示,利用所“读到”的内容。 ChatGPT 在生成文本方面表现出色,结果接近人类所产生的。但它不像大脑一样工作,其基本人工神经网络结构基于大脑的理想化模型。在训练和硬件方面,ChatGPT 与大脑不同,且内部无“循环”或“重新计算数据”,限制了计算能力。 目前 ChatGPT 官网有 GPT3.5 和 GPT4 两个版本。GPT3.5 免费,拥有账号即可使用,但智能程度不如 GPT4,且无法使用 DALL.E3 等插件。GPT4 的 PLUS 套餐收费 20 美金/月,还有团队版和企业版,功能更多、限制更少,一般推荐 PLUS 套餐。 在注册 ChatGPT 账号前,建议先注册谷歌账号,因国外很多软件支持谷歌账号一键登录,注册谷歌账号支持国内手机号码和国内邮箱验证,过程简单。
2025-03-12
midjourney 一致性
Midjourney 推出了角色一致性功能,以下是相关要点: 1. 该功能在 MJ 一鸽再鸽后终于放出,同步支持 MJ V6 和 Niji V6。 2. 风格一致性、角色一致性、场景一致性是进入生产管线的重要可控性功能,实现难度由低到高。 3. cref 背后参数 cw 的值可从 0 设到 100,cw 100 是默认参数,会参考原图的脸部、头发和衣服,但会非常不吃 Prompt;cw 0 时,就只会参考脸部,约等于一个换脸。 4. 使用方法:在提示词后输入 `cref URL` 并附上一个人物图像的 URL,注意一定要在提示词后面,第一次没注意加在前面会报错。可以使用 `cw` 来修改参考强度,强度 100 是默认值,会使用面部、头发和衣服;强度 0 时,只会关注面部,适合改变服装、发型等。 5. cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加,基于 cref 的多个角色放置到单个画布上的最佳方法是使用平移功能将新的画布与现有画布拼接在一起,每个新画布的部分都将有自己的 cref。使用时需先使用 /settings 将 Remix 打开,然后选择 ,选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来,寻找蓝色小箭头添加新角色。 6. 您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。如果出现不连贯的结果,可尝试使用更高值的样式化(s),例如 s 800。 7. 体验 MJ 网页版的网址:https://alpha.midjourney.com/
2025-03-11
你什么时候接入deepseek
以下是关于 DeepSeek 的相关信息: 学而思表示将接入 DeepSeek“深度思考模式”,预计在 2 月内陆续于相关机型上线,全面升级用户的 AI 学习体验。 钉钉已经全面接入 DeepSeek 系列模型。 扣子现已支持满血版 Deepseek 全家桶,R1 模型现支持所有用户免费体验,每个用户每日限 20 条对话。 微信接入 DeepSeek 确认为满血 R1,腾讯将有更多 APP 持续接入,微信推出 AI 搜索功能,提供“快速回答”和“深度思考”选项,用户可获取高质量答案并一键分享。 百度官宣全面接入 DeepSeek,文心大模型最新上线的深度搜索功能已集成到百度搜索当中。 关于 DeepSeek 的使用分享: DP 模型的功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 使用场景:包括阅读、育儿、写作、随意交流等方面。 此外,还有关于音系学和与大模型互动的分享,以及 DeepSeek 文档分享和未来活动预告等内容。
2025-03-11
AnimateDiff插件下载
AnimateDiff 插件的下载地址如下: 运动模块:https://huggingface.co/guoyww/animatediff/tree/cd71ae134a27ec6008b968d6419952b0c0494cf2 模型下载:https://huggingface.co/Kijai/MagicTimemergedfp16 安装地址:D:\\ComfyUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 模型位置:下载对应的模型并存放在指定位置并重命名,文件夹位置如果没有此文件需要新建并重命名,具体如下: D:\\ComfyUI\\custom_nodes\\ComfyUIAnimateDiffEvolved\\models D:\\ComfyUI\\custom_nodes\\ComfyUIAnimateDiffEvolved\\motion_lora 推荐工作流: file:h264mp4.json file:h265mp4.json file:webm.json file:av1webm.json file:1.5 文生视频工作流.json
2025-03-11
我想要一个以自己为蓝本,包括人物和声音的数字人,用来录制课程
以下是制作以自己为蓝本,包括人物和声音的数字人用来录制课程的方法: 1. 生成数字人: 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,然后点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到视频轨道中,左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 2. 增加背景图片: 可删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并点击“导入”按钮选择本地图片上传,如一张书架图片,点击图片右下角加号将其添加到视频轨道上(会覆盖数字人)。为让图片在整个视频播放时都显示,点击轨道最右侧竖线向右拖拽至与视频对齐。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 换脸: 若希望数字人换成自己的面孔,需要用另一个工具进行换脸。 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费,点击红框对应的 URL 打开操作界面。 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程: 课程内容: 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2025-03-11
有哪些好用的数字人工具,效果好,清晰,不违和,免费
以下是一些好用的数字人工具,效果好、清晰、不违和且免费: 1. 开源且适合小白用户的工具: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub: 官网: 2. Google Veo 2: 效果:生成的视频接近真实,几乎难以分辨。 应用:适合创作和内容制作。 3. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 2. 上传后效果如图所示,My Avatar 处显示上传的照片。 3. 点开大图后,点击 Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击 Submit,就可以得到一段数字人视频。 4. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的 Create vedio。 2. 选择人物形象,你可以点击 ADD 添加你的照片,或者使用 DID 给出的人物形象。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 5. KreadoAI: 优点:免费(对于普通娱乐玩家,这很重要),功能齐全。 缺点:音色很 AI。 使用方法: 1. 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-03-11
有哪些辅助输出3d模型资源的ai工具推荐一下
以下是一些辅助输出 3D 模型资源的 AI 工具推荐: 1. @CSM_ai:可以将文本、图像或草图转换为 3D 素材。体验地址:https://cube.csm.ai 。 2. Move AI 推出的 Move API:能从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。网址:https://move.ai/api 。 3. ComfyUI 3D Pack:可快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。网址:https://github.com/MrForExample/ComfyUI3DPack/tree/main 。 4. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。网址:https://t.co/3tUvxB0L4I 。 5. Media2Face:3D 面部动画创造工具,根据声音生成同步的 3D 面部动画,允许个性化调整,如情感表达,应用于对话场景、情感歌唱等多种场合。网址:https://sites.google.com/view/media2face 、https://arxiv.org/abs/2401.15687 、https://x.com/xiaohuggg/status/1752871200303480928?s=20 。 6. SIGNeRF:在 3D 场景中快速生成和编辑对象,新增或替换场景中的物体,新生成场景与原场景无缝融合。网址:https://signerf.jdihlmann.com 、https://x.com/xiaohuggg/status/1744950363667759474?s=20 。 7. Luma AI 发布的 Genie 1.0 版本:文本到 3D 模型转换工具,生成详细逼真的 3D 模型,支持多种 3D 文件格式,获得 4300 万美元 B 轮融资。网址:https://lumalabs.ai/genie?view=create 、https://x.com/xiaohuggg/status/1744892707926122515?s=20 。 8. BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。网址:https://buaavrcg.github.io/BakedAvatar/ 、https://x.com/xiaohuggg/status/1744591059169272058?s=20 。 此外,在 CAD 领域,也存在一些 AI 工具和插件可以辅助或自动生成 CAD 图,例如: 1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,可根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,能根据用户输入的设计目标和约束条件自动产生多种设计方案。 但使用这些工具通常需要一定的 CAD 知识和技能,对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。
2025-03-11
有没有进行剧情总结用的提示词
以下是为您整理的有关剧情总结的提示词相关内容: 在 Apple Intelligence 中,用于从照片创作故事和创意写作助理回应的对话以 JSON 格式响应,包括 traits、story 等键值,需遵守故事和照片说明的相关指南,如故事应多样化、不应包含负面内容等。 在某 bot 场景中,前面三个按钮用于驱动剧情,最后一个用于提示词总结,其技术实现相对复杂的部分是工作流中嵌套的图像流。 在制作 AI 视频短片时,如以老船长年轻形象为例,可从剧本中的画面描述提取提示词,生成不同角度的人物图。对于图生视频,只需上传图片至视频生成模块,用简单提示词描绘画面中的动态内容即可。
2025-03-11
我是AI小白,应该如何浏览了解AI的最新资讯
对于 AI 小白来说,想要浏览了解 AI 的最新资讯,可以参考以下方法: 1. 持续学习和跟进:AI 是一个快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 2. 考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 3. 关注腾讯研究院开发的一系列专业的 AI 资讯产品,如: AI 每日速递,一份高度凝练的日报产品,帮助您用 3 5 分钟快速掌握 AI 领域当日十大关键进展。 AI 每周 50 关键词,作为周报产品,基于 AI 速递内容构建。通过梳理一周热点关键词并制作可交互索引,为研究者提供便捷的“检索增强”工具,助力快速定位所需信息。 科技九宫格,一档短视频栏目,以 3 5 分钟视频形式解读科技热点与关键技术原理。通过可视化呈现,促进您对前沿技术的理解与讨论。 4. 您还可以通过以下友情链接获取最新资讯:
2025-03-11
如何打造自己的知识库
打造自己的知识库可以参考以下方法: 1. 使用 GPT 打造个人知识库 利用 embeddings 技术:将文本转换成向量,节省空间,可理解为索引。把大文本拆分成小文本块,通过 embeddings API 转换为向量并保存。当用户提问时,将问题也转换为向量,与储存库中的向量比对,提取关联度高的文本块,与问题组合成新的 prompt 发送给 GPT API。 理解 embeddings:embeddings 是浮点数字的向量,向量之间的距离衡量关联性,小距离表示高关联度。例如,“猫”和“狗”距离近,与“汽车”距离远。 注意 GPT3.5 一次交互支持的 Token 数量有限,OpenAI 提供了 embedding API 解决方案。 2. 智慧课程培育建设中的方法 学习有效地收集、整理和检索信息。 进行知识管理,通过实际操作体验工具在教学准备和科研中的应用。 实践演示,如直接让 Claude 生成可视化概念图。 每天的具体操作,如早晚速读朋友圈文章、编写小代码和脚本、转换和呈现数据、从图像和图形中提取数据、翻译和改换风格、总结视频内容、作为私人导师探究问题等。 分新闻、观点、访谈、论文翻译来进行提炼,使用通义听悟整理录音笔记等工具。 利用各种相关网站和工具,如 https://tingwu.aliyun.com、https://ollama.com、https://snapbox.app、https://opencat.app、https://chathub.gg/、https://www.elmo.chat/、https://memo.ac/zh/ 等。 下载视频或录制视频文件,如用 Downie(Mac)、IDM(Windows)、OBS 等工具。
2025-03-11