Navigate to WaytoAGI Wiki →
Home/All Questions
目前deepseek的进展
目前 DeepSeek 的进展如下: 持续 5 天的“开源周”已进行到第 3 天。周一开源了专为英伟达 Hopper GPU 打造的高效 MLA 解码内核 FlashMLA,已正式投产使用。周二开源了专为混合专家系统(MoE)和专家并行(EP)设计的通信库 DeepEP。周三开源了支持稠密和 MoE 模型的 FP8 GEMM(通用矩阵乘法)计算库 DeepGEMM,可为 V3/R1 的训练和推理提供强大支持。总的来说,英伟达和 DeepSeek 开源的内容都是通过对英伟达 GPU 和集群的优化,来推动 AI 模型的高效计算和部署。 华尔街分析师对 DeepSeek 的反应:展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 DeepSeek 的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于 GPT,据用户反馈。GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。
2025-04-01
coze的学习教程
以下是关于 Coze 的学习教程: 共学活动前两天的教程和录播: 《》 《》 《》 《》 用 Coze 学习 RAG: 视频演示: Query 改写效果对比 Bot:用于对比 Query 改写和未改写的区别,地址为 https://www.coze.cn/store/bot/7400553639514800182?panel=1&bid=6dkplh1r43g15 ,视频演示: RAG 全流程学习 Bot:结合对 RAG 全流程的了解,使用 Coze 的工作流,主要是结合大模型,模拟了 RAG 的离线存储和在线检索全流程,视频演示: Agent 相关比赛中的 Coze 相关教程: 概览与介绍:https://waytoagi.feishu.cn/wiki/YGgzwDfWLiqsDWk2ENpcSGuqnxg 基础教程: 《大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库》https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb 《大聪明:保姆级教程:Coze 打工你躺平》https://waytoagi.feishu.cn/wiki/PQoUwXwpvi2ex7kJOrIcnQTCnYb 《安仔:Coze 全方位入门剖析免费打造自己的 AI Agent》https://waytoagi.feishu.cn/wiki/SaCFwcw9xi2qcrkmSxscxTxLnxb 《基础教程:Coze“图像流”抢先体验》https://waytoagi.feishu.cn/wiki/AHs2whOS2izNJakGA1NcD5BEnuf 《YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏》https://waytoagi.feishu.cn/wiki/CTajwJnyZizxlJk8a4AcJYywnfe 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档:https://waytoagi.feishu.cn/wiki/ExHMwCDZ7i6NA7knCWucFvFvnvJ
2025-04-01
基于技术类别的不同,将现在的AI产品进行分类
目前,AI 产品基于技术类别可以进行如下分类: 1. 从生成方式分类: 文生视频、图生视频:如 Runway、Pika labs、SD+Deforum、SD+Infinite zoom、SD+AnimateDiff、Warpfusion、Stability Animation 等。 视频生视频: 逐帧生成:如 SD+Mov2Mov。 关键帧+补帧:如 SD+Ebsynth、Rerender A Video。 动态捕捉:如 Deep motion、Move AI、Wonder Dynamics。 视频修复:如 Topaz Video AI。 AI Avatar+语音生成:如 Synthesia、HeyGen AI、DID。 长视频生短视频:如 Opus Clip。 脚本生成+视频匹配:如 Invideo AI。 剧情生成:如 Showrunner AI。 2. 从产品阶段和可用维度分类: 以 AI 为底层设计逻辑的 AI 原生类产品。 在原有互联网产品上深度嵌入 AI 功能的 AI+X 产品,目前整体数据表现显著优于 AI 原生类产品,在办公软件和内容平台重点布局。办公软件方面,如百度文库和 WPS AI 等在续写、改写、命题写作等不同程度的 AI 写作功能,以及针对论文、小说等不同题材的 AI 总结功能上表现突出。内容平台方面,AIGC 大多从基于平台内容的 AI 搜索、用于带动 UGC 的 AI 生成功能及模板、降低门槛的内容创作工具三个方向发力。 基于外接 API 微创新的套壳类产品。 将多个产品/模型 API 集中拼凑的集合站类产品。 此外,从 AI 产品经理的角度,个人划分仅供娱乐和参考: 1. 入门级:能通过 WaytoAGI 等开源网站或一些课程了解 AI 概念,使用 AI 产品并尝试动手实践应用搭建。 2. 研究级:有技术研究和商业化研究两个路径,能根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用级:有成功落地应用的案例,产生商业化价值。对应传统互联网 PM 也有三个层级: 负责功能模块与执行细节。 负责整体系统与产品架构。 熟悉行业竞争格局与商业运营策略。
2025-04-01
有没有准确的ai论文写作指令
以下是一些准确的 AI 论文写作指令的相关策略和技巧: 1. 清晰明确的指令: 模型无法读心,若输出过长可要求简短回答,过简可要求专业写作,对格式不满可展示期望格式,减少模型猜测以获得期望结果。 在查询中添加详细信息以获取更准确答案。 请求模型扮演特定角色,如以专家口吻或像朋友一样。 使用分隔符清晰区分输入的不同部分,如三重引号、XML 标签或章节标题。 明确指出完成任务需要的步骤,将复杂任务分解为更小步骤。 提供实例作为参考。 明确指定希望输出的长度,如字数、句子数、段落数或要点数量。 2. 提供参考文本: 语言模型有时会编造答案,为其提供参考文本可帮助生成更准确可靠的答案。 指导模型使用参考文本回答问题,将其作为依据。 指导模型使用参考文本中的引用来回答问题,并标注引用来源。 通过运用这些策略和技巧,能够提高 AI 在论文写作方面的辅助效果。
2025-04-01
请基于应用场景,对AI模型进行分类
以下是对 AI 模型基于应用场景的分类: 1. 文本生成和内容创作:包括撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:如代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信:促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 6. 教育和学习辅助:创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如根据文本描述生成相应的图像,甚至未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询:理解和回答医疗相关的问题,提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询:帮助解读法律文件,提供合规建议。 此外,在开源模型方面,如 Civitai、海艺 AI、liblib 等为主流创作社区,提供了让用户利用 AI 技术进行图像创作和分享的平台。AI 视频方面,其应用场景广泛,涵盖内容创建、社交媒体营销、讲故事与动画制作、个性化内容、视频摘要、电子学习和培训、新闻媒体、电子游戏开发、虚拟助理和聊天机器人、归档与文档保存以及提高内容的可访问性等多个领域。从使用场景来看,分为改善大模型产品的使用体验、助力用户工作流、细分场景独立实用工具、AI 社区、Chatbot 五个方向;从产品形态上来看,分为插件、辅助现有产品能力、深度结合 LLM 能力的独立网站&应用、AI 社区四种。目前产品大多分布在 PC 端。
2025-04-01
有AI+游戏的最新案例吗
以下是一些 AI+游戏的最新案例: 由 5 人独立游戏工作室 Proxima 开发的 AI 冒险独立游戏 Suck Up!上线三周油管播放超千万。这是一款沙盒社交冒险游戏,团队尝试加入了名为 Nemo 的 AI NPC,基于 LLM 驱动,Nemo 能在接收到用户命令或其他线索后,调动感知、记忆,并转化为可执行的游戏行动。去年上半年,该工作室因获得 160 万美元投资引起轰动,上线后也受到资本关注。玩家对其玩法和模式提出了很多创意想法,如设计成就系统、上线多人模式等。 开发者正在使用 AI 生成音乐来填充游戏过程与游戏 UI 中需要使用到的各类音效、不同游戏场景中用以渲染氛围的各种音乐。像 MusicLM 等模型已经支持生成多音轨的作品。 2023 年 Genfun.ai 和 Meshy 联合制作的游戏《Soul Chronicle》,是首款实时 3D+AIGC+UGC 的 MMO 手游,最大突破是制作出了与游戏完美融合的 3D AIGC 技术,可在游戏中实时生成角色皮肤。 2024 年 Bitmagic 释出的《Roleverse》平台,可在平台内使用提示在游戏内定制角色,对角色进行缩放、挤压和拉伸,也能轻松对游戏世界进行编辑。 AI 技术在游戏行业的应用由来已久,且不断发展。从最初的简单内容和随机元素生成,到辅助游戏设计,再到如今能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 对游戏创作的影响包括美术与风格、剧情与叙事、关卡与玩法、音效与音乐、测试与优化等方面。同时,AI 能基于玩家游戏行为评估玩家技能水平和游戏风格,动态调整游戏难度等,提升玩家体验。此外,游戏还能成为 AI 模型能力的最佳试验场。
2025-04-01
ai如何思考你提出的问题
AI 思考问题的方式多种多样,以下为您介绍一些常见的方法和案例: 1. 利用思维模型:例如通过“AI+六顶思考帽”的方法,依次运用白帽(搜集信息)、红帽(探索直觉和感受)、黄帽(探索可能的积极面)等思维方式,全面且深入地思考问题。比如在个人 IP 定位的案例中,先让用户提供职业、兴趣爱好等信息,再探索其感受和直觉,最后分析潜在好处。 2. 引用节点和参照:在生成内容时,可以使用“引用节点”的技巧,让 AI 根据特定的参照(如之前的产出、新增的参考文案等)输出具备更高关联度的内容。例如在生成“延伸思考”的问题时,严格参照未来世界观和各个驱动力的解析。 3. 对比不同模型和功能:可以用同一段提示词对比不同模型的输出,择优深挖。还可以在满意的内容节点上添加“文本编辑器显示”,对文本进行精加工。 4. 正确引导孩子使用:对于孩子使用 AI,若方法不当,如提封闭性问题让孩子迅速得到答案,可能有负面效果;但改成开放性问题或让 AI 帮助提更多拓展思考的问题,能激发好奇心。在辅助写作文时,让孩子与 AI 共同完成并提交聊天记录,关注孩子对作文的点评批改等,能避免孩子偷懒。
2025-04-01
AI在BizDevOps中的场景落地及应用
以下是关于 AI 在 BizDevOps 中的场景落地及应用的相关内容: AI 在 DevOps 中的应用: AI 可以承担指定计划、拆分任务和调用工具的角色,但目前无法完全评定任务结果的正确性和质量。 现阶段更适合让 AI 辅助完成部分任务,如画原型图、设计表结构、写自动化测试代码等,但需要人类验证后才能进行下一步操作。 完全依赖 AI 可能带来风险,如生产环境出错或被黑客恶意利用漏洞。 AI 的记忆能力: ChatGPT 支持记忆功能,可通过摘要保存对话内容以延续角色和对话风格,但新开会话可能在高推理任务中效果更好。 建议将角色设定和部分对话作为样例(fewshot)放入提示词中,以优化生成质量。 学习 GPT 的妙招: 结合视频教程、文字转录和基础资料,通过 ChatGPT 讲解学习内容。 角色反转,自己当老师,ChatGPT 当学生,通过提问互动和查漏补缺能有效提升学习效果。 AI 对软件工程的影响: 涵盖自动代码生成、智能调试、AI 驱动的 DevOps 和敏捷开发优化。 自动代码生成工具(如 GitHub Copilot)提高编程效率,AI 也助力智能测试与运维。 DevOps 迎来 AI 驱动的 CI/CD 和 AIOps,提升部署自动化和智能监控能力。 AI 让敏捷开发更加高效,通过自动化需求分析、测试优化和团队协作增强生产力。 其他相关动态: OpenAI CEO 宣布开发 AI 设备,目标颠覆智能手机。 OpenAI 推出全新 Deep Research,让 ChatGPT 成为研究助理。
2025-04-01
去水印
以下是一些 AI 去水印的工具: 1. AVAide Watermark Remover:在线工具,使用 AI 技术去除图片水印,支持多种图片格式(如 JPG、JPEG、PNG、GIF 等)。操作简单,上传图片、选择水印区域,保存并下载处理后的图片,还提供去除文本、对象、人物、日期和贴纸等功能。 2. Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,AI 自动检测并移除水印,处理完成后可保存生成的文件,适合需快速去水印及在社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除图片中多余物体、人物或水印,不留痕迹,支持直接粘贴图像或上传手机图像,操作简便。 4. ProPainter:一键移除视频内物体或水印,基于 E2FGVI 实现,项目链接:https://t.co/psub7dIymc ,Github 链接:https://github.com/sczhou/ProPainter 。 5. https://anieraser.media.io/app:去水印效果好但收费。 6. https://onlinevideocutter.com/removelogo:可以去水印,但效果一般。 这些工具各有特点,您可根据具体需求选择最适合的去水印工具。内容由 AI 大模型生成,请仔细甄别。
2025-04-01
提示词框架
以下是关于提示词框架的相关内容: 一、Vidu Prompt 基本构成 1. 提示词基础架构 主体/场景 场景描述 环境描述 艺术风格/媒介 调整句式和语序,避免主体物过多/复杂、主体物分散的句式描述。 避免模糊的术语表达,尽可能准确。 使用更加流畅准确的口语化措辞,避免过度文学化的叙述。 丰富、准确和完整的描述才能生成特定艺术风格、满足需求的视频。 2. 提示词与画面联想程度的说明 为了帮助更好地理解,使用单帧图像作为例子介绍提示词与画面联想的关系。 基础词:玻璃桌上的咖啡杯,杯子外面写着单词 LOVE。 适度联想扩充:花园里(具体的位置描述)的透明(材质描述)玻璃桌上的咖啡杯,杯子外面写着单词 LOVE,周围满是盛开的鲜花(具体的位置描述/环境描述),和煦的阳光洒满整个花园(环境描述),Claude Monet(艺术家风格),印象派风格(艺术流派风格)。 联想关键点: 具体详实的位置描述/环境描述:笼统来讲就是在进行构图,可以帮助构建画面的基本呈现效果。 艺术风格描述:进一步提升效果和氛围,统一画面风格。 二、小七姐:Prompt 喂饭级系列教程小白学习指南(二) 如果拿到由四个词语组成的提示词框架无从下手,可以这样做: 恭喜你,写出了第一个提示词,它是: 请告诉我如何用下列四个词编写一个框架性的提示词(prompt)? 情境: 任务: 行动: 结果: 请回忆写出这条提示词的过程。 最后复习本节课的三步走: 1. 懂原理 2. 找需求 3. 用框架 下课啦~ 我是 prompt 学习者和实践者小七姐,欢迎链接我交流 prompt 相关知识:se7en319
2025-04-01