Navigate to WaytoAGI Wiki →
Home/All Questions
ai工作
以下是关于 AI 工作的相关内容: 一、固定且优化的 AI 工作流 1. 起床后,让 AI“马云”“马化腾”为自己排 TODO 优先级,并进行私董会的脑暴。 2. 工作中有傲娇的 AI 小助理加油,其 Prompt 为要阳光、会撒娇/卖萌。 3. 重点事项 bot 方面,如内容创作,拆成一个 bot 团队组,工作分成选题、标题、框架、扩写,然后分 A/B 组两个 AIbot 互相改。其中要点是提供反常识、梗,学习喜欢的 UP 创作方法论,如导演小策、影视飓风 TIM 总结的 HKRR(快乐/知识/共鸣/节奏)。 4. 优化的 bot 包括内容选题 bot、短视频脚本 bot、数据分析 bot(GPT4)、网页 Perplexity 的资料库 bot。 5. 进一步优化:Zion、ChatO 和自动化 AIAgent 分身,基于自身知识库的 bot。 6. 将上述知识库、Prompt 资产全部放入飞书的知识库+多维表单中维护,等待飞书的 AI 进化。 7. 备选 50 多个生产力 AI 放在工具库里,待命输出。 8. 未来计划把整个公司业务全部搬入飞书中,外接 MJ、ChatBot 分身以及咨询日程预约。 9. 可能让所有流量口 bot 也介入飞书,给予飞书做数据分析和内容引擎(目前需手动)。 10. 提醒自己关注与 AI 打交道的人、利益、状态和情绪。 二、AI 无法替代的工作 借着 AI 浪潮,转型焦虑是一次明心见性、找寻个体独特价值的机会。应撇去浮躁与焦虑,关注如何用 AI 拓展个人主体性的边界。 三、AI 视频短片工作流 1. 概念设定:MJ 2. 剧本+分镜:ChatGPT 3. AI 出图:MJ、SD、D3 4. AI 视频:Runway、pika、PixVerse、Morph Studio 5. 对白+旁白:11labs、睿声 6. 音效+音乐:SUNO、UDIO、AUDIOGEN 7. 视频高清化:Topaz Video 8. 字幕+剪辑:CapCut、剪映 相关完整文档和直播回放可参考文中提供的链接。
2025-03-28
agi和ai的区别
AGI(通用人工智能)和 AI(人工智能)的区别主要体现在以下几个方面: 1. 能力范围:AI 通常分为 ANI(弱人工智能),如智能音箱、网站搜索、自动驾驶等,只能完成特定的单一任务;而 AGI 能够像人类一样思考、学习和执行多种任务。 2. 智能水平:ANI 得到了巨大发展,但 AGI 尚未取得巨大进展。AGI 具备更广泛和全面的智能能力。 例如,ChatGPT 是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具。Web3 和人工智能初创公司 AGII 获得 1500 万美元融资,AGII 是一个 AI 驱动的平台,旨在为用户提供强大的 AI 驱动工具和高质量内容生成能力。
2025-03-28
deepseek怎么解读论文
以下是关于 deepseek 论文解读的相关内容: 直播视频回放:可获取相关视频。 相关论文下载: 技巧分享:包括万能提示词的使用技巧。 社区动态: 《》介绍了 DeepSeek 最新论文提出的“Native Sparse Attention”(NSA),一种高效的超长上下文方案,兼顾训练和推理阶段,显著提升模型性能。 《》介绍了基于 Coze 平台的视频生成工作流,通过全自动化流程实现从文案创作到短视频生成的高效操作。 历史更新: 《》对照解读了春节前的 DeepSeek 相关模型的技术报告。 《》介绍了 DeepSeek 官方下场推荐的部署 DeepSeekR1 的设置。 《》介绍了火山方舟大模型服务平台上线 DeepSeek 系列模型及相关活动。
2025-03-28
当前所有大模型的能力排行
目前大模型的能力排行情况较为复杂,以下为您提供部分相关信息: 8 月正式上线的国内大模型包括北京的百度(文心一言)https://wenxin.baidu.com 、抖音(云雀大模型)https://www.doubao.com 、智谱 AI(GLM 大模型)https://chatglm.cn 、中科院(紫东太初大模型)https://xihe.mindspore.cn 、百川智能(百川大模型)https://www.baichuanai.com/ ,上海的商汤(日日新大模型)https://www.sensetime.com/ 、MiniMax(ABAB 大模型)https://api.minimax.chat 、上海人工智能实验室(书生通用大模型)https://internai.org.cn 。在聊天状态下,能生成 Markdown 格式的有智谱清言、商量 Sensechat、MiniMax ;目前不能进行自然语言交流的有昇思、书生;受限制使用的有 MiniMax 。特色功能方面,昇思能生图,MiniMax 能语音合成。阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 2023 年度中文大模型基准测评报告显示,在语言与知识的测评中,GPT4 Turbo 依然领先,是唯一超过 90 分的大模型。国内大模型也表现相对较好,有 14 个模型的得分高于 GPT3.5,有 9 个模型的得分高于 GeminiPro。其中 OPPO 的 AndesGPT、阿里云的通义千问 2.0、月之暗面的 Moonshot 分列国内 13 位,较为接近 GPT4。在开源模型中,零一万物的 Yi34BChat、阿里云的 Qwen72BChat、百川智能的 Baichuan213BChat 取得了不错的成绩,均超过了 50 分,分列国内模型的 13 名。总体来看,在中文语言与知识能力上,国内大模型已基本追赶上国外头部大模型。 关于大模型的评测榜单还有: Open LLM Leaderboard:地址 ,由 HuggingFace 组织,目前已评估了较多主流的开源 LLM 模型,评估主要包括 AI2 Reasoning Challenge,HellaSwag,MMLU,TruthfulQA 四个数据集上的表现,主要以英文为主。 chinesellmbenchmark:地址 ,覆盖百度文心一言、chatgpt、阿里通义千问、讯飞星火、belle/chatglm6b 等开源大模型,多维度能力评测,不仅提供能力评分排行榜,也提供所有模型的原始输出结果。 SafetyPrompts:地址 ,由清华大学提出,是一个关于 LLM 安全评测 benchmark,包括安全评测平台等,用于评测和提升大模型的安全性,囊括了多种典型的安全场景和指令攻击的 prompt。
2025-03-28
MINIMAX怎么样
MiniMax 相关信息如下: 推出了 Hailuo Audio HD,具有以下特点: 快速克隆:仅需 10 秒音频即可克隆语音,智能情感系统能精准捕捉细腻情感变化。 多维预置语音:提供 300+语音选项,支持 17 种语言(不断扩展),涵盖口音、性别、年龄、风格等。 专业音效:支持房间音效、电话滤镜,输出接近录音室级别。 相关链接: 免费试用: API 平台: 其视频模型团队规模较小,约 10 人,于今年 8 月底发布了视频生成模型。 旗下的 Talkie 加星野的总日活约有 500 万,其中星野 9 月日活为 94 万,30 日留存率达到 60%。
2025-03-28
我是小白,希望从头开始学agi,但是不需要特别专业的知识,只集中于应用层面就好
对于小白从头开始学习 AGI 并集中于应用层面,建议您按照以下步骤进行: 1. 记忆:先了解 AGI 的历史、基本术语、重要概念、方法和原理等。 2. 理解:进一步了解 AGI 领域的主要思想。 3. 应用:深入了解 Prompt,选择适合自己的 AI 对话(https://ywh1bkansf.feishu.cn/wiki/QddLw0teKi7nUCkDRIecskn3nuc )、绘画(https://ywh1bkansf.feishu.cn/wiki/Q5ddwxfkMiVUZBkQXN7cgXf4nOb )和语音(https://ywh1bkansf.feishu.cn/wiki/ZXPiw2OuLi2YsxkkmaLcPTyInrc )产品,每天使用它们来解决实际问题或提升效率(https://waytoagi.feishu.cn/wiki/A0Y0wpBOcig7HLkSFNcceTA6nwb )。 4. 分析:大量阅读各类文章(https://ywh1bkansf.feishu.cn/wiki/YjJgwbKnriZBZ0kVn6Kc1gSKnsf?table=tblsQKR3a22uFqsp )、视频(https://ywh1bkansf.feishu.cn/wiki/LEnvwwEy0iufT3k4kfVc8Ehenvf?table=tbllpoPWJn6MNOR6&view=vew68BlUHo )以及行业报告(https://ywh1bkansf.feishu.cn/wiki/FnXcwGrwSimQxnkNo1kcJzPYn7f ),理解各知识之间的关系。 此外,您还可以观看以下两个对建立框架有帮助的视频: 1. 【包教包会】一条视频速通 AI 大模型原理_哔哩哔哩_bilibili(https://www.bilibili.com/video/BV17t4218761/?vd_source=3cc4af77a2ef185635e8097d3326c893 ),由林粒粒呀(女神)主讲,和某知识 up 主 Genji 一起制作的免费公益课,新手友好,50 分钟速通 AI 大模型原理。 2. 用大模型保存你的全部人生,你会接受吗:专访安克创新 CEO 阳萌|大咖谈芯第 11 期_哔哩哔哩_bilibili(https://www.bilibili.com/video/BV1iT421Q7M1 ),某知识 up 主老石谈芯专访安克创新 CEO 阳萌的视频,一共两期,两期内容都值得观看。
2025-03-28
AI怎么影响家庭教育
AI 对家庭教育有着重要的影响。郝景芳认为,AI 类似于给孩子的大脑进行微调。家长的作用并非教会孩子所有知识,而是提供真实数据,让孩子自行确认大脑模型计算的正确性。家庭教育的重点在于引导孩子通过观察、尝试、反馈和修正,优化自身的先天大模型。 在 AI 时代,家长应关注如何让孩子学会通过真实数据验证和调整思维模式。每个孩子生来就自带大模型,具有超强的数据处理能力,家庭教育是让孩子的大模型“本地化”,家长对孩子的教育是一种大模型的微调,应顺势而为,使孩子的先天大模型发挥最佳作用。 此外,培养下一代时可以用 AI 辅助教育。比如在 WaytoAGI 学习 Agent 知识后,搭建 bot 帮助孩子的学习提效。对 AI 家庭教育感兴趣,还可以在 WaytoAGI 找到 MQ 老师交流。
2025-03-28
世界模型
世界模型是一种用于强化学习和模型类强化学习的模型,能够模拟和交互整个物理世界。 Sora 被称为世界模型,原因在于其能模拟和交互整个物理世界,具有模拟三维空间连贯性、数字世界、长期连续性和物体持久性并与世界互动的能力。其名称源于日文“空”,以示无限创造潜力。这种模型在机器人领域(包括自动驾驶)常见,通常由多模态输入、感知、世界模型、未来预测和规划控制等步骤组成。 谷歌发布的世界模型 Genie 是一个 110 亿参数的基础世界模型,可通过单张图像提示生成可玩的交互式环境。它由潜在动作模型、视频 tokenizer 和动态模型组成,能从各种图像生成无穷无尽的可玩世界,其学到的潜在动作还可转移到真实的人类设计环境中。 对于 OpenAI 能跑通所有 AGI 技术栈,从世界模型的角度来看,大量数据来自世界本身,世界产生的数据是 AGI 所需数据的最小集合,OpenAI 未来会执着于持续获得或构造数据。为有效利用数据,需要模拟和生成整个世界的任务,OpenAI 未来会在更多模态和数据上做生成模型,如 Sora 就是其中之一。
2025-03-28
GPT4o图片生成能力
GPT4o 是 OpenAI 推出的一种先进的图像生成模型,具有以下能力和特点: 1. 核心功能: 是一种先进的多模态模型,能够生成精确、真实感强的图像。 其图像生成功能不仅美观,还具有实际用途,例如白板演示、科学实验图解等。 2. 亮点功能: 精确的文本渲染:能够在图像中准确生成文字,例如街道标志、菜单、邀请函等。 结合文本和图像,提升了视觉传达能力。 多样化场景生成:支持从照片级真实感到漫画风格的多种图像生成。 可根据用户上传的图像进行灵感转化或视觉改造。 上下文感知:能够利用 GPT4o 的内在知识库和对话上下文生成符合语境的内容。 3. 技术改进: 通过联合训练在线图像和文本的分布,模型学会了图像与语言之间以及图像之间的关系。 经过后期训练优化,模型在视觉流畅性和一致性方面表现出色。 4. 实际应用场景: 信息传递:从标志性图像到复杂的科学图表,帮助用户更有效地传达信息。 创意设计:生成创意菜单、街道标志和独特的视觉故事。 教育与演示:支持生成教学图表、实验示意图等。 5. 局限性:尽管生成能力强,但仍可能存在某些场景或细节的限制。 6. 安全性与可用性:OpenAI 强调了安全性和隐私保护。目前该功能已集成到 ChatGPT 中,用户可直接体验。 此外,GPT4o 图像生成模型整合进了 4o 模型中,基于多模态训练,能够结合文本和图像的上下文,生成更智能、更逼真一致的视觉内容,并支持用户通过自然对话对其进行编辑调整和优化。它不仅能提供传统的图像生成,还可以生成更复杂的图像,包括插图、图表、PPT 元素、logo、游戏角色设计等。
2025-03-28
最适合搭建本地个人知识库的ai是什么
以下是一些适合搭建本地个人知识库的 AI 相关技术和工具: 1. RAG(Retrieval Augmented Generation)技术:利用大模型的能力搭建知识库,其应用包括文档加载(从多种来源加载文档)、文本分割(把文档切分为指定大小的块)、存储(将切分好的文档块嵌入并存储到向量数据库)、检索(通过检索算法找到与输入问题相似的嵌入片)和输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 2. Open WebUI:一般有两种使用方式,包括聊天对话和 RAG 能力(让模型根据文档内容回答问题,是构建知识库的基础之一)。如果要求不高,通过其可实现本地大模型的对话功能。 3. AnythingLLM:包含 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。安装完成后,配置主要分为三步,包括选择大模型、文本嵌入模型和向量数据库。在 AnythingLLM 中,有 Workspace 的概念,可创建工作空间,上传文档并进行文本嵌入,还提供了 Chat 模式(综合给出答案)和 Query 模式(仅依靠文档数据给出答案)两种对话模式。
2025-03-28