Navigate to WaytoAGI Wiki →
Home/All Questions
GPT 4o
GPT4o 是突破深度学习界限的最新成果,朝着实用可用性方向发展。过去两年致力于提高堆栈各层效率,使得能更广泛提供 GPT4 级别模型,其功能将迭代推出。 文本和图像功能已在 ChatGPT 中推出,在免费套餐中提供,并向 Plus 用户提供高达 5 倍的消息限制,未来几周将在 ChatGPT Plus 中推出带有 GPT4o 的新版本语音模式。 开发者可在 API 中作为文本和视觉模型访问 GPT4o,它比 GPT4 Turbo 快 2 倍,价格减半,速率限制高 5 倍。 在安全挑战和评估方面: 在第二个旨在涵盖风险建议(如攻击规划)的红队评估数据集中,GPT4.5 有 46%的输出是安全的,优于 GPT4o 的 40%,但低于深度研究的 67%或 o1 的 68%。 对 GPT4.5 与 GPT4o 和 o1 进行了一系列不允许内容的评估,包括标准拒绝评估、具有挑战性的拒绝评估、WildChat(有毒)和 XSTest 等,评估使用自动评分器,检查“not_unsafe”(未产生不安全输出)和“not_overrefuse”(未过度拒绝良性请求)两个主要指标,发现 GPT4.5 总体上与 GPT4o 相当。
2025-03-29
api
以下是关于 API 的相关信息: ComfyUI GeminiAPI: 用于在 ComfyUI 中调用 Google Gemini API。 安装说明: 手动安装:将存储库克隆到 ComfyUI 的 custom_nodes 目录,安装所需依赖(根据使用的 ComfyUI 版本有所不同)。 通过 ComfyUI Manager 安装:在 ComfyUI 中安装并打开 ComfyUI Manager,搜索“Gemini API”并点击安装按钮,安装完成后重启 ComfyUI。 节点说明: Gemini 2.0 image:通过 Gemini API 生成图像的节点。输入参数包括必填的 prompt、api_key,可选的 model、width、height、temperature、seed、image 等。输出包括生成的图像和 API Respond。使用场景包括创建独特的概念艺术、基于文本描述生成图像、使用参考图像创建风格一致的新图像、基于图像的编辑操作。 API 与速率限制: 速率限制是 API 对用户或客户端在指定时间内访问服务器的次数施加的限制。 速率限制的原因包括防止滥用或误用 API、确保公平访问、管理基础设施负载等。 OpenAI 的 API 提供商在 API 使用方面有限制和规定,不同用户类型可获得不同的速率限制,若请求超过限制将返回错误响应。 关于 API 的一般性描述: API 就像是一个信差,接受一端的请求,告诉系统用户想要做的事情,然后把返回的信息发回。 学习使用 GPT 的 Action 工作流包括:确定想要的 GPT 及是否需要外部数据,寻找 API 文档或开发 API 以及编写 Action 里的 Schema 和 Prompt。 对 Action 感兴趣可以从系统了解和学习 API 相关知识、在网上寻找可用的 API 练习、发掘 GPT Action 更多潜力等方向继续前进。
2025-03-29
如何让AI帮我做一份PPT
以下是让 AI 帮您做一份 PPT 的一些方法和步骤: 1. 可以使用 Claude+Gamma.app 这两个工具。Claude 能够帮助您快速寻找符合条件的论文、提取精炼论文中某部分信息,还能帮您找到适合的 PPT 制作工具并教会您使用。 例如,您可以向 Claude 提出诸如“帮我搜索一下营销领域最权威的期刊是哪几本”“帮我搜索一下这几本期刊中关于 chatgpt 的最新论文,并帮我筛选出 3 篇被引用次数最多的论文”等问题。 2. 利用 WPS AI 制作 PPT,等待不到 2 分钟 PPT 即可做好,然后可以修改主题配色和字体,还能通过 WPS 插件 chatPPT 为 PPT 添加动画。 3. 与 Claude 沟通时,要详细描述您想要的视觉风格,比如希望模仿类似 TheVerge 网站的科技风格,需要具体描述为“帮我生成数据可视化 PPT,类似 theverge 这样的科技风格,强烈的颜色对比,深色底色,以明亮的绿色和紫色作为高亮颜色,符合数学规律的配色,带有淡淡的网格线,体现科技感,使用 16:9 的画布,不能有元素溢出画布,保证布局的合理性,简洁的几何图形化作为装饰,所有装饰需要和内容相关,并且尽可能少使用,使用英文,模拟 2 个 PPT 的版式或者数据可视化,来测试效果”。如果初次效果不理想,需要耐心与 Claude 继续沟通和调整。
2025-03-29
Ai如何帮助电商
AI 在电商领域有以下多方面的帮助: 1. 产品推荐:通过分析客户数据,为每个客户推荐他们可能感兴趣的产品。 2. 搜索和个性化:改善搜索结果,为客户提供个性化的购物体验。 3. 动态定价:根据市场需求动态调整产品价格。 4. 聊天机器人:提供服务,回答客户问题并解决他们的问题。 5. 生成产品照片:像这样的工具帮助品牌创建引人注目的产品照片,提升产品对在线购物者的吸引力。 6. 创作营销内容:可以编写经过 SEO 优化的产品描述。 7. 商品展示图制作:可以借助 Stable Diffusion 等 AI 作图工具,通过局部重绘等方法美化商品展示图,比如真人穿衣服拍照后进行处理和替换等操作。
2025-03-29
视频生成提示词
以下是关于视频生成提示词的相关内容: Pikadditions: 1. 上传基础视频: 点击页面下方的【Pikaddition】按钮。 拖拽或点击上传本地视频。 若自己没有视频,可以在“templates”板块里使用官方示例视频做测试。 2. 添加主角图片:点击【Upload Image】上传角色图片文件。 3. 编写视频提示词: 如果需要参考角色在视频里有相关互动,需在输入框用英文描述期望效果(支持 Emoji 辅助),然后点击生成按钮。 Pika 会提供一段默认 prompt,如果没有特殊想法,可以直接使用。 建议在自己的提示词尾部加入官方提供的默认提示词,效果会更好。 该功能提示词公式参考: 事件驱动句式:As... 空间锁定技巧:使用场景物体作坐标轴:on the.../behind the.../from the... 动态呼应原则:角色动作与视频元素联动:swaying with.../reacting to.../matching... MiniMax 海螺 AI: 主体参考功能的生成逻辑和文生视频相似,详见文生视频 Prompt 教程。用于主体参考功能的 Prompt,只涉及单人内容,可以获得最准确的表现效果。若 Prompt 涉及多主体,可以补充对于 Prompt 特定主体的描述,海螺 AI 能够通过年龄、性别识别对应面部主体并完成生成。 五津:DeepSeek+扣子: 1. 生成单词: 输入单词主题、图片风格、单词数量。如非洲动物、真实风格、2。 选择 deepseekr1 模型,输入单词主题、单词数量,这样 deepseek 就可以为用户输出指定数量的几个单词,并以数组方式输出。 2. 提示词: 角色:你是一个专业的单词生成助手,擅长围绕各种主题挖掘相关英语单词,为用户提供精准且实用的单词、中文、美式音标内容。 技能 1:输出关联英语单词。当用户输入主题{{zhuti}}时,分析主题内涵,运用专业知识,输出{{shuliang}}个与该主题紧密关联的英语单词、中文翻译、美式音标,将该单词用于一句英文中(不超过 15 个单词),并将这句英文句子翻译成中文句子,并以数组形式呈现。 限制:仅围绕用户输入主题输出相关英语单词、中文翻译、美式音标,不涉及其他领域内容。输出必须为符合要求的数组形式,英文单词对应变量 yingwen,中文翻译对应变量 zhongwen,美式音标对应变量 yinbiao,英文句子对应变量 juzi_yingwen,中文句子翻译对应变量 juzi_zhongwen,不得有其他格式偏差。
2025-03-29
openai官方文档
以下是关于 OpenAI 官方文档的相关信息: 对于刚入门学习提示词的朋友,建议先有一个大模型帐号并熟悉与之对话的方式。推荐的国产平替有 。 学习 prompt 必须看 OpenAI 的官方文档,相关链接有: 。 在 OpenAI 官方的说明文档(Documentation)中,为用户提供了若干项策略以帮助更好地使用 ChatGPT。例如策略一:编写清晰的说明,即在询问中包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”用户意图,所以提问时不要惜字如金,多说一些内容、多提供一些信息能有效提高回复的质量和丰富性。文中还列举了多个例子进行说明。
2025-03-29
有没有识别诈骗的AI工具?
目前有一些识别诈骗的 AI 工具,例如: GPTCHA:这是一款由三位开发者共同搭建的由 GPT4 驱动的小工具,能够拦截可疑电话,并用虚拟声音与呼叫方聊天,直到确认电话合法且安全。您可以通过 http://gptcha.ai/ 了解和使用。 在银行领域,也有利用 AI 检测欺诈的系统,例如相关研究《Artificial Intelligence in Banking Industry:A Review on Fraud Detection,Credit Management,and Document Processing,ResearchBerg Review of Science and Technology,2018》中提到的相关应用。
2025-03-29
智能体的发展方向
智能体的发展方向主要包括以下几个方面: 1. 在品牌卖点提炼中的应用: 构建智能体时,对结构的理解和控制至关重要,可通过不断迭代完善单点。 品牌卖点提炼助手本质是办公助手,能为有营销思维的团队提供思路,提高团队效率。 实际搭建要根据公司业态调整,给智能体更多提示词提升分析合理性,如电商产品和线下实体服务行业的不同触点和人员情况。 营销管理结构化提示词中,不要依赖举例,避免限制 AI 发散思维,智能体作为灵感助手辅助决策。 2. 一分钟提升认知系统: 具有创新性、实用性、互动性和可扩展性。 能为用户提供高效学习体验、满足不同需求、提供个性化学习方案。 未来将进一步完善知识库、引入先进技术、提供更多个性化方案。 注重用户体验,具有强大知识储备和高效学习机制,能提升用户认知水平,有良好扩展性和创新潜力。 3. DeepSeek R1 及智能体: R1 与 V3 效果对比:V3 中规中矩,R1 思考慢但答案更具针对性和实用性。 R1 的推理特点:类似人类慢思考,结合行业特点给出重要事项和先后顺序。 模型的运算原理:快思考是概率预测,慢思考在概率预测基础上做二层逻辑。 不同模型的适用:指令遵循领域 instruct 模型效果好,推理和创造性问题适合慢思考推理模型。 模型的未来发展:DeepSeek R1 的强化学习方式带来新思路,大模型可通过自学习、增流蒸馏等方式进化和迁移知识能力。 大语言模型特点:DeepSeek R1 是纯文本类大语言模型,原生无识别图、读网页等能力。 与聊天机器人区别:网页聊天机器人做了很多智能体处理,大语言模型本身未被训练。 记忆处理方式:有多种实现长记忆的方案。 智能体构成:由让大语言模型感知外部世界的工具、输出结果的能力、记忆世界观的浓缩规划以及大语言模型本身构成。 智能体重要性:未来编程将变成编造智能体,智能体是承载 AI 应用落地的最终形态。
2025-03-29
ai 讲师计划
以下是关于 AI 讲师计划的相关信息: 招募背景: 随着 AIGC 技术的快速发展,传统企业亟需通过 AI 转型实现降本增效与业务创新。工信部大数据产业人才基地计划为传统行业客户提供 AI 技术培训、场景化咨询与解决方案落地服务,现面向通往 AGI 社区招募具备实战经验的 AI 讲师与咨询专家,共同推进企业 AI 化进程。全国高校培训业务也在招募。 涉及业务: 1. 公开课:针对 B 端渠道持续展开公益科普,形式免费,部分渠道有经费。主要内容是企业端的 AI 应用场景案例和 AI 通识类的科普分享,目的是建立与企业渠道之间的信任,构建收费培训/咨询的转化通道。 2. 线下培训:通过培训转化或直接招生,分成两天一夜、三天两夜的培训班,50 人以上开班,建议 100 人。 3. 咨询服务:针对企业的咨询陪跑服务,包括 AI 营销能力搭建,企业客服机器人搭建、企业端内容分析智能体搭建、企业运营数据大盘搭建、无人直播/数字人直播间搭建等。 近期安排: 1. 商会公开课:时间暂定 2.22 日,线上直播(小鹅通/腾讯会议),用户群体是商会会员,大多数规模营收较大,偏传统的制造业、服务业企业居多,共 6000 多家会员单位,公开课主题为《AI 获客》,包括“AI 精准获客”、“AI 内容流量”、“AI 矩阵曝光”、“AI 私域转化”、“AI 自动直播”。 2. 重庆区域公开课:时间暂定 2.9 日,线上直播(小鹅通/腾讯会议),用户群体是重庆地区政府领导、国央企领导、银行领导、部分行业协会领导,共 500 人左右,公开课主题为《Deepseek 引发的商业思考》,包括但不限于“Deepseek 火爆背后的思考”、“deepseek 企业带来的生产力变革”、“AI 企业流量打法”。 3. 民营经济大讲堂:时间与讲师团商量调整,线下付费方式,一场 100 200 人,讲师费用预计在 5000 20000 一场,需要评估讲师的资历和案例,主题包括但不限于 AI 通识培训、AI 企业增长打法等。 4. 省商会公开课:时间待定,可与讲师沟通调整,线上直播(小鹅通/腾讯会议),用户群体是商会会员,大多数规模营收较大,偏传统的制造业、服务业企业居多,公开课主题为《AI 获客》,包括“AI 精准获客”、“AI 内容流量”、“AI 矩阵曝光”、“AI 私域转化”、“AI 自动直播”。 5. saas 平台企业公开课:时间待定,可与讲师沟通调整,线上直播(小鹅通/腾讯会议),用户是 saas 平台上的企业,中小企业居多,主题待定。 6. 杭州市城投线下培训:时间 2 月底,针对城投内部线下培训,付费,主题可与讲师商量,针对通识类和企业流量打法等方向。 讲师介绍: 韦恩,智能体创业者、WayToAGI 共建者、微软提示词工程师、爱问 AI 智能体交付专家、企业级 AI Agent 定制专家,荣获多家 AI 开发平台的比赛奖项,13 年程序开发背景,多家企业的 AI 落地顾问。 承接业务:1v1 辅导、智能体培训、智能体定制开发、企业 AI 项目落地。 课程计划: DAY1:入门,搭建证件照应用,需要有一定的智能体搭建基础。课程回放。 DAY2:进阶,邮票收藏馆搭建,需要有第一天的 AI 应用搭建基础。 课程回放。 您将收获: 1. 全面认识扣子的 AI 应用的底层逻辑。 2. 解决 AI 应用核心卡点:工具栏、表单使用、加载动图、界面布局等卡点。 3. 收获一个价值千元的 AI 应用证件照。
2025-03-29
ai编程蓝皮书
以下是关于“AI 编程蓝皮书”的相关信息: 字节发布全新 AI IDE:Trae,免费使用 Claude,其具有原生中文支持、匠心设计的交互体验等特点。相关内容可参考: 。 2 月 18 日晚 8:00 有关于 Trae 的直播,飞书会议地址:https://vc.feishu.cn/j/254331715 ,相关文档: 。 有人受小红书金句格言卡片启发,思考能否用 AI 编程做出卡片生成工具,并参考了 WaytoAGI 飞书知识库上黄叔的《AI 编程蓝皮书》及相关直播课,了解到目前编程可以用自然语言交互方式实现,清晰向 AI 说明需求很重要以及调用 API 等知识。
2025-03-29