Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我刚刚对open ai有了基本理解,我该如何进阶学习

Answer

以下是为您提供的进阶学习 OpenAI 的建议:

  1. 系统学习 API 相关知识:深入了解 API 的工作原理、接口规范、数据传输等方面的内容。
  2. 实践练习:在网上寻找可用的 API 进行实际操作和练习。
  3. 挖掘 GPT Action 的更多潜力:探索其更多的功能和应用场景。
  4. 构建知识体系:通过不同的教程和资料,识别知识之间的共性和逻辑关系,深化对主题的理解。
  5. 了解 OpenAI 的模型数据和训练:例如 GPT-4.5 是通过扩展无监督学习和思维链推理等范式来提升 AI 能力,以及新的对齐技术如何促进更好的人机协作等。
  6. 参考相关资料:查看官方 cookbook、万字长文回顾等历史脉络内容,以及入门经典必读和面向开发者的文章。
  7. 从国内模型工具入手:先熟悉国内免费的模型工具,例如从提示词开始学习。掌握结构化提示词的优势,学会清晰地与模型对话。
Content generated by AI large model, please carefully verify (powered by aily)

References

总结一下:今天我们的讨论起始于人工智能中的“Agent&Action”,然后转向OpenAI对智能体(Agent)能力模型的定义。接着,我们深入探讨了ChatGPT中的Action(搜索、画图、代码解释器),以及GPT系列中的不同Action。使用了一个容易上手的Action Webpilot,用于访问网页获取实时的文本内容。最后,我们初步了解了API的概念,以及GPT如何通过Action与外部数据进行交互和使用。如果对Action很感兴趣,你可以从以下方向开始继续前进:系统的了解和学习API相关的知识去网上寻找可以用的API来练习发掘GPT Action更多的潜力以上是我认为相对容易入门的知识框架,但是我们都知道:你不可能只在一次分享/一篇文章中就获得完整的Action相关知识学习虽然没有终点,但有阶段性目标。大家可以通过后续看到的不同的教程和资料,识别这些知识之间的共性和逻辑关系,然后继续深化对这个主题的理解,构建你自己的知识体系。如果你对GPT开发有兴趣,想要认识更多玩GPT的朋友,欢迎加入GPTGeeker的星球:

gpt-4-5-system-card.pdf

Pushing the frontier of unsupervised learningWe advance AI capabilities by scaling two paradigms:unsupervised learning and chain-of-thought reasoning.Scaling chain-of-thought reasoning teaches models to think before they respond,allowing them to tackle complex STEM or logic problems.In contrast,scaling unsupervised learning increases world model accuracy,decreases hallucination rates,and improves associative thinking.GPT-4.5 is our next step in scaling the unsupervised learning paradigm.New alignment techniques lead to better human collaborationAs we scale our models,and they solve broader,more complex problems,it becomes increasingly important to teach them a greater understanding of human needs and intent.For GPT-4.5 we developed new,scalable alignment techniques that enable training larger and more powerful models with data derived from smaller models.These techniques allowed us to improve GPT4.5’s steerability,understanding of nuance,and natural conversation.1Internal testers report GPT-4.5 is warm,intuitive,and natural.When tasked with emotionallycharged queries,it knows when to offer advice,diffuse frustration,or simply listen to the user.GPT-4.5 also shows stronger aesthetic intuition and creativity.It excels at helping users with their creative writing and design.GPT-4.5 was pre-trained and post-trained on diverse datasets,including a mix of publicly available data,proprietary data from data partnerships,and custom datasets developed in-house,which collectively contribute to the model’s robust conversational capabilities and world knowledge.Our data processing pipeline includes rigorous filtering to maintain data quality and mitigate potential risks.We use advanced data filtering processes to reduce processing of personal information when training our models.We also employ a combination of our Moderation API and safety classifiers to prevent the use of harmful or sensitive content,including explicit materials such as sexual content involving a minor.

01-通往AGI之路知识库使用指南

[heading2]智能章节本章节提到若想深入学习内容可查看官方cookbook,还有创作者将内容做成可视化形式,后续会发到群里。另外整理了open AI的发展时间线、万字长文回顾等历史脉络内容,入门经典必读和面向开发者的文章值得阅读,欢迎上传相关PPT用作参考。[55:39](https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=3339000)学习过程中账户投资,可先从国内模型工具入手本章节AJ提出某些内容直接拿去可能有问题,提到了于一同学,并表示要更新过学习过程中账户投资金额相关内容。还指出学习可以先从国内模型工具入手,不花钱,若想进阶再考虑高阶方向,若想深入学习美学概念和操作可报野菩萨课程,那是AJ的启蒙老师。[56:40](https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=3400000)国内大语言模型工具好用,学习从提示词开始本章节主要提到若想深入使用某些工具可能需支出费用,但国内新工具已好用。接着要跟大家讲解prompt怎么写,会收录经典结构,强调与模型对话时要把话说清。还提及可从温达、李弘毅老师课程等学习入门,但与大语言模型相关建议从提示词开始。[58:08](https://waytoagi.feishu.cn/minutes/obcn7mvb3vu6k6w6t68x14v5?t=3488000)提示词在与各类模型对话中的重要性及结构化提示词的优势

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
OpenManus
以下是关于 OpenManus 的相关信息: 比赛说明: 赛道一 OpenManus 效果 规则:自由修改代码,复现 Manus 原版某一方面的效果,可参考 12 个精选 Case。可以选择优化某类任务下执行的效果、优化前端页面或复刻宣传效果等,方向不限。 规模:队伍规模在 1 3 人之间。 评判:由组委会评委与大众人气投票热度评分,比例 8:2。 奖项:一、二、三等奖。 赛道二 OpenManus 创意 规则:自由修改代码,通过任何手段或工具,使用 OpenManus 得到有趣效果,完成有趣任务。 规模:队伍规模在 1 3 人之间。 评选规则:由组委会评委与大众人气投票热度评分,比例 2:8。 奖项:一、二等奖。 时间表: 线上启动:2025 年 3 月 21 日,线上启动会。 报名时间:3 月 20 日 3 月 28 日。 比赛阶段:3 月 21 日 4 月 3 日。 提交截止:4 月 3 日 23:59。 人气评审阶段:4 月 4 日 4 月 8 日 23:59,作品线上展示,大众投票。 结果公布&颁奖:4 月 10 日。 趋势研究: Manus 注重实用性和用户体验,目前虽为内测阶段但已计划开源部分模型以构建生态影响力。受其启发,开源社区涌现了如 OpenManus、OWL 等快速复刻的项目。多智能体的协作机制成为业界热点,通过让不同专长的 Agent 各司其职、相互通信,一个 AI 系统可以具备更大的灵活性和扩展性。例如,复杂业务流程中的不同环节可由不同 Agent 完成,再由调度 Agent 统筹协调。这种架构在一定程度上模拟了人类团队协作的问题求解方式,被认为是迈向更通用智能的重要路径。Anthropic 也在其 Agent 研发中引入类似理念,区分“Workflow”(固定流程)和“Agent”(自主决策流程)的概念,指出当任务复杂度和不确定性较高时,应让 LLM 自行规划调用工具,而非预设流水线。总之,多 Agent 系统通过模块化分工+自主协调,提升了大型任务的可管理性和成功率,已成为 2025 年 Agent 系统设计的主流思路之一。 开发进展: 距离 OpenManus 开源第一天已过去 12 天,收获了大量关注和 37k stars。在此期间不断完善和优化,包括修复已知 bug、兼容不同 LLM 调用方式、优化基础 Manus 的各类工具等,现已迭代完成基础稳定版的开发,并举办了 OpenManus Hackathon 比赛,邀请充满好奇心的小伙伴参加,展示创造力和想象力。
2025-04-11
OpenAI Operator, Anthropic Claude Coder
以下是关于 OpenAI Operator 和 Anthropic Claude Coder 的相关信息: 2025 年 Agent 领域的发展预测: 从对话助手到行动型智能体是 2025 年 Agent 技术的主流发展方向之一。计算机操作能力取得突破,传统大模型更多充当聊天助手,而 2025 年的突破在于让 Agent 直接“动手”操作电脑和网络环境。 Anthropic 在 2024 年底发布的 Claude 3.5 Sonnet 首次引入“Computer Use”能力,让 AI 像人一样通过视觉感知屏幕并操作鼠标键盘,实现了 AI 自主使用电脑的雏形。 OpenAI 在同期推出了代号“Operator”的 Agent 及其核心模型“计算机使用智能体”(CUA),使 GPT4 获得直接与图形界面交互的能力。CUA 通过强化学习将 GPT4 的视觉能力与高级推理相结合,训练 AI 可像人一样点击按钮、填表、滚动页面等。在 OpenAI 的测试中,CUA 在浏览器任务基准 WebArena 和 WebVoyager 上分别达到 38.1%和 87%的成功率,后者已接近人类水平。 其他相关信息: 宝玉日报 1 月 25 日: Deepseek 提示词框架包含四大模块:任务目的(Purpose)、计划规则(Planning Rules)、格式规则(Format Rules)、输出说明(Output)。 Anthropic 的 Claude 可通过屏幕截图获取计算机视觉信息,计算光标移动的像素坐标,并执行点击、滚动等操作。 OpenAI Operator 利用虚拟主机和 Chrome 浏览器,通过 CUA 实现网页实时操作,支持复杂任务导航。 主要的大语言模型: OpenAI 系统包括 3.5 和 4 等,3.5 模型在 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。新的变种使用插件连接到互联网和其他应用程序。Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。未为 OpenAI 付费只能使用 3.5。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,连接到互联网。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是 PaLM 2 模型。 Anthropic 发布了 Claude 2,其最值得注意的是有一个非常大的上下文窗口。
2025-04-01
openai官方文档
以下是关于 OpenAI 官方文档的相关信息: 对于刚入门学习提示词的朋友,建议先有一个大模型帐号并熟悉与之对话的方式。推荐的国产平替有 。 学习 prompt 必须看 OpenAI 的官方文档,相关链接有: 。 在 OpenAI 官方的说明文档(Documentation)中,为用户提供了若干项策略以帮助更好地使用 ChatGPT。例如策略一:编写清晰的说明,即在询问中包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”用户意图,所以提问时不要惜字如金,多说一些内容、多提供一些信息能有效提高回复的质量和丰富性。文中还列举了多个例子进行说明。
2025-03-29
@ 在cherry studio可以是你openrouter的API吗?
在 Cherry Studio 中,不能直接将 @ 作为 OpenRouter 的 API。OpenRouter 有一些特定的使用方式和条件。 例如,Zeabur 模版自带 oneapi,支持一键部署。但想要同时使用 openrouter 和 simpleoneapi 需安装 cline 插件,将 openrouter api 放到 cline,再把 Cursor 设置换成 simpleoneapi,这样基本能在 Cursor 里使用全系大模型。 OpenRouter 新发布了 BYOK(Bring Your Own API Keys)功能,这是个第三方 Key 集成功能,能将 xAI、OpenAI、Mistral 等数十个平台的 Key 集中在一起,还能同时使用其他平台和 OpenRouter 的额度。目前支持白“赚”的平台包括 AI Studio/Cohere/DeepSeek/Mistral/SambaNova/Together/xAI 等。 在使用 OpenRouter 集成 API Key 时,不仅能整合免费额度,还能解放更多槽位。但在 Cursor 的设置里,deepseek 会与 gpt 的配置发生冲突,同一时间最多只能使用 4 个类型的模型。 如果觉得 OpenRouter 支持的模型不够,还可以使用 simpleoneapi。不过 simpleoneapi 不像 openrouter 支持直接在线配置多个 Key,熟悉代码的可以通过本地或者 Docker 启动。 另外,在进行相关实验时,需要准备本地安装好的 VS Code,在 VS Code 中安装 Cline(MCP 客户端之一),还需要注册 Cloudflare 和 Openrouter,在 Openrouter 注册后在 Keys 中申请一个 API key 并妥善保存。
2025-03-24
OpenAI o1、Claude Sonnet 3.7、Gemini 2.0 pro 哪个 AI 搜索能力更强?
OpenAI o1、Claude Sonnet 3.7 和 Gemini 2.0 pro 在不同方面具有各自的优势,难以简单地比较哪个的搜索能力更强。 OpenAI o1 推理能力强,适合作为架构师或算法顾问。 Claude Sonnet 3.7 擅长长上下文任务,在快速生成代码与网页设计方面表现出色。 Gemini 2.0 pro 长上下文支持较好(2M Tokens),适合代码反编译与混淆代码分析。 具体的搜索能力表现还会受到应用场景和具体任务的影响。
2025-03-21
openmanus
以下是为您整合的相关内容: 2025 年 3 月 7 日的通用智能体 Manus/Flowith/OpenAI Deep Research/OWL/openManus 案例和测评:AJ 组织会议邀请大家测评交流。李浩文分享用 Manus 优化工作流的案例,Manus 给出的方案与他想法高度吻合,涵盖模型、Lora、control net 等方面,效果惊艳,但部分参数需自行测试。他还展示新工作流效果,分享交流方式,AJ 期待其开源,随后准备邀请陈然介绍案例。宁晨然分享多个 AI 使用案例,包括让 AI 调研奥斯卡趋势图,处理财报数据任务表现出色,但做 Web SOCKET 代码任务出现 Badcase。还提到 AI 交互性好,可随时中断聊天,且能拒绝不合理请求。最后 AJ 表示会请 camera AI 的国豪老师分享,还谈及皮皮老师抢到码的趣事。赵悦分享与 Manus 交互案例及探讨优化,即将迎来国豪老师团队分享。 Suno 音乐风格字典中的 STYLE TAGs(风格标签)O 部分:Obedient 顺从的、Objective 客观的、Obliging 乐于助人的、Obscure 模糊的、Observant 注意的、Obsessed 着迷的、Obsessional 痴迷的、Obsolete 过时的、Obstinate 固执的、Obtuse 迟钝的、Obvious 明显的、Occasional 偶尔的、Occupational 职业的、Oceanic 海洋的、Odd 奇怪的、Offbeat 不寻常的、Official 官方的、Oily 油腻的、Ominous 不祥的、Omnipotent 全能的、Omniscient 无所不知的、Onpoint 中肯的、Ongoing 进行中的、Onset 开始、Open 开放的、Openended 开放式的、Operatic 歌剧的、Opportune 适时的、Opposite 相反的、Optimal 最佳的、Optimistic 乐观的、Optional 可选的、Opulent 富丽堂皇的、Oracular 神谕的、Orbital 轨道的、Orchestrated 精心策划的、Orderly 井然有序的、Organic 有机的、Organizational 组织的、Oriented 定向的、Original 原始的、Ornamental 装饰性的、Oscillating 摆动的、Otherworldly 超凡脱俗的、Outgoing 外向的、Outlandish 奇异的、Outlined 简要说明的、Outrageous 可恶的、Outstanding 杰出的、Oval 椭圆形的、Overarching 涵盖一切的、Overdriven 过度推动的、Overflowing 满溢的、Overjoyed 非常高兴的、Overlapping 重叠的、Overloaded 过载的、Overlooked 被忽视的、Overpowering 压倒性的、Overwhelming 压倒性的。 3 月 5 日的 XiaoHu.AI 日报:OpenAI 计划推出三种不同级别的 AI 代理服务,针对不同用户群体和需求,分别为 2000 美元/月面向“高收入知识工作者”的代理,适用于一般知识型任务;10000 美元/月面向软件开发的代理,能够自动化编码工作;20000 美元/月具备“博士级”研究能力的顶级代理,可执行复杂的分析和研究任务。这一定价远超 ChatGPT Plus 订阅(20 美元/月)或 ChatGPT Team(25 美元/月),显示 OpenAI 对其 AI 代理能力的高度自信。此外,OpenAI 预计这些代理产品未来可能占公司收入的 20 25%。Manus 不仅可以解答问题,还能自动分析并执行任务,直接交付最终结果。
2025-03-15
介绍AI进阶操作
以下是关于 AI 进阶操作的介绍: 在 Obsidian 中使用 AI 工具的进阶配置方法包括: 1. 笔记仓库嵌入大模型(Copilot) 2. 笔记内容作为 RAG 嵌入大模型(Smart Conections) 3. 笔记内使用大模型编写内容 在 Liblibai 中,有以下进阶概念和功能: 1. 迭代步数:调整图片内容的次数,并非越多越好,效果提升非线性。 2. 尺寸:影响图片生成的大小,需适中选择,高清图可设置中等尺寸并用高分辨率修复。 3. 生成批次:用本次设置重复生成的图批次数。 4. 每批数量:每批次同时生成的图片数量。 5. 提示词引导系数:影响图像与 prompt 的匹配程度,过高会使图像质量下降。 6. 随机数种子:固定后可对图片进行“控制变量”操作。 7. ADetailer:面部修复插件,高阶技能。 8. ControlNet:控制图片中特定图像,高阶技能。 9. 重绘幅度:图生图时,幅度越大,输出图与输入图差别越大。 此外,杭州站的 AI 活动聚焦在动手操作上,共分为 5 天进行,被定义为带领大家进阶玩转 AI 的实操落地活动,从学习写 prompt 到生成图片再到分组成立项目,活动形式丰富多样,难度和节奏层层递进。
2025-03-04
coze的进阶教程有哪些,我需要有整个的搭建过程教程的,可以是共学活动里面的
以下是一些 Coze 的进阶教程和搭建过程的资源: 5 月 7 号():大聪明分享,主题为“Agent 的前世今生”,每个分享人分享最初接触 Coze 的经历以及现在用 Coze 做什么。流程为 20:00@?AJ 主持开场,20:00 21:00 大聪明分享,21:00 21:30 关于 Coze 随便聊聊。 5 月 8 号():大圣分享,主题为“我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze”,20:00 21:20 大圣分享。 5 月 9 号():艾木分享,主题为“Agent 系统的核心构成:Workflow 和 Multiagent Flow(以‘Dr.Know’和‘卧底’为例),线上答疑。流程为 20:00 21:00 艾木分享,21:00 21:30 线上答疑。 5 月 10 号():罗文分享,主题为“一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书”,20:00 21:00 罗文分享。 5 月 11 号():Itao 分享,主题为“和 AI 成为搭子”,线上答疑。流程为 20:00 21:00 Itao 分享,21:00 21:30 线上答疑。 此外,还有以下案例合集和教程:
2025-02-22
我想从普通的功能型产品经理转变为AI应用产品经理,应该怎么进阶,需要掌握什么能力?
要从普通的功能型产品经理转变为 AI 应用产品经理,可以从以下几个方面进阶并掌握相应能力: 一、不同阶段的能力要求 1. 入门级 能通过 WaytoAGI 等开源网站或一些课程了解 AI 的概念。 使用 AI 产品并尝试动手实践应用搭建。 2. 研究级 技术研究路径或商业化研究路径。 对某一领域有认知,能根据需求场景选择解决方案。 利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用级 有一些成功落地应用的案例,产生商业化价值。 二、AI 产品经理与传统互联网产品经理层级对应 传统互联网产品经理层级: 1. 负责功能模块与执行细节。 2. 负责整体系统与产品架构。 3. 熟悉行业竞争格局与商业运营策略。 三、AI 产品经理需掌握的能力 1. 懂得技术框架,对技术边界有认知,最好能知道一些优化手段和新技术的发展。 2. 理解产品核心技术,了解基本的机器学习算法原理,做出更合理的产品决策。 3. 与技术团队有效沟通,掌握一定的算法知识,减少信息不对称带来的误解。 4. 评估技术可行性,在产品规划阶段做出更准确的判断。 5. 把握产品发展方向,了解算法前沿。 6. 提升产品竞争力,发现产品的独特优势,提出创新的产品特性。 7. 具备数据分析能力,很多 AI 算法都涉及到数据处理和分析。 四、其他能力 1. 语言学能力,锻炼语言表述能力,更精准地用语言描述问题。 2. 业务理解和 AI 嵌入能力,找到业务中需要应用大模型的场景,将业务和大模型算法结合,理解模型在业务中的边界。 3. 维度转换能力,将各种问题、业务数据转化为语言描述,将通用模块问题转化为通用问题模块。 总之,AI 产品经理要关注场景、痛点、价值,不断提升自身能力,以适应市场需求。
2025-02-06
总结一下当前AI发展现状以及指导非开发者一类的普通用户如何使用及进阶使相关工具
当前 AI 发展现状: 涵盖了不同领域的应用和发展,如电子小说行业等。 包括了智能体的 API 调用、bot 串联和网页内容推送等方面。 对于非开发者一类的普通用户使用及进阶相关工具的指导: 可以先从国内模型工具入手,这些工具不花钱。 学习从提示词开始,与模型对话时要把话说清,强调提示词在与各类模型对话中的重要性及结构化提示词的优势。 对于技术爱好者:从小项目开始,如搭建简单博客或自动化脚本;探索 AI 编程工具,如 GitHub Copilot 或 Cursor;参与 AI 社区交流经验;构建 AI 驱动的项目。 对于内容创作者:利用 AI 辅助头脑风暴;建立 AI 写作流程,从生成大纲开始;进行多语言内容探索;利用 AI 工具优化 SEO。 若想深入学习美学概念和操作可报野菩萨课程。国内模型指令遵循能力较弱时,可使用 launch BD 尝试解决。
2025-01-31
我是一名一线教师,想要学习如何搭建智能体。请跟我一起制定合适的进阶路径和推荐资源链接。
以下是为您制定的学习搭建智能体的进阶路径和推荐资源链接: 进阶路径: 1. 注册智谱 Tokens 智谱 AI 开放平台:https://bigmodel.cn/ 新注册用户可获得 2000 万 Tokens。 可通过充值/购买多种模型的低价福利资源包,如直接充值现金,所有模型可适用:https://open.bigmodel.cn/finance/pay ;免费 GLM4Flash 语言模型/ 。所有资源包购买地址:https://bigmodel.cn/finance/resourcepack 。 共学营报名赠送资源包。 2. 先去【财务台】左侧的【资源包管理】查看自己的资源包,本次项目会使用到的有 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 模型。 3. 进入智能体中心我的智能体,开始创建智能体。此流程会手把手进行编辑,完成一个简单智能体的搭建。 推荐资源链接: 1. 智谱 BigModel 共学营第二期:把您的微信变成超级 AI 助理 https://bigmodel.cn/ 2. 教师的 AI 减负指南 3. 提示词培训课——Part2 在搭建智能体的过程中,您需要像导演一样,编排具体流程,检查结果,修改流程,反复迭代。提示语的核心是逻辑,要将复杂的任务拆分成科学合理的步骤,并且让前一步的结果都成为后一步的基础。同时,不要害怕犯错,每一次尝试都是向成功迈进的一步。
2024-12-30
我现在是一个AI小白,我想学习AI相关知识,我要怎么进阶学习?
对于 AI 小白的进阶学习,您可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能、机器学习、深度学习等主要分支及其之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,因其上手容易且实用。 4. 实践和尝试: 理论学习后,通过实践巩固知识,尝试使用各种产品创作自己的作品。 分享实践后的经验和成果。 5. 体验 AI 产品: 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获取实际应用中的体验,激发对 AI 潜力的认识。 同时,您还需要掌握以下基础知识: AI 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。
2024-11-14
我现在是一个完完全全的新手,我现在想要从0开始学习ai,请你协助我,我该怎么做
对于完全的新手想要从 0 开始学习 AI,建议您按照以下步骤进行: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您可以找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-04-11
我想从零基础学习成为一名ai产品经理,我该学习哪些知识内容,请把这些知识内容做个排序。
以下是从零基础学习成为一名 AI 产品经理所需学习知识内容的排序: 1. 入门级: 通过 WaytoAGI 等开源网站或一些课程了解 AI 的概念。 使用 AI 产品并尝试动手实践应用搭建。 2. 研究级: 技术研究路径:对某一领域有认知,根据需求场景选择解决方案,利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 商业化研究路径:熟悉行业竞争格局与商业运营策略。 3. 落地应用: 有一些成功落地应用的案例,产生商业化价值。 同时,AI 产品经理还需要具备以下技能和知识: 1. 理解产品核心技术:了解基本的机器学习算法原理,有助于做出更合理的产品决策。 2. 与技术团队有效沟通:掌握一定的算法知识,减少信息不对称带来的误解。 3. 评估技术可行性:在产品规划阶段,能准确评估某些功能的技术可行性。 4. 把握产品发展方向:了解算法前沿,更好地把握产品的未来发展方向。 5. 提升产品竞争力:发现产品的独特优势,提出创新的产品特性。 6. 数据分析能力:掌握相关知识,提升数据分析能力。 此外,了解技术框架,对技术边界有认知,关注场景、痛点、价值也是很重要的。
2025-04-08
我是一个小白,我该如何从0学起
如果您是零基础小白想要学习 AI 相关知识,可以参考以下建议: 1. 对于 AI 提示词工程师方向: 可以在网上寻找基础课程进行学习。 观看一些科普类教程,例如相关的优质视频。 阅读 OpenAI 的文档,理解每个参数的作用和设计原理。 推荐使用一些练手的 Prompt 工具,并参考相关教程文档。 注意公司对该岗位的综合能力要求较高,需要具备敏捷的产品嗅觉等。 2. 对于 AI 图像生成方面: 可以学习生成式 AI 的相关知识,例如参考《生成式 AI 导论 2024》李宏毅的学习笔记。 了解 AI 生图,参考 Introduction to Image Generation Google AI 课程的学习笔记。 对于制定学习计划,可以参考 ,做到逐步推进问题,明确每日投入时间和每周资源,并根据自身情况增加学习成果评估要求。
2025-04-07
我该如何利用AI完成毕业论文
利用 AI 完成毕业论文可以从以下几个方面入手: 一、格式方面 1. 您可以自定义格式模板,实现格式自动调整。通过学校教务系统查询相关要求,例如本科和硕士研究生学位论文的格式规范,包括标题级别(如四级标题、五级标题)、字体(如宋体、小四)、行间距(如 1.5 倍)等。 2. 一些工具如 LaTeX 和 Overleaf 可以帮助高效处理论文格式和数学公式,提供丰富的模板库和协作功能,简化论文编写过程。 二、写作辅助工具 1. 文献管理和搜索: Zotero 结合 AI 技术,可自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar 是由 AI 驱动的学术搜索引擎,能提供相关文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly 通过 AI 技术提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot 基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab 提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro 用于数学建模和优化,帮助进行复杂的数据分析和模型构建。 4. 研究伦理和抄袭检测: Turnitin 是广泛使用的抄袭检测工具,确保论文的原创性。 Crossref Similarity Check 通过与已发表作品比较,检测潜在抄袭问题。 三、避免过度依赖 AI 1. 始终明确 AI 是辅助手段,例如在写论文时,用 AI 校对格式、润色语法,但选题、新见解、论证框架等核心创作环节要自己完成。 2. 在工作中,用 AI 汇总数据、生成报告初稿,但最后的商业决策要经过自己的分析和定夺。 3. 在与 AI 互动中主动思考,如问完问题后对比自己和 AI 的回答,思考 AI 答案的新颖或不足之处。 4. 利用 AI 检查漏洞,完善自己的思考。 需要注意的是,使用这些工具时,要结合自己的写作风格和需求,选择最合适的辅助工具。同时,内容由 AI 大模型生成,请仔细甄别。
2025-04-02
我该如何学习AGI,请给我规划一条可行的学习之路
以下是为您规划的学习 AGI 的可行之路: 1. 应用方面: 深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用并用于解决实际问题或提升效率。 2. 分析方面: 大量阅读各类文章、视频以及行业报告,理解各知识之间的关系。 3. 记忆方面: 先从 AI 的历史、基本术语、重要人物、方法和原理等开始了解,查看入门课程。 具体的学习资源包括: 关于 Prompt 的了解:https://ywh1bkansf.feishu.cn/wiki/Q5mXww4rriujFFkFQOzc8uIsnah?table=tbldSgFt2xNUDNAz&view=vewo2g2ktO 适合的 AI 对话:https://ywh1bkansf.feishu.cn/wiki/QddLw0teKi7nUCkDRIecskn3nuc 绘画相关:https://ywh1bkansf.feishu.cn/wiki/Q5ddwxfkMiVUZBkQXN7cgXf4nOb 语音相关:https://ywh1bkansf.feishu.cn/wiki/ZXPiw2OuLi2YsxkkmaLcPTyInrc AI 历史:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbl1tOC3ZKbrcHVn&view=vewTtypUZc 基本术语:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbltvr7KExCt7Jpw&view=vewjxk9tDu 重要人物:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblLtN12KuvP5reO&view=vewuvGBXhd 方法和原理:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblolGx2mprs1EQz&view=vewx5ROYtl 入门课程:https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w
2025-03-28
我该如何从零基础,系统学习AI类工具?我的目标是熟练制作AI视频
以下是从零基础系统学习 AI 类工具并熟练制作 AI 视频的步骤: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,在使用 AI 工具时,以下是一些相关的资源和建议: 想出点子:最佳免费选项为4.0,但由于与互联网连接,必应可能更好。 制作视频:最佳动画工具为用于在视频中为人脸制作动画的。 同时,要注意深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。
2025-03-24