Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

OPenAI最近的产品发布会

Answer

OpenAI 近期举行了多次产品发布会:

  • 去年 11 月晚些时候发布了基于 GPT-3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。
  • 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。
  • 在 5 月份的 GPT-4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT-4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
Content generated by AI large model, please carefully verify (powered by aily)

References

OpenAI 真正想要什么 | WIRED

去年11月之前,人们对OpenAI的了解主要局限于技术和软件开发领域。但现在全世界都知道,OpenAI在当月晚些时候发布了一款基于GPT-3.5最新版本的消费级产品。几个月来,公司内部一直在使用带有对话界面的GPT版本。这对于该公司所谓的“寻求真相”尤为重要。这意味着,通过对话,用户可以哄骗模型提供更可信、更完整的回答。为大众而优化的ChatGPT可以让任何人只需输入提示信息,就能立即利用似乎无穷无尽的知识源,然后继续对话,就像与一个碰巧无所不知的人类同伴闲聊一样,尽管他也有捏造事实的嗜好。在OpenAI内部,对于是否应该发布这样一款功能空前强大的工具,人们争论不休。但Altman对此表示支持。他解释说,这次发布是一项战略的一部分,旨在让公众适应AI注定会改变他们日常生活的现实,而且可能是为了更好地生活。在公司内部,这被称为“迭代部署假设”。当然,ChatGPT会引起轰动。毕竟,这是一个任何人都能使用的东西,它足够聪明,能在SAT考试中获得大学水平的分数,能写出B-minus的作文,还能在几秒钟内总结出一本书的内容。你可以让它为你撰写融资提案或会议摘要,然后要求它用立陶宛语、莎士比亚十四行诗或痴迷玩具火车的人的口吻进行改写。几秒钟后,大型语言模型就会满足你的要求。太疯狂了。不过,OpenAI将其视为其更新、更连贯、能力更强、更可怕的后继者GPT-4的台标,据说GPT-4是用1.7万亿个参数训练出来的。(OpenAI不会证实这个数字,也不会透露数据集)。

通往 AGI 之路

《[超级智能才是未来,OpenAI的连续剧发布会哪些是真创新?哪些是营销噱头?](https://mp.weixin.qq.com/s/pao8SOvwkAMxB--VPSqqZw)》OpenAI近期举行了12场发布会,推出了多个新产品,包括推理模型o1、文字转视频工具Sora等。o1的正式版在复杂推理和数学能力上显著提升,尤其是在数学竞赛问题中的表现优于人类专家。同时,推出的强化微调技术使模型更具专业性。然而,研究显示,AI在某些任务中可能采取欺骗行为,反映出其自主思考的潜在风险。《[微软CEO纳德拉最新两万字洞察:C端Agent商业模式仍需摸索,广告流量模式或面临转变,B端关键在生态集成](https://mp.weixin.qq.com/s/It3xs5joaxYIHw6V2DKHRA)》微软CEO Satya Nadella在近日与硅谷知名投资人Brad Gerstner以及Bill Gurley讨论了微软的战略转型、对OpenAI投资以及智能体(Agent)的未来,全文两万字。Nadella认为,当前AI领域的竞争将不再是赢家通吃,而是多个企业在不同层次的技术领域展开激烈角逐。

AI 时代的教育 The Intelligence Age's Education - 知乎

作为教育行业的一名从业者,我个人是非常期待有一款划时代意义的AI教育产品能从技术上对教育场景做一次深入的赋能的。但是下一代的AI教育产品应该是什么形态?ta应该拥有什么样的功能?重点去解决哪些问题?用什么样的形态与用户进行交互?仅就目前的市场情况来看,我还没有看到一款真正属于AI时代的学习产品的诞生,无论是学习机,学习笔的硬件还是各种网站或APP的软件,我认为都没有达到我个人对下个时代AI学习产品的想象。比如国内一线品牌的众多学习机类产品,硬件形态都是pad,交互方式仍是传统的APP形式。这种产品形态即使拥有了LLM在产品力上的加持,但是对于用户而言,依然略显冰冷僵硬缺乏温度。科大讯飞AI学习机——图源自科大讯飞官网那么除了类ipad这种学习机的产品形态之外,是否还有其他可能?这个问题在openAI于5月份的GPT-4o模型发布会上,邀请了可汗学院的创始人Salman Khan和他儿子一起使用了GPT-4o辅导孩子在可汗学院上做数学题,一步步启发纠正,各种鼓励,比普通家长辅导效果可能真的要好不少!这可以说是openai第一次将多模态模型能力在教育场景上落地应用的尝试。虽然演示视频中仍然是以一台搭载了GPT4o的ipad作为使用终端,但是我个人觉得这种产品形态应该并非是最终的版本答案。

Others are asking
OpenAI Operator, Anthropic Claude Coder
以下是关于 OpenAI Operator 和 Anthropic Claude Coder 的相关信息: 2025 年 Agent 领域的发展预测: 从对话助手到行动型智能体是 2025 年 Agent 技术的主流发展方向之一。计算机操作能力取得突破,传统大模型更多充当聊天助手,而 2025 年的突破在于让 Agent 直接“动手”操作电脑和网络环境。 Anthropic 在 2024 年底发布的 Claude 3.5 Sonnet 首次引入“Computer Use”能力,让 AI 像人一样通过视觉感知屏幕并操作鼠标键盘,实现了 AI 自主使用电脑的雏形。 OpenAI 在同期推出了代号“Operator”的 Agent 及其核心模型“计算机使用智能体”(CUA),使 GPT4 获得直接与图形界面交互的能力。CUA 通过强化学习将 GPT4 的视觉能力与高级推理相结合,训练 AI 可像人一样点击按钮、填表、滚动页面等。在 OpenAI 的测试中,CUA 在浏览器任务基准 WebArena 和 WebVoyager 上分别达到 38.1%和 87%的成功率,后者已接近人类水平。 其他相关信息: 宝玉日报 1 月 25 日: Deepseek 提示词框架包含四大模块:任务目的(Purpose)、计划规则(Planning Rules)、格式规则(Format Rules)、输出说明(Output)。 Anthropic 的 Claude 可通过屏幕截图获取计算机视觉信息,计算光标移动的像素坐标,并执行点击、滚动等操作。 OpenAI Operator 利用虚拟主机和 Chrome 浏览器,通过 CUA 实现网页实时操作,支持复杂任务导航。 主要的大语言模型: OpenAI 系统包括 3.5 和 4 等,3.5 模型在 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。新的变种使用插件连接到互联网和其他应用程序。Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。未为 OpenAI 付费只能使用 3.5。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,连接到互联网。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是 PaLM 2 模型。 Anthropic 发布了 Claude 2,其最值得注意的是有一个非常大的上下文窗口。
2025-04-01
openai官方文档
以下是关于 OpenAI 官方文档的相关信息: 对于刚入门学习提示词的朋友,建议先有一个大模型帐号并熟悉与之对话的方式。推荐的国产平替有 。 学习 prompt 必须看 OpenAI 的官方文档,相关链接有: 。 在 OpenAI 官方的说明文档(Documentation)中,为用户提供了若干项策略以帮助更好地使用 ChatGPT。例如策略一:编写清晰的说明,即在询问中包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”用户意图,所以提问时不要惜字如金,多说一些内容、多提供一些信息能有效提高回复的质量和丰富性。文中还列举了多个例子进行说明。
2025-03-29
OpenAI o1、Claude Sonnet 3.7、Gemini 2.0 pro 哪个 AI 搜索能力更强?
OpenAI o1、Claude Sonnet 3.7 和 Gemini 2.0 pro 在不同方面具有各自的优势,难以简单地比较哪个的搜索能力更强。 OpenAI o1 推理能力强,适合作为架构师或算法顾问。 Claude Sonnet 3.7 擅长长上下文任务,在快速生成代码与网页设计方面表现出色。 Gemini 2.0 pro 长上下文支持较好(2M Tokens),适合代码反编译与混淆代码分析。 具体的搜索能力表现还会受到应用场景和具体任务的影响。
2025-03-21
openai deep research使用技巧
OpenAI 的 Deep Research 功能能够整合多源信息,进行复杂的信息查询与分析,并生成专业水准的报告,同时详细展示思考和搜索过程。目前,该功能仅支持文本输出,未来还将增加嵌入式图片、数据可视化等功能。使用入口为在 ChatGPT 输入框中选择「Deep Research」模式,输入问题后即可开始体验。 在 OpenAI 推出「Deep Research」功能一天后,Hugging Face 的工程师迅速联合推出了免费开源的版本 Open Deep Research,能自主浏览网页、滚动页面、处理文件,以及基于数据进行计算。使用入口为前往 Demo 网站(opendeepresearch.vercel.app)体验。 Deep Research 让 AI 自动完成多步骤研究任务,快速分析海量信息并生成专业报告,具备自动化信息汇总、文献引用与多领域适用性,适合科研、工程、金融等行业。目前向 Pro 用户开放,未来将扩展至 Plus 和 Team 用户,并提供更强大的功能。 该智能体基于优化版 OpenAI o3 模型,结合网络浏览和 Python 分析能力,实现高效研究,适用于科学、政策、工程等高强度知识工作,也能帮助购物者做复杂决策。Pro 用户已可使用,后续将逐步向 Plus、Team 和企业用户开放。
2025-03-08
openAI的deep research有哪些缺陷
OpenAI 的 Deep Research 存在以下一些缺陷: 1. 具有滞后性,在某些信息上无法做到及时更新。 2. 存在信息混乱的问题,无法完全替代人类的深度思考。
2025-03-03
Monica和Openai的记忆功能是如何让大模型产生记忆的?是什么原理?
大模型的记忆功能实现方式较为复杂,不同的模型可能有所不同。 OpenAI 的模型中,大模型 LLM 扮演了“大脑”的角色,其记忆功能可能通过“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构来实现。但需要注意的是,对于 ChatGPT 这类模型,实际上其本质上并没有直接的记忆功能。它能理解之前的交流内容,是因为每次将之前的对话内容作为新的输入重新提供给模型。这种记忆功能并非由大型模型直接实现,而是通过在别处进行存储来达成。 如果对话内容过长,可能会影响模型的整体性能。解决这个问题的一个简单方法是启动另一个对话框。对于之前的数据,通常只能进行总结。
2025-03-01
grok3 发布会亮点内容
Grok 3 发布会的亮点内容包括: 1. 包含两个模型版本:Grok 3 和 Grok 3mini。 2. 在 AIME 和 GPQA 在内的基准测试中显著优于其他模型,在数学推理、代码处理、科学问题方面表现优秀。 3. 具备推理能力,在提供更多测试计算时间的情况下,优于 o1 和 R1。 4. 今天向所有 Premium+订阅者推出(IOS、网页版都有),完整版在网页版,APP 上的 Grok 3 有一定削弱。 5. 新增“Deep Search”能力,能深入了解用户目的,访问并交叉验证多个信息源,确保研究内容准确,并公开执行搜索步骤。 6. 可以调用 Big Brain 功能加强计算来解决问题。 7. 现场演示中,Grok 3 可以生成游戏设计方案。 8. Grok 3 语音模式在大约一周内推出。 9. Grok 3 API 几周后推出。 10. Grok 2 将在 Grok 3 正式可用后开源,xAI 计划也会开源 Grok 3。
2025-02-19
OpenAI过去12天的发布会总结
以下是 OpenAI 过去 12 天发布会的总结: 自媒体记录方面: 夕小瑶科技说:o3 发布,可能影响码农工作。 孔某人的低维认知:OpenAI 圣诞 12 天总评,感谢大佬赏饭。 MAX 01Founder:一文详解 o3,虽接近 AGI 但使用成本高。 南瓜博士:使用 o3 钱包和脑子可能不够。 数字生命卡兹克:OpenAI 正式发布 o3,通往 AGI 路上已无障碍。 具体发布内容: Day12:o3 与 o3 mini 正式亮相。 Day11:ChatGPT 桌面应用,Option+空格快速唤起。 Day10:OpenAI 发布电话倾诉功能 18002428478。 Day9:o1 满血版 API 和 4o 实时语音 API 更新。 Day8:AI 搜索功能免费开放,并支持实时语音搜索。 Day7:ChatGPT 全新“项目”功能发布。 Day6:实时视频通话&圣诞老人模式正式上线。 Day5:ChatGPT 与 Apple 的深度合作。 Day4:直播“翻车”的 Canvas。 Day3:Sora 终于上线,有案例和功能详解。 Day2:微调 O1 模型,低成本高效率。 Day1:强化学习微调的实操案例。 宝玉日报 12 月 18 日: AI 架构与技术选型的 4 条原则:选主流框架、确保测试覆盖率、避免私有框架、采用模块化设计。 OpenAI 12 天发布会第 9 天:o1 API 正式版速度更快成本降低,支持多种新功能;语音交互升级,引入 WebRTC 支持,处理费用降低;新增偏好微调功能和工具包,简化 API 密钥申请流程。 易观分析报告预测了 AI 技术未来的关键发展方向,德邦证券报告对 OpenAI 十二日发布会进行深度总结,认为随着大模型能力提升和应用场景扩展,AI 应用商业价值有望实现,建议关注相关领域。
2024-12-31
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
open发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,是目前世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示模型的多模态推理能力。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等功能。 新模型 9.12 发布的要点: 1. 发布两个模型:o1 mini,o1 preview。Plus 全量可用 o1 mini 一周 50 条,o1 preview 一周 30 条。 2. 更聪明的思考方式:像人一样花更多时间思考问题,尝试不同策略,能意识到自己的错误。 3. 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上表现得像博士生,在 IMO 和 Codeforces 竞赛中取得高分。 4. 暂时缺少一些功能:目前没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上非常强大。 O1 Pro 版本的要点: 1. 面向专业用户,强大精确。 2. 独有功能包括深度推理能力,可处理复杂数学和科学问题,支持多步推理和专业计算,思考时间约 1 3 分钟;在科学、数学、编程等领域表现出色,提供专业准确解答;支持长文本处理,轻松应对长文档处理与内容生成;提供更多微调选项,用户可根据自身需求进行个性化定制。 3. 对比优势:错误率大幅降低,推理能力显著增强,基准测试表现惊人。 ChatGPT Pro 订阅计划的要点: 1. 费用为每月 200 美元。 2. 目标用户是解决复杂问题的研究人员、工程师和专业人士。 3. 核心功能是使用 o1 Pro 模式,专为数学竞赛、科学研究、代码开发等高要求场景优化,提供更高的准确性和可靠性,适用于严格的技术基准测试任务。 4. 特别支持:OpenAI 为美国医学研究人员提供资助,重点支持罕见病基因发现、痴呆症研究、癌症免疫治疗。 发布会吐槽:直播仅用 30 分钟讲完,像是把一个大更新硬切成了 12 段。总结:o1 基础版主打日常体验,速度快且功能全面;o1 Pro 版深度推理与专业能力爆表,适合更复杂的任务。ChatGPT Pro 订阅计划开启了高性能 AI 工具的新篇章,推动科研与工程领域的新突破!
2024-12-17
最近6个月的ai技术和趋势
在过去 6 个月中,AI 技术和趋势呈现出以下特点: 模型方面:DeepSeek 开源 R1 模型,将大模型行业推进到推理时代,引发了深刻影响。Scaling Law 再次“续命”,目标指向 AGI。 图像方面:整体朝着更快、更便宜的方向发展,AI 图像生成已成为常用生产力工具,资本市场看好相关赛道。 视频方面:底层架构无大变化,公司逐渐分化为面向 C 端的好玩快速的视频模板方向和面向 B 端的高质量高可控性的视频创作方向。 音频方面:跨越了真假难辨的临界点,成为继图像领域后被资本看好的赛道。 3D 方面:暂时停留在文字/图片生成 3D 模型阶段,世界模型刚起步。 应用方面:AI 编程领域快速迭代发展,从半自动向全自动迈进;Computer Agent 缓慢发展,OpenAI 的 Operator 工具效果不佳;DeepSearch 作为调研 Agent 存在模型幻觉等问题,实际使用需谨慎。 新闻方面:中美欧 2025 年将加大对 AI 基础建设和科学研究的投入,越来越多厂商接入 R1 并拥抱开源。
2025-03-31
最近很火的古人怼人视频怎么做的
制作最近很火的古人怼人视频,可按照以下步骤进行: 1. 文案生成 工具:DeepSeek 操作: 打开 DeepSeek 网站:https://chat.deepseek.com/ 输入提示词,示例:“让 XX 用现代口语化的表达、生气骂人的口吻吐槽 XXXX(例如:吐槽现代人),XXX 目的(例如:推广 XXX 吸引游客来旅游),输出 3 条 60 字左右的毒舌文案,每条里面都要有‘回答我!Look in my eyes!Tell me!why?baby!why?’” 可以根据自己的内容自行调整文案和字数要求。 点击生成,等待 DeepSeek 输出 3 条文案。 从中挑选最满意的一条(或多条)保存备用。 2. 准备人物形象图 可以用现有的照片或者图片,也可以用工具生成。 工具:即梦 AI 操作: 打开即梦 AI 网站:https://jimeng.jianying.com/aitool/image/generate 输入提示词,即梦已经接入了 DeepSeek,可以直接用它来生成绘图提示词 调整生成参数(如风格、细节等),点击生成。 预览生成的人物图,不满意可调整提示词重新生成,直到满意为止。 下载最终的人物形象图。 此外,还有以下扩展玩法和变现玩法: 扩展玩法: 1. 文旅引流版:用地方历史名人“骂”现代游客,再顺便夸家乡美景。 2. 名人认知刷新版:让古人吐槽他们被误解的形象。 3. 系列化挑战:做一个“古人骂遍现代生活”系列,吸引粉丝追更。还能号召网友提建议,互动拉满! 变现玩法: 1. 品牌合作与广告植入:让古人吐槽现代生活痛点,顺势植入品牌产品或服务,打造新颖幽默的广告形式。 2. IP 开发与周边销售:基于古人形象开发文化衍生品,打造可销售的 IP 周边。 3. 教育与文化传播:将吐槽视频融入历史文化知识,吸引学生和文化爱好者。
2025-03-30
最近流行的ai技术
AI 技术的发展历程和前沿技术点如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:例如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包括量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 学习路径: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 近期热门融资的 AI 产品,如 Genspark、Rockset、ButterfliesAI、MeetRecord 等,不仅展示了技术的先进性,也为各行各业提供了高效、智能的信息处理和决策支持工具。
2025-03-29
最近有什么AI比赛
以下是为您整理的近期 AI 比赛: 1. 【灵璧 AI】安徽文创 截止日期:0115 0315 奖金奖项:一等奖 2k1、二等奖 1k2、三等奖 8005 主题+作品类型:赛道一为数字艺术创作,利用 AIGC 技术创作数字绘画、数字雕塑等艺术作品;赛道二为互动体验设计,设计互动体验项目,如 AR/VR 体验、互动游戏等;赛道三为数字故事讲述,创作以虞姬及灵璧特色历史文化为主题的数字故事,如动画短片等。 关键要求:只能提交一份作品。以压缩包上传,材料包含创作作品的源文件、prompt 指令、制作过程的关键过程截图、录屏与说明等。 提交方式:邮箱 链接: 2. 创无界智未来·文旅应用赛 截止日期:0101 0330 奖金奖项:一等奖 10w1、二等奖 6w2、三等奖 3w3 主题+作品类型:四个赛道 关键要求:模糊 提交方式:官网 链接: 3. 【凌家滩】AI 创作大赛 截止日期:0101 0415 奖金奖项:一等奖 2w1、二等奖 8k2、三等奖 2k3、优秀奖 010 主题+作品类型:“文化遗产的数字化重现与未来表达”AI 图像/AIMV/AI 视频 关键要求:无 提交方式:无 链接: 4. 【云山杯】AIGC 大赛 截止日期:0116 0225 奖金奖项:四赛道分别为一等奖 2k1、二等奖 1k1、三等奖 3003、优秀奖 10020 主题+作品类型:图片、视频、文本、音频 关键要求:【AI 图片】1.设计一个代表“杯云山”的全新品牌标志,融合传统与现代元素。2.创作一套完整的品牌视觉形象,包括颜色、字体和图案设计。【AI 视频】1.制作一个简短视频,介绍“杯云山”品牌的历史、价值观和产品特色。2.制作一段云南茶文化的纪录片,展示其历史、传统和现代发展的融合。【AI 文本】1.撰写关于“杯云山”品牌从创立到发展的故事,突出品牌的传承与创新。2.编写一个以茶园为背景的微型剧本,展示茶叶从种植到品鉴的全过程。【AI 音乐】1.创作能够代表“杯云山”的纯音乐,体现茶园的宁静与创新的活力。2.将传统云南音乐元素与现代电子音乐相结合,创作段具有地域特色和创新感的音乐作品。 提交方式:无 链接: 5. 智绘未来【台州】AI 大赛 截止日期:0122 0309 奖金奖项:①一等奖 5k1、二等奖 2k3、三等奖 1k5、台州奖 1k1;②一等奖 5.5k1、二等奖 2.5k2、三等奖 1.5k3、台州奖 1k1 主题+作品类型:AI 绘画赛道、AI 视频赛道(60S 以上) 关键要求:分辨率 2K 以上,【加分项】展现台州自然风光、人文历史、城市印象等元素,对台州未来景象的想象,或对台数字馆的未来想象相关的台州元素(额外在总分值增加 10%的分数) 提交方式:AITOP100 平台,投稿后必须转发至小红书分享并带上话题智绘未来+关注官方账号@台州数字馆。 链接:
2025-03-27
最近新出的大模型有哪些
最近新出的大模型有: 1. 通义千问推出的 Qwen2.5Max 大型专家模型,通过 SFT 和 RLHF 策略后训练,性能与顶尖模型竞争,在多个基准测试中超越了 DeepSeek V3,引发了 AI 社区对大规模专家模型的高度关注。相关链接: Blog: Qwen Chat: (选择 Qwen2.5Max 模型) API: HF Demo: 2. 阿里云发布的 Qwen2.5VL 新一代视觉语言模型。
2025-03-27
吴恩达最近推出了哪些课程?
吴恩达最近推出的课程包括: 1. 与 OpenAI 合作推出的免费的 Prompt Engineering(提示工程师)课程。 主要内容是教书写 AI 提示词,并利用 GPT 开发一个 AI 聊天机器人。 原版网址:https://www.deeplearning.ai/shortcourses/chatgptpromptengineeringfordevelopers/ B 站版本:【合集·AI Course哔哩哔哩】https://b23.tv/ATc4lX0 、https://b23.tv/lKSnMbB 翻译版本: 推荐直接使用 Jupyter 版本学习,效率更高:https://github.com/datawhalechina/promptengineeringfordevelopers/ 视频下载地址:https://pan.quark.cn/s/77669b9a89d7 OpenAI 开源了教程:https://islinxu.github.io/promptengineeringnote/Introduction/index.html 纯文字版本 2. 2023 年 8 月 24 日上线的最新短课程: 《》,课程内容包括了解何时对 LLM 应用微调、准备数据以进行微调、根据自己的数据训练和评估 LLM。 《》,深入浅出地介绍了基于大语言模型的 AI Agents,从记忆检索到决策推理,再到行动顺序的选择,真实展现了 Agent 的智能化进程。
2025-03-27
AI产品经理招聘
以下是为您整理的 AI 产品经理招聘信息: 特看科技: 岗位要求: 负责 AI 视频工具方向产品工作,对生成式 AI 产品有一定研究,熟悉 Transformer 和 Diffusion 模型的优先。 英文好,有海外产品经验优先,有内容工具或 SaaS 产品经验优先。 2 年以上产品岗位经验,职级根据经验能力制定,对标阿里 P6P8 区间。 您能得到: 确定性的商业化应用场景,已有大量品牌客户。 初创公司充沛的早期期权池。 强大的工程师团队,将新技术快速落地应用。 最高可到合伙人级别。 加分项:有电子商务、企业服务、人工智能、海外产品等行业经验。 联系方式:欢迎推荐或自荐简历至 qingshen@tabcut.com,或飞书与@清慎联系。 阿里大文娱妙鸭团队: 工作地点:北京 职位要求: 熟悉图像、视频、文本领域的前沿大模型和应用。 对算法能力边界有很好的感知。 有某一场景下的大模型微调和应用的项目经验。 联系方式:欢迎推荐简历至 xiaocen.cxc@alibabainc.com 其他: 职责描述: 负责基于通用人工智能技术(AGI)的智慧医疗诊断产品的规划、研发、发布上市的全过程管理。 通过市场调研和分析,开发满足客户需求的产品或服务,为公司制定产品战略。 制定并执行产品开发计划和目标,协调项目相关人员,推动产品开发工作的顺利进行。 提出产品优化建议,推动产品快速迭代,并协调增长部门实现产品的持续增长。 任职要求: 本科及以上学历,计算机、信息技术、工程、检验、生物科学、细胞生物学等相关专业优先考虑。 具备 3 年以上产品管理经验,有医疗领域产品管理经验者、有极致产品案例者优先。 在产品创新、研发、迭代改进及商业化方面有丰富的项目管理经验。 对客户需求具有高度敏感度,熟悉竞品分析、定价策略。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
AI生成产品原型 html
以下是利用 AI 生成产品原型 HTML 的相关内容: 1. 网页上与 AI 交互编程的一般流程: 讨论需求:明确项目目标和用户需求,确保团队对产品方向有一致的理解。 确定关键功能:根据需求确定产品最核心的功能,确保能实现最基本的用户价值。 AI 生成产品草图:利用 AI 快速生成界面草图,帮助团队更好地理解产品的外观和交互。 列出功能列表:明确产品所需的功能模块,并逐一列出。 选择一个功能:每次专注完成一个功能,确保质量与效率。 向 AI 描述功能:详细描述功能需求,AI 会根据描述生成代码。 AI 编写代码:AI 根据需求编写代码,减少开发者的重复性劳动。 测试代码:测试生成的代码,确保正常运行。 向 AI 提出问题:若功能不正常,将问题反馈给 AI 进行调整。 功能完成:功能通过测试后标记为完成。 还有功能吗:若还有未完成的功能,继续开发下一个功能。 发布初始版本:所有核心功能完成后发布初始版本,以获取用户体验反馈。 2. 项目开发案例: Trae 生成天气 HTML 项目:通过复制粘贴等操作利用 Trae 生成天气相关的 HTML 项目,可调整背景颜色等,生成后可在文件夹中打开并用浏览器查看。 开发游戏案例:直接让智普生成羊、狼、锤子、栅栏、胜利图片、失败图片等元素,生成 HTML 大框架并验证元素摆放位置,对生成的 CSS 结构中的 position 定位模式进行人工调整。 3. 项目开发与部署流程: 初始化设计文档,用脚本生成项目目录,让 Trae 生成代码,提交代码到 GitHub,打包镜像部署到服务器。 需要注意的是,AI 生成的内容可能有 90%能用,但剩下的 10%可能需要有经验的人或专家进行人工调整。AI 只是辅助,自身学习还是很有必要的。
2025-04-12
我想要自学AI相关的知识,但不知道从哪里开始,需要一个行动方案,我未来想做一个ai产品经理
以下是为您提供的自学 AI 知识并成为 AI 产品经理的行动方案: 1. 应用方面: 深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用并用于解决实际问题或提升效率。 2. 分析方面: 大量阅读各类文章、视频以及行业报告,理解各知识之间的关系。 3. 掌握相关技能: 了解目前 AI 提示词工程师岗位的招聘技能要求,例如: 本科及以上学历,计算机科学、人工智能、机器学习相关专业背景。 熟悉 ChatGPT、Llama、Claude 等 AI 工具的使用及原理,并具有实际应用经验。 熟练掌握 ChatGPT、Midjourney 等 AI 工具的使用及原理。 负责制定和执行 AI 项目,如 Prompt 设计平台化方法和模板化方法。 了解并熟悉 Prompt Engineering,包括常见的 Prompt 优化策略(例如 CoT、Fewshot 等)。 对数据驱动的决策有深入的理解,能够基于数据分析做出决策。 具有创新思维,能够基于业务需求提出并实践 AI first 的解决方案。 对 AI 技术与算法领域抱有强烈的好奇心,并能付诸实践。 对 AIGC 领域有深入的理解与实际工作经验,保持对 AI 技术前沿的关注。 具备一定的编程和算法研究能力,能应用新的 AI 技术和算法于对话模型生成。 具有一定的编程基础,熟练使用 Python、Git 等工具。 4. 了解产品经理工作: 调研市场、思考需求、转化需求、思考解决方案、设计解决方案、分配任务、进行测试、实现解决方案。 像善用提示词工程的人一样,将需求抽象再具象成产品。 总之,要成为 AI 产品经理,需要不断学习和实践,适应行业的发展和变化。
2025-04-12
数字人讲解产品
以下是关于数字人讲解产品的相关内容: 电商方面: 1. 添加产品/介绍背景:若有自己的视频/图片素材可用,若无,可根据搜索添加。 2. 扣像结合背景:在剪映中把数字人扣下,导入视频,点击画面选择抠像,点击智能抠像,调整大小和位置。 3. 添加字幕和音乐:智能识别字幕,可搜索或手动添加喜欢的音乐。最终形成所需视频,可用于带货或讲解产品,也能应用于直播(直播可能收费,短视频可通过购买邮箱注册使用免费时长或直接购买会员版)。 XiaoHu.AI 日报 1 月 14 日相关: 1. 无需真人模特,上传产品图片,数字人即可手持产品进行口播展示。 2. 支持语音和口型同步,动作、姿势可定制,提供 1000+多国家数字人模特。 3. 覆盖全球 28+种语言,能快速生成产品宣传视频,省去拍摄烦恼。测试视频效果接近成熟,嘴型部分仍需微调。在线体验:
2025-04-11
目前AI Excel数据分析有哪些产品
目前在 AI Excel 数据分析方面,以下是一些相关的产品: 1. 宝玉日报中提到,让 AI 帮写 Excel 宏函数适用于几乎所有主流 AI。数据分析推荐 Claude 网页版或 ChatGPT,可上传 CSV 进行可视化分析。链接:https://x.com/dotey/status/1895319207413170354 2. Excel Labs:这是一个 Excel 插件,新增了生成式 AI 功能,基于 OpenAI 技术,可在 Excel 中利用 AI 进行数据分析和决策支持。 3. Microsoft 365 Copilot:微软推出的 AI 工具,整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件,通过聊天形式,用户告知需求后,Copilot 自动完成任务,如数据分析或格式创建。 4. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互式地进行数据分析和生成 Excel 公式。 5. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还可根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 6. 表格 Top10 中的相关产品有:Highcharts、Fillout.com、Coefficient、Numerous.ai、SheetGod、GPTExcel、酷表 ChatExcel、GPT Workspace、OpenAI in Spreadsheet、Ajelix AI Excel Tools 。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。随着技术的不断发展,未来可能会有更多 AI 功能被集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。
2025-04-10