Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

OpenAI前六场发布会的内容提炼

Answer

以下是 OpenAI 前六场发布会的部分内容提炼:

  • OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。
  • 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。
  • OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
Content generated by AI large model, please carefully verify (powered by aily)

References

通往 AGI 之路

《[OpenAI第六天:真正的AI助手-不仅会看懂屏幕,还能和你聊天](https://mp.weixin.qq.com/s/ebkPRiaYWwf8BbG4BALJUQ)》在OpenAI第六天发布会上,ChatGPT的高级语音模式获得公开访问权限,能够通过自然语音与用户对话,并理解屏幕内容。这一更新显著降低了使用门槛,并展示了AI助手的多模态能力和个性化发展潜力。《[2024人工智能产业30条判断——万千流变,一如既往](https://waytoagi.feishu.cn/record/H8jkrG5Ape3noRcyjl0cuDREnMf)》的报告由甲子光年发布,涵盖了AI技术的历史发展、当前趋势和未来预测。报告提到了AI领域的重大里程碑,如Transformer模型和GPT系列的发展,以及AI在多个行业中的应用。它还探讨了AI芯片的进步、AI在科学研究中的角色,以及AI技术对社会的广泛影响。此外,报告预测了AI产业的增长,包括AI基础设施、AI即服务(SaaS)和AI在消费者产品中的集成。中信建投证券:海外AI应用行业专题《[旧金山草根调研与海外AI应用进展](https://waytoagi.feishu.cn/record/CA0Wrg3xveZmF5cA2bgcfVEOnIX)》长达100多页,非常详尽,聚焦旧金山草根调研及海外AI应用进展。报告显示,旧金山及硅谷地区AI企业众多,AI应用关注度提升,尤其在To B场景中,如广告、助手、数据分析等领域。AI应用长期看好,尤其是C端应用的潜力。报告列举了多家AI应用公司及其业务领域、AI功能进展,并提供相关上市公司的市值、营业收入等数据。海外AI应用以B端为主,但C端潜力巨大,AI技术正推动效率提升和娱乐体验。

4.4 历史更新

《[OpenAI第六天:真正的AI助手-不仅会看懂屏幕,还能和你聊天](https://mp.weixin.qq.com/s/ebkPRiaYWwf8BbG4BALJUQ)》在OpenAI第六天发布会上,ChatGPT的高级语音模式获得公开访问权限,能够通过自然语音与用户对话,并理解屏幕内容。这一更新显著降低了使用门槛,并展示了AI助手的多模态能力和个性化发展潜力。《[2024人工智能产业30条判断——万千流变,一如既往](https://waytoagi.feishu.cn/record/H8jkrG5Ape3noRcyjl0cuDREnMf)》的报告由甲子光年发布,涵盖了AI技术的历史发展、当前趋势和未来预测。报告提到了AI领域的重大里程碑,如Transformer模型和GPT系列的发展,以及AI在多个行业中的应用。它还探讨了AI芯片的进步、AI在科学研究中的角色,以及AI技术对社会的广泛影响。此外,报告预测了AI产业的增长,包括AI基础设施、AI即服务(SaaS)和AI在消费者产品中的集成。中信建投证券:海外AI应用行业专题《[旧金山草根调研与海外AI应用进展](https://waytoagi.feishu.cn/record/CA0Wrg3xveZmF5cA2bgcfVEOnIX)》长达100多页,非常详尽,聚焦旧金山草根调研及海外AI应用进展。报告显示,旧金山及硅谷地区AI企业众多,AI应用关注度提升,尤其在To B场景中,如广告、助手、数据分析等领域。AI应用长期看好,尤其是C端应用的潜力。报告列举了多家AI应用公司及其业务领域、AI功能进展,并提供相关上市公司的市值、营业收入等数据。海外AI应用以B端为主,但C端潜力巨大,AI技术正推动效率提升和娱乐体验。

OpenAI首届开发者大会消息提炼

|标题|来源|备注|附件|链接||-|-|-|-|-||短短45分钟发布会,OpenAI如何再次让AI圈一夜未眠|极客公园|Sam Altman表示团队一直在征求开发者的建议,对开发者关注的问题做了六大升级,分别是更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制。<br><br>其中前四条主要关于新模型的性能的提升,而后两点则主要针对企业开发者的痛点。在提升性能的同时,OpenAI还宣布了API价格的下调,可谓「加量不加价」了。||[https://mp.weixin.qq.com/s/EK9j4pTAkdpNRtQZ_XwQ-w](https://mp.weixin.qq.com/s/EK9j4pTAkdpNRtQZ_XwQ-w)|

Others are asking
OpenAI Operator, Anthropic Claude Coder
以下是关于 OpenAI Operator 和 Anthropic Claude Coder 的相关信息: 2025 年 Agent 领域的发展预测: 从对话助手到行动型智能体是 2025 年 Agent 技术的主流发展方向之一。计算机操作能力取得突破,传统大模型更多充当聊天助手,而 2025 年的突破在于让 Agent 直接“动手”操作电脑和网络环境。 Anthropic 在 2024 年底发布的 Claude 3.5 Sonnet 首次引入“Computer Use”能力,让 AI 像人一样通过视觉感知屏幕并操作鼠标键盘,实现了 AI 自主使用电脑的雏形。 OpenAI 在同期推出了代号“Operator”的 Agent 及其核心模型“计算机使用智能体”(CUA),使 GPT4 获得直接与图形界面交互的能力。CUA 通过强化学习将 GPT4 的视觉能力与高级推理相结合,训练 AI 可像人一样点击按钮、填表、滚动页面等。在 OpenAI 的测试中,CUA 在浏览器任务基准 WebArena 和 WebVoyager 上分别达到 38.1%和 87%的成功率,后者已接近人类水平。 其他相关信息: 宝玉日报 1 月 25 日: Deepseek 提示词框架包含四大模块:任务目的(Purpose)、计划规则(Planning Rules)、格式规则(Format Rules)、输出说明(Output)。 Anthropic 的 Claude 可通过屏幕截图获取计算机视觉信息,计算光标移动的像素坐标,并执行点击、滚动等操作。 OpenAI Operator 利用虚拟主机和 Chrome 浏览器,通过 CUA 实现网页实时操作,支持复杂任务导航。 主要的大语言模型: OpenAI 系统包括 3.5 和 4 等,3.5 模型在 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。新的变种使用插件连接到互联网和其他应用程序。Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。未为 OpenAI 付费只能使用 3.5。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,连接到互联网。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是 PaLM 2 模型。 Anthropic 发布了 Claude 2,其最值得注意的是有一个非常大的上下文窗口。
2025-04-01
openai官方文档
以下是关于 OpenAI 官方文档的相关信息: 对于刚入门学习提示词的朋友,建议先有一个大模型帐号并熟悉与之对话的方式。推荐的国产平替有 。 学习 prompt 必须看 OpenAI 的官方文档,相关链接有: 。 在 OpenAI 官方的说明文档(Documentation)中,为用户提供了若干项策略以帮助更好地使用 ChatGPT。例如策略一:编写清晰的说明,即在询问中包含详细信息以获得更多相关答复。因为大模型无法在有限信息中“猜测”用户意图,所以提问时不要惜字如金,多说一些内容、多提供一些信息能有效提高回复的质量和丰富性。文中还列举了多个例子进行说明。
2025-03-29
OpenAI o1、Claude Sonnet 3.7、Gemini 2.0 pro 哪个 AI 搜索能力更强?
OpenAI o1、Claude Sonnet 3.7 和 Gemini 2.0 pro 在不同方面具有各自的优势,难以简单地比较哪个的搜索能力更强。 OpenAI o1 推理能力强,适合作为架构师或算法顾问。 Claude Sonnet 3.7 擅长长上下文任务,在快速生成代码与网页设计方面表现出色。 Gemini 2.0 pro 长上下文支持较好(2M Tokens),适合代码反编译与混淆代码分析。 具体的搜索能力表现还会受到应用场景和具体任务的影响。
2025-03-21
openai deep research使用技巧
OpenAI 的 Deep Research 功能能够整合多源信息,进行复杂的信息查询与分析,并生成专业水准的报告,同时详细展示思考和搜索过程。目前,该功能仅支持文本输出,未来还将增加嵌入式图片、数据可视化等功能。使用入口为在 ChatGPT 输入框中选择「Deep Research」模式,输入问题后即可开始体验。 在 OpenAI 推出「Deep Research」功能一天后,Hugging Face 的工程师迅速联合推出了免费开源的版本 Open Deep Research,能自主浏览网页、滚动页面、处理文件,以及基于数据进行计算。使用入口为前往 Demo 网站(opendeepresearch.vercel.app)体验。 Deep Research 让 AI 自动完成多步骤研究任务,快速分析海量信息并生成专业报告,具备自动化信息汇总、文献引用与多领域适用性,适合科研、工程、金融等行业。目前向 Pro 用户开放,未来将扩展至 Plus 和 Team 用户,并提供更强大的功能。 该智能体基于优化版 OpenAI o3 模型,结合网络浏览和 Python 分析能力,实现高效研究,适用于科学、政策、工程等高强度知识工作,也能帮助购物者做复杂决策。Pro 用户已可使用,后续将逐步向 Plus、Team 和企业用户开放。
2025-03-08
openAI的deep research有哪些缺陷
OpenAI 的 Deep Research 存在以下一些缺陷: 1. 具有滞后性,在某些信息上无法做到及时更新。 2. 存在信息混乱的问题,无法完全替代人类的深度思考。
2025-03-03
Monica和Openai的记忆功能是如何让大模型产生记忆的?是什么原理?
大模型的记忆功能实现方式较为复杂,不同的模型可能有所不同。 OpenAI 的模型中,大模型 LLM 扮演了“大脑”的角色,其记忆功能可能通过“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构来实现。但需要注意的是,对于 ChatGPT 这类模型,实际上其本质上并没有直接的记忆功能。它能理解之前的交流内容,是因为每次将之前的对话内容作为新的输入重新提供给模型。这种记忆功能并非由大型模型直接实现,而是通过在别处进行存储来达成。 如果对话内容过长,可能会影响模型的整体性能。解决这个问题的一个简单方法是启动另一个对话框。对于之前的数据,通常只能进行总结。
2025-03-01
文本提炼
以下是对您提供的文本的提炼: 文本补全: 学习如何生成或操作文本。 完成端点可用于多样任务,提供简单强大接口连接模型。输入提示,模型生成补全,受任务复杂性和提示质量影响。 可通过 Playground 探索,API 输出非确定性,设置温度可调整。 本指南涵盖提示设计最佳实践,了解代码工作可访问代码指南。 Claude2 中文精读: 可执行多种文本处理任务,如摘要、编辑重写、情感识别、信息提取和删除、翻译等。 示例包括提取电子邮件地址、删除个人身份信息等。 提示工程关键原则: 原则 1 是编写清晰具体的指令,包括使用分隔符清楚限定输入不同部分,分隔符可以是多种明显标点符号,能避免提示注入。 策略 2 是要求结构化输出,如 HTML 或 JSON 格式,便于解析模型输出。
2025-03-10
最近想要出一本书,书籍的主题是“Deepseek的应用革命:打造AI时代的竞争力”主要是面相企业家和企业高管,希望能够将知识库内容中关于企业应用的部分提炼成书,请根据知识库素材,输出一个图书内容规划和重点参考资料
以下是为您规划的图书内容和重点参考资料: 一、图书内容规划 1. 引言 介绍 AI 时代的背景和企业面临的挑战与机遇。 阐述 DeepSeek 在塑造企业竞争力方面的重要性。 2. DeepSeek 的技术创新 详细介绍 DeepSeek 最新模型 V3 与 R1 的架构创新,如混合专家(MoE)架构、多头潜注意力(MLA)等。 解释其如何提升计算效率和推理能力,打破算力壁垒。 3. 多领域的应用案例 字节跳动的新技术 OmniHuman 在视频生成方面的突破。 Coinbase 全面推动 AI 应用的实践,如在欺诈预防和客户支持等领域的应用。 4. 对企业管理的影响 探讨善于沟通上下文、明晰 AI 能力边界、合理授权并监督等管理经验如何提升 AI 协作效率。 5. 行业趋势与挑战 分析 AI 基础大模型参数量的变化趋势。 讨论初级程序员面临的职业挑战以及编程领域的颠覆性变化。 6. 未来展望 预测 DeepSeek 及相关技术在未来的发展方向和可能的创新。 二、重点参考资料 1. 《》 2. 《》 3. 《》 4. 《》 5. 《》 6. 《[零基础掌握 Deepseek》》 7. 日报 8. 日报
2025-03-08
如果我想给一份数学题目,把里面的数学题目进行知识点提炼分类,怎么利用AI实现?
要利用 AI 对数学题目进行知识点提炼分类,可以参考以下方法: 1. 题目内容识别:通过适当的方式将数学题目输入给 AI,让其理解题目内容。 2. 利用经过训练的 AI 模型:这些模型可能能够对题目中的数学概念、公式、定理等进行初步的分析和提取。 3. 人工校对与验证:AI 给出的结果需要人工进行校对,确保知识点提炼分类的准确性。 4. 清晰完整的指令输入:向 AI 提供清晰、准确且完整的指令,以提高其处理效果。 需要注意的是,AI 目前仍存在一定的局限性,不能完全替代人的思考和判断,在使用其结果时要谨慎验证。
2025-02-21
从你的知识库中总结提炼一下,形成一个表格,告诉我目前已经有哪些面向个人和面向企业的AI应用\工具\智能体,以及具体的功能简介
|应用类型|应用名称|使用技术|功能简介|示例场景| |||||| |智能体应用(Assistant)|无|基于上下文对话,自主决策并调用工具|客户服务:了解客户诉求,解决客户问题。如查询订单状态、处理退款等。个人助理:管理日程安排、提醒事项、发送邮件等。技术支持:了解技术问题,提供解决方案,帮助用户排除故障。| |工作流应用(Workflow)|无|将复杂任务拆解为若干子任务|AI 翻译:实现初步翻译、内容审校、再次优化的翻译流程,提升翻译质量。| |智能体编排应用|无|支持多智能体协作|综合调研报告:组建一个报告撰写团队,包括负责写作意图识别、大纲书写、总结摘要、智能绘图、事件研判、段落撰写、文笔润色等任务的智能体。软件开发团队:组建一个智能体开发团队,包括负责需求分析、系统设计、编码实现、测试调试、文档编写等任务的智能体。| |AI 游戏道具推荐系统|游戏内商城推荐功能|数据分析、机器学习|根据玩家需求推荐游戏道具。|在一些游戏中,利用 AI 分析玩家的游戏风格和进度,为玩家推荐合适的游戏道具,如武器、装备等。| |AI 天气预报分时服务|彩云天气分时预报|数据分析、机器学习|提供精准的分时天气预报。|彩云天气利用 AI 提供每小时的天气预报,帮助用户更好地安排出行和活动。| |AI 医疗病历分析平台|医渡云病历分析系统|数据分析、自然语言处理|分析医疗病历,辅助诊断。|医渡云利用 AI 分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议。| |AI 会议发言总结工具|讯飞听见会议总结功能|自然语言处理、机器学习|自动总结会议发言内容。|讯飞听见在会议中利用 AI 自动总结发言者的主要观点和重点内容,方便回顾和整理。| |AI 书法作品临摹辅助工具|书法临摹软件|图像识别、数据分析|帮助书法爱好者进行临摹。|书法临摹软件利用 AI 识别书法作品的笔画和结构,为用户提供临摹指导和评价。| |超级简历优化助手|无|自然语言处理|帮助用户优化简历提高求职成功率。|超级简历优化助手分析简历内容并提供优化建议。| |AI 室内设计方案生成|酷家乐|图像生成、机器学习|快速生成个性化室内设计方案。|酷家乐允许用户上传户型图,通过 AI 生成多种设计方案。| |AI 音乐创作辅助工具|Amper Music|机器学习、音频处理|协助音乐创作者进行创作。|Amper Music 根据用户需求生成旋律和编曲。| |AI 情感咨询助手|松果倾诉智能助手|自然语言处理、情感分析|提供情感支持和建议。|松果倾诉智能助手通过文字或语音交流为用户提供情感咨询。| |AI 宠物健康监测设备|小佩宠物智能设备|传感器数据处理、机器学习|实时监测宠物健康状况。|小佩宠物智能设备可监测宠物活动、饮食等,提供健康预警。| |AI 旅游行程规划器|马蜂窝智能行程规划|数据分析、自然语言处理|根据用户需求生成个性化旅游行程。|马蜂窝智能行程规划根据目的地、时间等因素为用户定制旅游路线。|
2025-02-06
我想要搭建一个能够帮我阅读并总结提炼,同时能在我提出问题时,随时在我给他提供的知识库中检索的AI Agent,如何用Coze搭建?
搭建能够阅读、总结提炼并在给定知识库中检索的 AI Agent 可以使用 Coze 按照以下步骤进行: 1. 规划 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 关于一些其他问题: 1. 如何判断自己的任务/Prompt 是否需要拆解为工作流? 构建稳定可用的 AI Agent 是一个需要不断调试和迭代的过程。通常先从当前性能最强的 LLM(如 ChatGPT4 和 Claude 3.5 sonnet)着手,先用单条 Prompt 或 Prompt Chain 来测试任务的执行质量和稳定性。然后,根据实际执行情况、最终投产使用的 LLM,逐步拆解子任务,降低 LLM 执行单任务的难度,直到达成工程目标。一般对于场景多样、结构复杂、对输出格式要求严格的内容,基本可以预见到需要将其拆解为工作流。此外,如果涉及生成多媒体内容或从网络自主获取额外信息等能力,必然需要通过工作流来调用相应的插件。 2. 只用了一段 Prompt 的 Agent,还算 AI Agent 吗? 算。详见
2025-02-06
哪个AI对PDF文件的提炼总结能力最强
目前在对 PDF 文件的提炼总结能力方面,Claude 2 表现出色。将整本书粘贴到 Claude 的前一版本中能取得令人印象深刻的结果,新模型更强大。可以通过查看相关经验和提示。此外,myaidrive.com 网站上的 AI PDF 也能处理较大的 PDF 文件,并为冗长的文档提供上级摘要。同时,近期出现的各类 AI 搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等,其智能摘要功能能够辅助快速筛选信息。但需要注意的是,这些系统仍可能产生幻觉,若要确保准确性,需检查其结果。
2025-01-23
grok3 发布会亮点内容
Grok 3 发布会的亮点内容包括: 1. 包含两个模型版本:Grok 3 和 Grok 3mini。 2. 在 AIME 和 GPQA 在内的基准测试中显著优于其他模型,在数学推理、代码处理、科学问题方面表现优秀。 3. 具备推理能力,在提供更多测试计算时间的情况下,优于 o1 和 R1。 4. 今天向所有 Premium+订阅者推出(IOS、网页版都有),完整版在网页版,APP 上的 Grok 3 有一定削弱。 5. 新增“Deep Search”能力,能深入了解用户目的,访问并交叉验证多个信息源,确保研究内容准确,并公开执行搜索步骤。 6. 可以调用 Big Brain 功能加强计算来解决问题。 7. 现场演示中,Grok 3 可以生成游戏设计方案。 8. Grok 3 语音模式在大约一周内推出。 9. Grok 3 API 几周后推出。 10. Grok 2 将在 Grok 3 正式可用后开源,xAI 计划也会开源 Grok 3。
2025-02-19
OpenAI过去12天的发布会总结
以下是 OpenAI 过去 12 天发布会的总结: 自媒体记录方面: 夕小瑶科技说:o3 发布,可能影响码农工作。 孔某人的低维认知:OpenAI 圣诞 12 天总评,感谢大佬赏饭。 MAX 01Founder:一文详解 o3,虽接近 AGI 但使用成本高。 南瓜博士:使用 o3 钱包和脑子可能不够。 数字生命卡兹克:OpenAI 正式发布 o3,通往 AGI 路上已无障碍。 具体发布内容: Day12:o3 与 o3 mini 正式亮相。 Day11:ChatGPT 桌面应用,Option+空格快速唤起。 Day10:OpenAI 发布电话倾诉功能 18002428478。 Day9:o1 满血版 API 和 4o 实时语音 API 更新。 Day8:AI 搜索功能免费开放,并支持实时语音搜索。 Day7:ChatGPT 全新“项目”功能发布。 Day6:实时视频通话&圣诞老人模式正式上线。 Day5:ChatGPT 与 Apple 的深度合作。 Day4:直播“翻车”的 Canvas。 Day3:Sora 终于上线,有案例和功能详解。 Day2:微调 O1 模型,低成本高效率。 Day1:强化学习微调的实操案例。 宝玉日报 12 月 18 日: AI 架构与技术选型的 4 条原则:选主流框架、确保测试覆盖率、避免私有框架、采用模块化设计。 OpenAI 12 天发布会第 9 天:o1 API 正式版速度更快成本降低,支持多种新功能;语音交互升级,引入 WebRTC 支持,处理费用降低;新增偏好微调功能和工具包,简化 API 密钥申请流程。 易观分析报告预测了 AI 技术未来的关键发展方向,德邦证券报告对 OpenAI 十二日发布会进行深度总结,认为随着大模型能力提升和应用场景扩展,AI 应用商业价值有望实现,建议关注相关领域。
2024-12-31
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
OPenAI最近的产品发布会
OpenAI 近期举行了多次产品发布会: 去年 11 月晚些时候发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。 在 5 月份的 GPT4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
open发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,是目前世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示模型的多模态推理能力。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等功能。 新模型 9.12 发布的要点: 1. 发布两个模型:o1 mini,o1 preview。Plus 全量可用 o1 mini 一周 50 条,o1 preview 一周 30 条。 2. 更聪明的思考方式:像人一样花更多时间思考问题,尝试不同策略,能意识到自己的错误。 3. 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上表现得像博士生,在 IMO 和 Codeforces 竞赛中取得高分。 4. 暂时缺少一些功能:目前没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上非常强大。 O1 Pro 版本的要点: 1. 面向专业用户,强大精确。 2. 独有功能包括深度推理能力,可处理复杂数学和科学问题,支持多步推理和专业计算,思考时间约 1 3 分钟;在科学、数学、编程等领域表现出色,提供专业准确解答;支持长文本处理,轻松应对长文档处理与内容生成;提供更多微调选项,用户可根据自身需求进行个性化定制。 3. 对比优势:错误率大幅降低,推理能力显著增强,基准测试表现惊人。 ChatGPT Pro 订阅计划的要点: 1. 费用为每月 200 美元。 2. 目标用户是解决复杂问题的研究人员、工程师和专业人士。 3. 核心功能是使用 o1 Pro 模式,专为数学竞赛、科学研究、代码开发等高要求场景优化,提供更高的准确性和可靠性,适用于严格的技术基准测试任务。 4. 特别支持:OpenAI 为美国医学研究人员提供资助,重点支持罕见病基因发现、痴呆症研究、癌症免疫治疗。 发布会吐槽:直播仅用 30 分钟讲完,像是把一个大更新硬切成了 12 段。总结:o1 基础版主打日常体验,速度快且功能全面;o1 Pro 版深度推理与专业能力爆表,适合更复杂的任务。ChatGPT Pro 订阅计划开启了高性能 AI 工具的新篇章,推动科研与工程领域的新突破!
2024-12-17