Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

openai官方文档

Answer

以下是关于 OpenAI 官方文档的相关信息:

Content generated by AI large model, please carefully verify (powered by aily)

References

小七姐:Prompt 喂饭级系列教程 小白学习指南(一)

可能对于学了很久prompt的包括小七姐在内的很多星友来说,下面这些内容真的已经是老生常谈了,总觉得没有必要反复提及,但今天认真搜索和翻阅了一下关于prompt新手教程的帖子,的确发现对新手不是很友好,比较零散,不成体系。这里做一个统一的收集和整理,小七姐也努力不断调起自己初学时的同理心,尽量写的再入门一点,希望能帮助更多刚入门学习提示词的朋友。第一步:你要有一个大模型帐号,至少已经熟悉和它们对话的方式。最强性能当属ChatGPT4,当然也推荐国产平替:[Kimi.ai-帮你看更大的世界](https://kimi.moonshot.cn)[智谱清言](https://chatglm.cn)第二步:看OpenAI的官方文档:[目录:OpenAI官方指南](https://waytoagi.feishu.cn/wiki/EGU4wV4q6i6vprk5A7dckaGTne0)[OpenAI官方提示工程指南](https://waytoagi.feishu.cn/wiki/HuClwX8wai1fD7kLhyBcdxzJnJf)这是每个学习prompt的人必须看的基础课,相当于人教版教材,建议阅读学习。我和熊猫Jay也在AGI分享了中文精度版的官方Cookbook:[Cookbook:OpenAI中文精读](https://waytoagi.feishu.cn/wiki/Pu2OwhTuni6H3jkiv3FcwCuLn7c)[熊猫Jay:万字解读ChatGPT提示词最佳实践](https://waytoagi.feishu.cn/wiki/FoJJwvwBNiEJYjkx1ygccO2CnVe)

小七姐:官方最佳prompt实践的六个方法

作者:小七姐可以在以下地址关注她:[小七姐的prompt学习社群](https://t.zsxq.com/15KhQ0RE7)[heading1]01学习地图|编写清晰的说明-多说两句,提供细节[content]在OpenAI官方的说明文档(Documentation-[GPT best practices](https://platform.openai.com/docs/guides/gpt-best-practices/gpt-best-practices)),也就是我们常常提到的“官方最佳实践”中,为用户提供了若干项策略,以帮助用户更好的使用ChatGPT。[heading2]策略一:编写清晰的说明[content]在询问中包含详细信息,以获得更多相关答复。这是因为,大模型不是我们肚子里的蛔虫,它无法在有限的信息中“猜测”我们的意图,所以,在问问题的时候,不要惜字如金,多说一些内容,多提供一些信息,这样可以很有效的提高大模型回复的质量和丰富性。我们来看一个例子:当我们想要大模型为我们提供一些思维模型时,本能的问法可能是:“给我列几个思维模型”。于是很常见下面这样的对话:当我们愿意给出更多信息,比如我们为什么需要这个模型,希望ChatGPT列举三个模型,以及是否有我们已知的模型作为参考时,ChatGPT可以提供更加符合我们预期的回答:我们再来看一个例子,假设我们想请ChatGPT帮助我们记忆一个比较抽象的概念,我们可能会脱口而出这样的问题:但如果我们停下来思考一下,深想一步,提供更多细节,就能得到更符合期望的回答了:最后,我们想通过ChatGPT来了解提示词,这是一个坏例子:让我们给出特定的情景和进一步思考的问题:

小七姐:官方最佳 Prompt 实践的六个方法

作者:小七姐可以在以下地址关注她:[小七姐的prompt学习社群](https://t.zsxq.com/15KhQ0RE7)[heading1]01学习地图|编写清晰的说明-多说两句,提供细节[content]在OpenAI官方的说明文档(Documentation-[GPT best practices](https://platform.openai.com/docs/guides/gpt-best-practices/gpt-best-practices)),也就是我们常常提到的“官方最佳实践”中,为用户提供了若干项策略,以帮助用户更好的使用ChatGPT。[heading2]策略一:编写清晰的说明[content]在询问中包含详细信息,以获得更多相关答复。这是因为,大模型不是我们肚子里的蛔虫,它无法在有限的信息中“猜测”我们的意图,所以,在问问题的时候,不要惜字如金,多说一些内容,多提供一些信息,这样可以很有效的提高大模型回复的质量和丰富性。我们来看一个例子:当我们想要大模型为我们提供一些思维模型时,本能的问法可能是:“给我列几个思维模型”。于是很常见下面这样的对话:当我们愿意给出更多信息,比如我们为什么需要这个模型,希望ChatGPT列举三个模型,以及是否有我们已知的模型作为参考时,ChatGPT可以提供更加符合我们预期的回答:我们再来看一个例子,假设我们想请ChatGPT帮助我们记忆一个比较抽象的概念,我们可能会脱口而出这样的问题:但如果我们停下来思考一下,深想一步,提供更多细节,就能得到更符合期望的回答了:最后,我们想通过ChatGPT来了解提示词,这是一个坏例子:让我们给出特定的情景和进一步思考的问题:

Others are asking
OpenAI Operator, Anthropic Claude Coder
以下是关于 OpenAI Operator 和 Anthropic Claude Coder 的相关信息: 2025 年 Agent 领域的发展预测: 从对话助手到行动型智能体是 2025 年 Agent 技术的主流发展方向之一。计算机操作能力取得突破,传统大模型更多充当聊天助手,而 2025 年的突破在于让 Agent 直接“动手”操作电脑和网络环境。 Anthropic 在 2024 年底发布的 Claude 3.5 Sonnet 首次引入“Computer Use”能力,让 AI 像人一样通过视觉感知屏幕并操作鼠标键盘,实现了 AI 自主使用电脑的雏形。 OpenAI 在同期推出了代号“Operator”的 Agent 及其核心模型“计算机使用智能体”(CUA),使 GPT4 获得直接与图形界面交互的能力。CUA 通过强化学习将 GPT4 的视觉能力与高级推理相结合,训练 AI 可像人一样点击按钮、填表、滚动页面等。在 OpenAI 的测试中,CUA 在浏览器任务基准 WebArena 和 WebVoyager 上分别达到 38.1%和 87%的成功率,后者已接近人类水平。 其他相关信息: 宝玉日报 1 月 25 日: Deepseek 提示词框架包含四大模块:任务目的(Purpose)、计划规则(Planning Rules)、格式规则(Format Rules)、输出说明(Output)。 Anthropic 的 Claude 可通过屏幕截图获取计算机视觉信息,计算光标移动的像素坐标,并执行点击、滚动等操作。 OpenAI Operator 利用虚拟主机和 Chrome 浏览器,通过 CUA 实现网页实时操作,支持复杂任务导航。 主要的大语言模型: OpenAI 系统包括 3.5 和 4 等,3.5 模型在 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。新的变种使用插件连接到互联网和其他应用程序。Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。未为 OpenAI 付费只能使用 3.5。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,连接到互联网。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是 PaLM 2 模型。 Anthropic 发布了 Claude 2,其最值得注意的是有一个非常大的上下文窗口。
2025-04-01
OpenAI o1、Claude Sonnet 3.7、Gemini 2.0 pro 哪个 AI 搜索能力更强?
OpenAI o1、Claude Sonnet 3.7 和 Gemini 2.0 pro 在不同方面具有各自的优势,难以简单地比较哪个的搜索能力更强。 OpenAI o1 推理能力强,适合作为架构师或算法顾问。 Claude Sonnet 3.7 擅长长上下文任务,在快速生成代码与网页设计方面表现出色。 Gemini 2.0 pro 长上下文支持较好(2M Tokens),适合代码反编译与混淆代码分析。 具体的搜索能力表现还会受到应用场景和具体任务的影响。
2025-03-21
openai deep research使用技巧
OpenAI 的 Deep Research 功能能够整合多源信息,进行复杂的信息查询与分析,并生成专业水准的报告,同时详细展示思考和搜索过程。目前,该功能仅支持文本输出,未来还将增加嵌入式图片、数据可视化等功能。使用入口为在 ChatGPT 输入框中选择「Deep Research」模式,输入问题后即可开始体验。 在 OpenAI 推出「Deep Research」功能一天后,Hugging Face 的工程师迅速联合推出了免费开源的版本 Open Deep Research,能自主浏览网页、滚动页面、处理文件,以及基于数据进行计算。使用入口为前往 Demo 网站(opendeepresearch.vercel.app)体验。 Deep Research 让 AI 自动完成多步骤研究任务,快速分析海量信息并生成专业报告,具备自动化信息汇总、文献引用与多领域适用性,适合科研、工程、金融等行业。目前向 Pro 用户开放,未来将扩展至 Plus 和 Team 用户,并提供更强大的功能。 该智能体基于优化版 OpenAI o3 模型,结合网络浏览和 Python 分析能力,实现高效研究,适用于科学、政策、工程等高强度知识工作,也能帮助购物者做复杂决策。Pro 用户已可使用,后续将逐步向 Plus、Team 和企业用户开放。
2025-03-08
openAI的deep research有哪些缺陷
OpenAI 的 Deep Research 存在以下一些缺陷: 1. 具有滞后性,在某些信息上无法做到及时更新。 2. 存在信息混乱的问题,无法完全替代人类的深度思考。
2025-03-03
Monica和Openai的记忆功能是如何让大模型产生记忆的?是什么原理?
大模型的记忆功能实现方式较为复杂,不同的模型可能有所不同。 OpenAI 的模型中,大模型 LLM 扮演了“大脑”的角色,其记忆功能可能通过“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构来实现。但需要注意的是,对于 ChatGPT 这类模型,实际上其本质上并没有直接的记忆功能。它能理解之前的交流内容,是因为每次将之前的对话内容作为新的输入重新提供给模型。这种记忆功能并非由大型模型直接实现,而是通过在别处进行存储来达成。 如果对话内容过长,可能会影响模型的整体性能。解决这个问题的一个简单方法是启动另一个对话框。对于之前的数据,通常只能进行总结。
2025-03-01
openai
OpenAI 相关信息如下: 模型: OpenAI API 由多种具有不同功能和价位的模型提供支持,还可通过微调针对特定用例对原始基本模型进行有限定制。 具体模型包括:GPT4 Beta(一组改进 GPT3.5 的模型,可理解和生成自然语言或代码)、GPT3.5(一组改进 GPT3 的模型,可理解并生成自然语言或代码)、DALL·E Beta(可在给定自然语言提示的情况下生成和编辑图像的模型)、Whisper Beta(可将音频转换为文本的模型)、Embeddings(可将文本转换为数字形式的模型)、Codex Limited Beta(一组可理解和生成代码的模型,包括将自然语言转换为代码)、Moderation(可检测文本是否敏感或不安全的微调模型)、GPT3(一组可理解和生成自然语言的模型)。 通用人工智能(AGI)计划: 有网络上传播的关于 OpenAI 计划在 2027 年前实现通用人工智能(AGI)的计划的相关文档,内容为各种报道和推文的拼凑猜测。 文档提到 OpenAI 于 2022 年 8 月开始训练一个拥有 125 万亿参数的多模态模型,第一阶段被称为 Arrakis 或 Q,该模型于 2023 年 12 月完成训练,但因高昂推理成本发布被取消,原计划 2025 年发布的 GPT5 取消,Gobi(GPT4.5)被重新命名为 GPT5。 技术栈: 从 GPT、DALL·E 到 Sora,OpenAI 成功跑通了 AGI 的所有技术栈。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现、商业和技术趋势上分析了原因,并尝试预测了 OpenAI 下一步的进展。
2025-02-24
国内好用的文档排版AI工具
以下是国内一些好用的文档排版 AI 工具: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档整体风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性,保持原意。 3. Latex:虽不是纯粹的 AI 工具,但在学术论文排版方面广泛使用,有许多 AI 辅助的编辑器和插件简化排版过程。 4. PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 5. Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业,保持原始意图。 6. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 受欢迎;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。 此外,还有一些与文档相关的 AI 工具,如文章润色工具: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,优化文章语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可根据输入生成符合要求的学术论文。 制作 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-13
自动翻译英文文档
以下是关于您提出的“自动翻译英文文档”的相关内容: 一个基于 Python 的网页截图工具具有自动翻译英文内容为中文的功能。 在 Cursor 编辑器中,可直接在 Cursor Chat 里提出将中文版博客翻译成英文的要求,它会给出英文版本的文章,还能自动对比中英文文档并高亮差别,方便对英文进行直观修改,最终完成翻译。
2025-04-11
AI文本工具操作文档
以下是为您整理的一些 AI 文本工具的操作文档: AIGC 论文检测网站 1. 功能:提供免费的 AI 内容检测工具,可识别文本是否由 AI 生成。 使用方法:将文本粘贴到在线工具中,点击检测按钮,系统会提供分析结果。 2. GPTZero 功能:专门设计用于检测由 GPT3 生成的内容,适用于教育和出版行业。 使用方法:上传文档或输入文本,系统会分析并提供报告,显示文本是否由 GPT3 生成。 3. Content at Scale 功能:提供 AI 内容检测功能,帮助用户识别文本是否由 AI 生成。 使用方法:将文本粘贴到在线检测工具中,系统会分析并提供结果。 【TecCreative】帮助手册 1. 创意工具箱 AI 字幕 智能识别视频语言并生成对应字幕,满足海外多国投放场景需求。 操作指引:点击上传视频——开始生成——字幕解析完成——下载 SRT 字幕。注意:支持 MP4 文件类型,大小上限为 50M。 文生图 仅需输入文本描述,即可一键生成图片素材,海量创意灵感信手拈来! 操作指引:输入文本描述(关键词或场景描述等)——选择模型(注意 FLUX 模型不可商用)——开始生成——下载。 AI 翻译 支持多语种文本翻译,翻译结果实时准确,助力海外投放无语言障碍! 操作指引:输入原始文本——选择翻译的目标语言——开始生成。 TikTok 风格数字人 适配 TikTok 媒体平台的数字人形象上线,100+数字人模板可供选择,助力 TikTok 营销素材生产无难度! 操作指引:输入口播文案——选择数字人角色——点击开始生成。视频默认输出语言和输入文案语言保持一致,默认尺寸为 9:16 竖版。 多场景数字人口播配音 支持生成不同场景下(室内、户外、站姿、坐姿等)的数字人口播视频,一键满足多场景投放需求! 操作指引:输入口播文案——选择数字人角色和场景——选择输出类型——点击开始生成。视频默认输出语言和输入文案语言保持一致。 工具教程:AI 漫画 Anifusion 网址:https://anifusion.ai/ ,twitter 账号:https://x.com/anifusion_ai 功能: AI 文本生成漫画:用户输入描述性提示,AI 会根据文本生成相应的漫画页面或面板。 直观的布局工具:提供预设模板,用户也可自定义漫画布局,设计独特的面板结构。 强大的画布编辑器:在浏览器中直接优化和完善 AI 生成的艺术作品,调整角色姿势、面部细节等。 多种 AI 模型支持:高级用户可访问多种 LoRA 模型,实现不同的艺术风格和效果。 商业使用权:用户对在平台上创作的所有作品拥有完整的商业使用权,可自由用于商业目的。 使用案例: 独立漫画创作:有抱负的漫画艺术家无需高级绘画技能即可将他们的故事变为现实。 快速原型设计:专业艺术家可以在详细插图之前快速可视化故事概念和布局。 教育内容:教师和教育工作者可以为课程和演示创建引人入胜的视觉内容。 营销材料:企业可以制作动漫风格的促销漫画或用于活动的分镜脚本。 粉丝艺术和同人志:粉丝可以基于他们最喜欢的动漫和漫画系列创作衍生作品。 优点: 非艺术家也可轻松进行漫画创作。 基于浏览器的全方位解决方案,无需安装额外软件。 快速迭代和原型设计能力。 创作的全部商业权利。 缺点:(未提及)
2025-04-11
图片文字转文档
图片文字转文档可以通过以下方式实现: coze 插件中的 OCR 插件: 插件名称:OCR 插件分类:实用工具 API 参数:Image2text,图片的 url 地址必填 用途:包括文档数字化、数据录入、图像检索、自动翻译、文字提取、自动化流程、历史文献数字化等。例如将纸质文档转换为可编辑的电子文档,自动识别表单、票据等中的信息,通过识别图像中的文字进行搜索和分类,识别文字后进行翻译,从图像中提取有用的文字信息,集成到其他系统中实现自动化处理,保护和传承文化遗产。 插件的使用技巧:暂未提及。 调用指令:暂未提及。 PailidoAI 拍立得(开源代码): 逻辑:用户上传图片后,大模型根据所选场景生成相关的文字描述或解说文本。 核心:包括图片内容识别,大模型需要准确识别图片中的物体、场景、文字等信息;高质量文本生成,根据图片生成的文字不仅需要准确,还需符合专业领域的要求,保证文字的逻辑性、清晰性与可读性。 场景应用: 产品文档生成(电商/零售):企业可以利用该功能将商品的图片(如电器、服饰、化妆品等)上传到系统后,自动生成商品的详细描述、规格和卖点总结,提高电商平台和零售商的商品上架效率,减少人工编写文案的工作量。 社交媒体内容生成(品牌营销):企业可使用图片转文本功能,帮助生成社交媒体平台的营销文案。通过上传产品展示图片或品牌活动图片,模型可自动生成具有吸引力的宣传文案,直接用于社交媒体发布,提高营销效率。 法律文件自动生成(法律行业):法律行业可以使用图片转文本技术,自动提取合同、证据材料等图片中的文本信息,生成法律文件摘要,辅助律师快速进行案件分析。
2025-04-11
cursor 长文档处理长文档
以下是关于 Cursor 长文档处理的相关信息: UI 用户界面: 当 Cursor 仅添加其他文本时,补全将显示为灰色文本。如果建议修改了现有代码,它将在当前行的右侧显示为 diff 弹出窗口。 您可以通过按 Tab 键接受建议,也可以通过按 Esc 键拒绝建议。要逐字部分接受建议,请按 Ctrl/⌘→。要拒绝建议,只需继续输入,或使用 Escape 取消/隐藏建议。 每次击键或光标移动时,Cursor 都会尝试根据您最近的更改提出建议。但是,Cursor 不会始终显示建议;有时,模型预测不会做出任何更改。 Cursor 可以从当前行上方的一行更改为当前行下方的两行。 切换: 要打开或关闭该功能,请将鼠标悬停在应用程序右下角状态栏上的“光标选项卡”图标上。 @Docs: Cursor 附带一组第三方文档,这些文档已爬取、索引并准备好用作上下文。您可以使用@Docs 符号访问它们。 如果要对尚未提供的自定义文档进行爬网和索引,可以通过@Docs>Add new doc 来实现。粘贴所需文档的 URL 后,将显示相应模式。然后 Cursor 将索引并学习文档,您将能够像任何其他文档一样将其用作上下文。 在 Cursor Settings>Features>Docs 下,您可以管理已添加的文档,包括编辑、删除或添加新文档。 @Files: 在 AI 输入框中(如 Cursor Chat 和 Cmd K),可以使用@Files 引用整个文件。如果继续在@后键入,将在策略之后看到文件搜索结果。 为确保引用的文件正确,Cursor 会显示文件路径的预览,这在不同文件夹中有多个同名文件时尤其有用。 在 Cursor 的聊天中,如果文件内容太长,Cursor 会将文件分块为较小的块,并根据与查询的相关性对它们进行重新排序。
2025-04-10
学习路径文档
以下是为您提供的新手学习 AI 的路径文档: 首先,了解 AI 基本概念。建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 然后,开始 AI 学习之旅。在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有可能获得证书。 接着,选择感兴趣的模块深入学习。AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。特别建议您掌握提示词的技巧,它上手容易且很有用。 之后,进行实践和尝试。理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后也进行分享。 最后,体验 AI 产品。与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 此外,雪梅 May 的 AI 学习经验也值得参考。May 发现自己的学习路径是:迈出第一步→大量的学习输入→疯狂的模仿→开始自己创造→学的越来越宽越来越杂→积累的量变产生质变→开始分享。特别是学习 coze 的路径:输入→模仿→自发创造,这是她真实实践下来之后发现的学习规律。May 还提到,虽然费曼学习法告诉我们,学习最好的方式是教会别人,但在一开始学习 AI 时,自学和输入为主也是可行的。回想起来,如果能量更足、更有勇气,可以更早地开始输出倒逼输入。不过不要为难自己,只要迈开脚步,就是进步。
2025-04-09
deepseek官方教程
以下是关于 DeepSeek 的官方教程相关信息: 火山方舟 DeepSeek 申请免费额度教程,包含多种 API 使用方式,如飞书多维表格调用、Coze 智能体调用、浏览器插件调用。可以使用邀请码 D3H5G9QA,通过邀请链接 https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 邀请可拿 3000 万 tokens,畅享 671B DeepSeek R1,活动截止至北京时间 20250218 23:59:59。同时,火山方舟大模型服务平台的模型服务计费文档有更新,DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动。 有关于一线教师的 AI 需求与高效工具推荐,如让模型创作诗歌、生成宣传标语、提示库(https://apidocs.deepseek.com/zhcn/promptlibrary)、代码解释、内容分类、角色扮演(自定义人设)、散文写作、文案大纲生成、模型提示词生成等。 2 月 14 日的社区动态中,有《突破 DeepSeek R1 能力天花板,火山引擎扣子+飞书一站式企业解决方案》《羊毛快薅|字节火山上线了 DeepSeek 系列模型并悄悄更改了模型服务价格...》等内容,还附上了飞书多维表格、Coze 的接入使用方法等。此外,还有关于 DeepSeek 关键 9 篇论文及创新点的讲解,以及 DeepSeek 官方发布的 R1 模型推荐设置。
2025-04-15
midjourney中文站和官方网站上的内容是一样的吗
Midjourney 中文站和官方网站的内容不完全一样。 Midjourney 官网具有以下特点和操作细节: 已向生成 100 张以上图片的用户开放使用权限,登录官网后,左侧为各种页面入口,顶部有生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,随时可用 prompt 框和搜索框,无需频繁切换页面。 可通过点击 prompt 框最右侧的图标设置常用参数默认值,包括画面比例和个性化模型开关。 图片参考在官网上变得简单直观,点击 prompt 框最左侧的图片按钮或直接拖入图片即可,官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,如需多种参考逻辑可按住 shift 键点选多个图标。 创作页面的最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片会进入单图调整模式,常用的操作指令集中在右下角的按键中,并且上线了全新的 Editor 编辑器功能。 此外,关于 Midjourney 还有以下相关内容: 有关于 Midjourney v5.1 的 AIGC Weekly23 相关介绍。 有 Midjourney 的隐私政策,包括适用范围、变更情况、定义等。
2025-03-18
stable diffusion官方网址
Stable Diffusion 的官方网址如下: SD 1.4 官方项目:https://github.com/CompVis/stablediffusion SD 1.5 官方项目:https://github.com/runwayml/stablediffusion SD 2.x 官方项目:https://github.com/StabilityAI/stablediffusion diffusers 库中的 SD 代码 pipelines:https://github.com/huggingface/diffusers/tree/main/src/diffusers/pipelines/stable_diffusion
2025-02-08
大模型的定义是什么?有官方权威定义吗
大模型的定义可以从以下几个方面来理解: 1. 从技术角度:以 Transform 为代表的大模型采用自注意力(Selfattention)机制来学习不同 token 之间的依赖关系,生成高质量 embedding。大模型的“大”主要指用于表达 token 之间关系的参数多,例如模型中的权重(weight)与偏置(bias),像 GPT3 拥有 1750 亿参数。 2. 通俗来讲:大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够理解自然语言,进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。 3. 类比角度:可以用『上学参加工作』这件事来类比大模型的训练、使用过程,包括找学校(需要大量计算资源)、确定教材(需要大量数据)、找老师(选择算法)、就业指导(微调)、搬砖(推导)等。 4. 分类角度:大型模型主要分为两类,一是大型语言模型,专注于处理和生成文本信息;二是大型多模态模型,能够处理包括文本、图片、音频等多种类型的信息。 参考:
2024-12-13
请给我chatgpt的官方使用教程,教会我作为一个新人小白,怎样可以快速的学会使用chatgpt
以下是关于 ChatGPT 的使用教程: 一、认识 ChatGPT 1. ChatGPT 名称含义:GPT 即 Generative PreTraining Transformer,其中 Generative 表示生成式,PreTraining 表示预训练,Transformer 表示转换器。 2. 实质功能:本质是“单字接龙”,长文由单字接龙的回归所生成。GPT 作为大脑即模型需要训练,训练方式是通过材料学习,不断形成模型。训练目的是学习“提问和回答的通用规律”,实现举一反三。但它不是搜索引擎的升级版,可能出现“幻觉”,对现实不存在的东西进行合乎规律的捏造。 二、注册、安装、订阅 1. 简介:ChatGPT 是一种基于 GPT 架构的人工智能模型,由 OpenAI 开发,是自然语言处理工具,能理解和生成接近人类水平的文本。 2. 版本:目前官网有 GPT3.5 和 GPT4 两个版本。GPT3.5 免费,拥有账号即可使用;GPT4 智能程度更高,有更多功能,如 DALL.E3(AI 画图功能)和 GPTs 商店和高级数据分析等插件,PLUS 套餐收费 20 美金/月,还有团队版和企业版,费用更贵,一般推荐 PLUS 套餐。 3. 注册准备:在注册 ChatGPT 账号前,先注册谷歌账号,因其支持一键登录,可省去很多后续注册流程。谷歌账号注册支持国内手机号码和国内邮箱验证,过程简单。 三、学习英语的应用 推特博主的英语老师制作了一个 GPT 工作流,基于个人日常需求生成定制素材。具体使用方法: 1. 先把特定 prompt 喂给 ChatGPT(建议开新对话专门用于学习英文)。 2. 然后 ChatGPT 会扮演美国好朋友,对输入的英文和中文表达返回更地道的表达,对俚语部分加粗,还会举一反三结合欧美流行内容给出更多例子。 3. 输入特定语句,ChatGPT 会输出对话回顾并建议 3 个推荐任务强化记忆。 建议使用方式:开窗口复制 prompt,手机端打开历史记录,点右上角耳机图标打电话,既能练口语又能练听力,结束后看回顾帮助阅读。 群友也写了类似版本在讯飞上尝试,效果不错。
2024-11-23
openai 官方发布 学生写作指南
以下是 OpenAI 官方发布的与学生写作相关的指南内容: 目录: 一、获得更好结果的六种策略 写清楚说明 GPT 模型无法读取您的心思,输出不符合期望时可提出具体要求,如简短回答、专家级别写作、指定格式等。越少让模型猜测您的需求,越可能获得满意结果。 策略包括在问题中包含细节、要求模型采用角色、使用分隔符区分输入部分、指定完成任务的步骤、提供示例、指定期望的输出长度。 提供参考文本 GPT 可能编造假答案,为其提供参考文本可减少这种情况,如指示模型使用参考文本回答、使用参考文本中的引用来回答。 六大策略助您获得更佳结果 撰写清晰的指令 模型无法读心,输出不理想时可调整要求,让模型无需猜测您的想法以获得期望结果。 技巧包括在查询中添加详细信息、请求模型扮演特定角色、使用分隔符区分输入部分、明确指出完成任务的步骤、提供实例、明确指定希望输出的长度。 相关原始链接:https://www.oneusefulthing.org/p/howtouseaitodostuffanopinionated 。
2024-11-15