Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

各个大模型tokens价格

Answer

截止 2024 年 5 月，我查询到的大模型Token价格供您参考：

截屏2024-05-11 20.12.40.png

Content generated by AI large model, please carefully verify (powered by aily)

References

学习笔记：Generative AI for Everyone吴恩达

token，通常指的是：文本中可以被视为一个单独单位的元素，比如单词、数字或符号。如图所示，普通常见单词，使用一个token，但是不常见的单词可能被计算机拆分，于是会消耗更多的token.如果需要使用300个单词，大概会使用400个token.一般token消化会比单词书多出33%左右。价格举例：计算举例：一个人每分钟阅读250个词，一小时可以阅读15000个词；但因为需要输入以后才有输出，所以文本输入假设与文本输出相同，那输入同样需要15000个词；输入与输出一共需要30000个词，按照转化率，约需要40000个token；按每1千个token需要0.002美元来看，GPT3.5供一个成年人阅读使用1小时，消耗0.08美元即8美分;当然如果变成GPT4，费用就变成了2.4美元

XiaoHu.AI日报

?Xiaohu.AI日报「3月14日」 ✨✨✨✨✨✨✨✨1⃣️?Claude 3 Haiku API发布：最快、性价比最高的型号。每百万输入token 0.25美元，每百万输出token 1.25美元。可以处理和分析400起最高法院案件或2500张图片只需1美元。? https://x.com/imxiaohu/status/1768284259792691366?s=202⃣️?Starship第三次飞行测试：SpaceX星际飞船成功发射进入预定轨道。重达5000吨，成为有史以来最大的飞行器。? https://x.com/imxiaohu/status/1768273741262520394?s=203⃣️?Midjourney禁止生成拜登和特朗普的图片：以应对美国总统选举，禁止生成拜登和特朗普的虚假图片。测试发现尝试生成特定图片时会收到警告。CEO David Holz强调不想在政治言论上花费太多时间。? https://x.com/imxiaohu/status/1768258401518362625?s=204⃣️?零一万物大模型开放API接口：1000,000 tokens最低6元。

XiaoHu.AI日报

?Xiaohu.AI日报「3月14日」 ✨✨✨✨✨✨✨✨1⃣️?Claude 3 Haiku API发布：最快、性价比最高的型号。每百万输入token 0.25美元，每百万输出token 1.25美元。可以处理和分析400起最高法院案件或2500张图片只需1美元。? https://x.com/imxiaohu/status/1768284259792691366?s=202⃣️?Starship第三次飞行测试：SpaceX星际飞船成功发射进入预定轨道。重达5000吨，成为有史以来最大的飞行器。? https://x.com/imxiaohu/status/1768273741262520394?s=203⃣️?Midjourney禁止生成拜登和特朗普的图片：以应对美国总统选举，禁止生成拜登和特朗普的虚假图片。测试发现尝试生成特定图片时会收到警告。CEO David Holz强调不想在政治言论上花费太多时间。? https://x.com/imxiaohu/status/1768258401518362625?s=204⃣️?零一万物大模型开放API接口：1000,000 tokens最低6元。

Others are asking

飞书多维表格中使用deepseek有100万tokens总量的限制？

飞书多维表格中使用 DeepSeek 有一定的 token 总量限制。DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动（算下来 5 元有 100 万）。即日起至北京时间 20250218 23:59:59，所有用户均可在方舟享受 DeepSeek 模型服务的价格优惠。不同模型的 token 限制有所不同，例如 Claude2100 k 模型的上下文上限是 100k Tokens，即 100000 个 token；ChatGPT16 k 模型的上下文上限是 16k Tokens，即 16000 个 token；ChatGPT432 k 模型的上下文上限是 32k Tokens，即 32000 个 token。 Token 限制同时对一次性输入和一次对话的总体上下文长度生效，不是达到上限就停止对话，而是会遗忘最前面的对话。如果想直观查看 GPT 如何切分 token，可以打开，在其中可以看到实时生成的 tokens 消耗和对应字符数量。需要注意的是，英文的 Token 占用相对于中文较少，这也是很多中文长 Prompt 会被建议翻译成英文设定然后要求中文输出的原因。

什么是tokens

在大语言模型领域，Token 通常用来表示文本数据中的一个单元。在不同的语境下，一个 Token 可能代表一个字、一个词，或者是一个句子。在英文中，一个 Token 通常是一个词或者是标点符号。在一些汉语处理系统中，一个 Token 可能是一个字，也可能是一个词。Token 是处理和理解文本数据的基本单元。在深度学习的语言模型中，如 Transformer，输入的文本首先被切分成一系列的 Tokens。这些 Tokens 被转换成向量，然后被输入到神经网络中进行处理。因此，在这种情况下，Token 可以被理解为语言模型接收和处理的最小的信息单元。在训练过程中，每个 Token 会关联一个预测，这个预测可以是下一个 Token 的预测，也可以是该 Token 的属性预测，如词性、情感等。训练 Token 的数量会影响模型的性能和准确性。更多的训练 Token 通常意味着更多的训练数据，这可能会提升模型的准确性和泛化能力。然而，处理更多的 Token 也会增加计算的复杂性和计算资源的需求。很多同学把 Token 理解为中文语义里的“字节”，这种理解有一定的类比相似性，因为“字节”是计算机存储和处理数据的基本单元，而“Token”是语言模型处理文本信息的基本单元。但这种理解不够准确，“Token”在语言模型中的作用比“字节”在计算机中的作用更加复杂和多元。在大语言模型中，“Token”不仅代表文本数据中的一个单位，而且每个“Token”都可能携带了丰富的语义信息。比如，在处理一句话时，“Token”可能表示一个字，一个词，甚至一个短语，这些都可以被认为是语言的基本单元。同时，每个“Token”在模型中都有一个对应的向量表示，这个向量包含了该“Token”的语义信息、句法信息等。 Unicode 是一种在计算机上使用的字符编码，为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。例如中文中的“你”字对应特定的 Unicode 编码。GPT 实际是将我们输入的文字转换成 Token，然后通过 GPT 模型预测 Token，再将 Token 转换成文字，最后再输出给我们。通过 Token 的学习，能感觉到 ChatGPT 理解文本的方式和人类并不相同，它在以自己的方式理解这个世界。在 ComfyUI SD3 中，如输入的文字描述会被转换为 Tokens（文本向量），其中包括使用 CLIPG/14、CLIPL/14、T5 XXL 等预训练文本编码器将描述文字转换为 Tokens，每个编码器生成 77 个 Token，总共 154 个 Token 等一系列处理过程。

100 万 tokens 什么概念

100 万 tokens 具有以下重要意义和影响：算法视角：更宽的上下文窗口允许模型在推理时纳入训练数据中未找到的大量新的、特定于任务的信息，从而提高各种自然语言或多模式任务的性能。对越来越长的上下文进行数据建模的能力经历了从 Shannon 1948 提出的 2gram 语言模型、到 1990 年代和 2000 年代的现代 ngram 模型（5 个上下文 token），2010 年代的循环神经网络（RNN）达到数百个 token（Jozefowicz 等），到 2023 年 Anthropic 将上下文扩展到几十万 token 的发展历程。产品视角：长上下文意味着 LLM 理解能力增强。从提示词到 RAG，都是为了增加给模型的上下文，进而让需求更明确，让模型理解得更好。从用数据训练模型、到指令微调，到提示词和 RAG，到大模型的超长下文，机器越来越像人了。提示词和 RAG 正在快速被弱化，但出于工程和商业考量，目前在很多领域还是主流，未来依然可能是一个混合状态。模型上下文长度覆盖了书籍、电影、长视频等产品的通用长度，应该会引发相关链路上产品交互层的变化。具体应用：Gemini1.5 支持 100 万 token，可以一次性处理大量信息，比如 1 小时的视频，11 小时的音频，超过 30,000 行代码或超过 700,000 个单词的代码库。Claude2100 k 模型的上下文上限是 100k Tokens，即 100000 个 Token。ChatGPT16 k 模型的上下文上限是 16k Tokens，即 16000 个 Token；ChatGPT432 k 模型的上下文上限是 32k Tokens，即 32000 个 Token。Token 限制同时对一次性输入和一次对话的总体上下文长度生效，当达到上限时，会遗忘最前面的对话。若想直观查看 GPT 如何切分 token，可以打开。此外，英文的 Token 占用相对于中文较少，因此很多中文长 Prompt 会被建议翻译成英文设定，然后要求中文输出。

智谱注册送2000万 tokens

智谱 BigModel 共学营第二期相关信息如下：本期共学应用为人人可打造的微信助手。注册智谱 Tokens：智谱 AI 开放平台的网址为 https://bigmodel.cn/ 。参与课程至少需要有 token 体验资源包，获取资源包有三种方式：新注册用户，注册即送 2000 万 Tokens。充值/购买多种模型的低价福利资源包，直接充值现金，所有模型可适用的网址为 https://open.bigmodel.cn/finance/pay 。共学营报名赠送资源包。语言资源包：免费 GLM4Flash 语言模型/ 。多模态资源包：。多模态资源包：。所有资源包购买地址：https://bigmodel.cn/finance/resourcepack 。先去【财务台】左侧的【资源包管理】看看自己的资源包，本次项目会使用到的有 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 模型。进入智能体中心我的智能体，开始创建智能体。会议 ID：185 655 937 ，会议链接：https://vc.feishu.cn/j/185655937 ，共学营互动群。 BigModel 开放平台是智谱一站式的大模型开发及应用构建平台。基于智谱自研的全模型矩阵，面向企业客户及合作伙伴，支持多样化模型和自定义编排。平台提供即插即用的智能工具箱，包括 API 接口、模型微调及部署功能，同时具备流程编排以适应复杂业务场景。还提供免费、好用、高并发的 GLM4Flash 模型，0 元上手大模型，新用户注册登录即送 2000 万 Tokens，调用智谱全家桶模型。更多应用场景包括：。

上下文窗口和 tokens限制

以下是关于上下文窗口和 tokens 限制的详细解释： Token 方面： Token 是大模型语言体系中的最小单元。人类语言发送给大模型时，会先被转换为大模型自己的语言，大模型推理生成答案后再翻译为人类能看懂的语言输出。不同厂商的大模型对中文的文本切分方法不同，通常 1Token 约等于 1 2 个汉字。大模型的收费计算方法以及对输入输出长度的限制，都是以 token 为单位计量的。上下文方面：上下文指对话聊天内容前、后的内容信息，其长度和窗口都会影响大模型回答的质量。上下文长度限制了模型一次交互中能够处理的最大 token 数量，上下文窗口限制了模型在生成每个新 token 时实际参考的前面内容的范围。目前常见模型的 token 限制： Claude 2 100k 模型的上下文上限是 100k Tokens，即 100000 个 token。 ChatGPT 16k 模型的上下文上限是 16k Tokens，即 16000 个 token。 ChatGPT 4 32k 模型的上下文上限是 32k Tokens，即 32000 个 token。 Token 限制的影响：对一次性输入和一次对话的总体上下文长度同时生效。当达到上限时，不是停止对话，而是遗忘最前面的对话，类似于鱼的短暂记忆。查看 token 使用量：对于 GPT，可以打开查看实时生成的 tokens 消耗和对应字符数量。需注意 GPT3 和 GPT3.5/4 的 token 计算方式不同，且英文的 Token 占用相对于中文较少，这也是很多中文长 Prompt 会被建议翻译成英文设定然后要求中文输出的原因。 Token 限制对 Prompt 编写的影响：理解前面的内容后，答案应在您的脑海中有雏形。

大模型的系统提示词

大模型的系统提示词主要包括以下方面： 1. 在“五津：一键生成‘摸鱼打工猫’视频”中，针对用户选择的主题和回答，总结用户的创作意图，如“打工猫摸鱼的 2 小时，在巴厘岛能看一场日落”，并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词，以数组形式输出到“tishici”，将用户意图输出到“biaoti”。 2. 在“云中江树：智能对决：提示词攻防中的 AI 安全博弈”中，系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意；模型侧对于有能力的厂商应增强安全性并平衡性能，开发者则要在开发中带着安全意识优化系统提示词，加入安全引导和禁止内容等；输出侧可使用传统防御和内容过滤手段，并针对大模型特点进行私有数据泄露等检查。此外，还提到间接注入和提示词泄露的情况，间接注入常发生在应用获取依赖外部数据资源时，攻击者通过隐藏恶意指令完成攻击；提示词泄露指试图操纵模型输出获取部分或全部系统提示词，大模型输出内容可分为系统提示词、用户提示和助手提示词三段，通过攻击手段可获取系统提示词。

通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash，这3个视觉理解大模型哪个最厉害？

以下是对通义千问 Qwen2.5VL 模型的介绍：版本：有 3B、7B 和 72B 三个尺寸版本。主要优势：视觉理解能力：在 13 项权威评测中夺得视觉理解冠军，全面超越 GPT4o 与 Claude3.5。视频理解能力：支持超 1 小时的视频理解，无需微调即可变身为 AI 视觉智能体，实现多步骤复杂操作。万物识别：擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。精准的视觉定位：采用矩形框和点的多样化方式对通用物体定位，支持层级化定位和规范的 JSON 格式输出。全面的文字识别和理解：提升 OCR 识别能力，增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析：设计了更全面的文档解析格式，称为 QwenVL HTML 格式，能够精准还原文档中的版面布局。增强的视频理解：引入动态帧率（FPS）训练和绝对时间编码技术，支持小时级别的超长视频理解，具备秒级的事件定位能力。开源平台： Huggingface：https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope：https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat：https://chat.qwenlm.ai 然而，对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型，目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容，因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看，其在视觉理解方面具有较强的能力和优势。

目前全世界最厉害的对视频视觉理解能力大模型是哪个

目前在视频视觉理解能力方面表现出色的大模型有： 1. 昆仑万维的 SkyReelsV1：它不仅支持文生视频、图生视频，还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL：在 13 项权威评测中夺得视觉理解冠军，全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解，无需微调即可变身为 AI 视觉智能体，实现多步骤复杂操作。擅长万物识别，能分析图像中的文本、图表、图标、图形和布局等。

目前全世界最厉害的视频视觉理解大模型是哪个

目前全世界较为厉害的视频视觉理解大模型有以下几个： 1. 昆仑万维的 SkyReelsV1：不仅支持文生视频、图生视频，是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元：语义理解能力出色，能精准还原复杂的场景和动作，如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5：全球最快的 AI 视频生成模型，Turbo 模式下可在 10 秒内生成视频，最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能，具备顶尖动漫生成能力。

目前全世界最厉害的视觉理解大模型是哪个

目前在视觉理解大模型方面，较为突出的有 DeepSeek 的 JanusPro 模型，它将图像理解和生成统一在一个模型中；还有通义千问的视觉理解模型，其价格有较大降幅。此外，Pixverse V3.5 是全球最快的 AI 视频生成模型，在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型，因为这取决于不同的评估标准和应用场景。

大模型对话产品的优劣

大模型对话产品具有以下优点： 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验，具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接，产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务，适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景，如私有领域知识问答、个性化聊天机器人、智能助手等。大模型对话产品也存在一些缺点： 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情，全靠用户脑补，导致用户上头期短，疲劳度高，长期留存低。 3. 无法回答私有领域问题（如公司制度、人员信息等）。 4. 无法及时获取最新信息（如实时天气、比赛结果等）。 5. 无法准确回答专业问题（如复杂数学计算、图像生成等）。

给我推荐一个家庭用的私人部署deepseek电脑配置，要求价格在5W一下，能够比较流畅的运行，还有采用那一个版本的模型

很抱歉，您提供的内容中没有关于家庭用私人部署 deepseek 电脑配置的相关信息。如果您需要配置一台价格在 5 万以下、能流畅运行的家庭用电脑，以下是一些建议： CPU：可以选择英特尔酷睿 i9 或 AMD 锐龙 9 系列的高端处理器。显卡：选择 NVIDIA GeForce RTX 40 系列的高端显卡，如 RTX 4080 或 RTX 4070Ti。内存：32GB 或 64GB 的 DDR5 内存。存储：1TB 或 2TB 的 NVMe SSD 作为系统盘，再加上大容量的机械硬盘用于数据存储。主板：选择与所选 CPU 兼容的高端主板，以确保稳定性和扩展性。关于模型版本，Midjourney 的 V5 模型是较新且先进的版本，具有更广泛的风格范围、更高的图像质量、更详细的图像等优点。您可以通过添加“v 5”参数或使用“/settings”命令并选择 MJ Version 5 来使用该模型。

给我推荐一个家庭用的私人部署deepseek电脑配置，要求价格在5W一下，能够比较流畅的运行，还有采用那一个版本的模型

以下是为您推荐的家庭用私人部署 deepseek 电脑配置，价格在 5 万以下，能够较流畅运行： CPU：Intel Core i913900K 或 AMD Ryzen 9 7950X 显卡：NVIDIA GeForce RTX 4080 或 RTX 4070Ti 内存：32GB 或 64GB DDR5 高频内存硬盘：1TB NVMe M.2 固态硬盘 + 4TB 机械硬盘主板：支持所选 CPU 的高端主板，如 Z790 或 X670 系列电源：850W 及以上的高品质电源关于模型版本，Midjourney 最新的模型是 V5 版本，于 2023 年 3 月 15 日发布。使用此模型，您可以在提示词末尾添加 v 5 参数，或使用 /settings 命令并选择 MJ Version 5。该模型具有很高的连贯性，擅长解释自然语言提示，分辨率更高，并支持如 tile 重复图案等高级功能。它在风格范围、图像质量、细节表现、对提示的响应以及图像提示性能等方面都有显著改进。

给我推荐一个家庭用的私人部署deepseek电脑配置，要求价格在5W一下，能够比较流畅的运行

对于家庭用的私人部署 deepseek 电脑配置，在 5 万元以下的预算，以下是一个推荐配置： CPU：Intel Core i913900K 或 AMD Ryzen 9 7950X 主板：选择与所选 CPU 兼容的高端主板，如华硕、技嘉等品牌的 Z790 或 X670 系列内存：32GB 或 64GB DDR5 高频内存硬盘：1TB NVMe M.2 固态硬盘作为系统盘，再加上 4TB 以上的机械硬盘用于数据存储显卡：NVIDIA GeForce RTX 4070Ti 或 AMD Radeon RX 7900 XTX 电源：850W 及以上的高品质电源机箱：选择散热良好、空间宽敞的机箱请注意，电脑配置的选择还需要考虑您的具体需求和使用场景，以上配置仅供参考。

Claude3/grok3/Gemini使用API调用时消耗token的价格是？

Claude 3 的 API 调用价格为：每百万输入 token 0.25 美元，每百万输出 token 1.25 美元。可以处理和分析 400 起最高法院案件或 2500 张图片只需 1 美元。相关链接：https://x.com/imxiaohu/status/1768284259792691366?s=20

ChatGPT收费模式和价格

目前 ChatGPT 官网有两个版本，分别是 GPT3.5 和 GPT4。GPT3.5 为免费版本，拥有 GPT 账号即可使用。GPT4 若要使用更多功能，需升级到 PLUS 套餐，收费标准为 20 美金一个月。此外，GPT4 还有团队版和企业版，功能更多、限制更少，但费用也更贵，一般推荐使用 PLUS 套餐。

有哪些比较好用的AI价格比较插件

以下是一些比较好用的 AI 相关价格插件： AiTC 车辆执行项：由吉利研究院提供。根据输入车辆操作参数，输出车辆操作结果，包含空调、后视镜等多种执行项。链接：懂车帝：由懂车帝提供。SecondHandCar 是一款专为二手车市场设计的信息查询工具，可对二手车进行深度的数据挖掘和分析。CarSeries 可以查询新车或特定车系信息。链接：此外，在价格对比方面：主流 AI 视频会员价格对比中，可灵最近开放全球价格体系，中国以外可付美金享受。价格情况为 Runway 最贵，Haiper 其次，Luma 中规中矩，可灵最便宜。链接：