Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

GPU的计算特性

Answer

GPU(图形处理器)具有以下计算特性:

  1. 专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。
  2. 诞生源自对 CPU 的减负,使显卡减少了对 CPU 的依赖,并进行部分原本 CPU 的工作,尤其是在 3D 图形处理时。
  3. 所采用的核心技术有硬件 T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素 256 位渲染引擎等,硬件 T&L 技术可以说是 GPU 的标志。
  4. 生产商主要有 NVIDIA 和 ATI。
  5. 在矩阵乘法方面表现出色,早期使用 GPU 训练神经网络,能使运算速度提高 30 倍。
Content generated by AI large model, please carefully verify (powered by aily)

References

你看我这算力如何?(硬件篇)

作者:小鱼干了发布时间:2023-06-30 21:58原文地址:https://mp.weixin.qq.com/s/FTYC4O58xihe6U06B_7x7w微信扫一扫关注该公众号[heading1]算力是什么?[content]算力的字面意思就是计算能力(Computing Power),是随着区块链,AI等概念被反复提及,其实没什么特别的,可以直接转化成GPU就是算力,电脑里的显卡就是GPU,那么算力=显卡可以这样粗暴的理解。哪怕你购买云服务,也是服务商买显卡“租”给你用的意思。而一张显卡除了GPU外,还有一个很重要的参数是显存。GPU:图形处理器(Graphics Processing Unit)又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。CPU:中央处理器(Central Processing Unit)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。显存:也被叫做帧缓存,它的作用是用来存储显卡芯片处理过或者即将提取的渲染数据。如同计算机的内存一样,显存是用来存储要处理的图形信息的部件。GPU的诞生源自对CPU的减负,使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时GPU所采用的核心技术有硬件T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬件T&L技术可以说是GPU的标志。GPU的生产商主要有NVIDIA和ATI。

老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代

当然,有了Blackwell超级芯片,当然还会有Blackwell组成的DGX超算。这样,公司就会大量购入这些GPU,并将它们封装在更大的设计中。GB200 NVL72是将36个Grace CPU和72个Blackwell GPU集成到一个液冷机柜中,可实现总计720 petaflops的AI训练性能,或是1,440 petaflops(1.4 exaflops)的推理性能。它内部共有5000条独立电缆,长度近两英里。它的背面效果如下图所示。机柜中的每个机架包含两个GB200芯片,或两个NVLink交换机。一共有18个GB200芯片托盘,9个NVLink交换机托盘有。老黄现场表示,「一个GB200 NVL72机柜可以训练27万亿参数的模型」。此前传言称,GPT-4的参数规模达1.8万亿,相当于能训练近15个这样的模型。与H100相比,对于大模型推理工作负载,GB200超级芯片提供高达30倍的性能提升。那么,由8个系统组合在一起的就是DGX GB200。总共有288个Grace CPU、576个Blackwell GPU、240 TB内存和11.5 exaflop FP4计算。这一系统可以扩展到数万个GB200超级芯片,通过Quantum-X800 InfiniBand(最多144个连接)或Spectrum-X800ethernet(最多64个连接)与800Gbps网络连接在一起。配备DGX GB200系统的全新DGX SuperPod采用统一的计算架构。除了第五代NVIDIA NVLink,该架构还包括NVIDIA Bluefield-3 DPU,并将支持Quantum-X800 InfiniBand网络。

观点:AI 教父 Hinton 最新万字精彩访谈:直觉,AI 创新的洞见和思考,未来 (附全文+视频)

您是最早想到使用GPU的人之一,我知道Jensen(黄仁勋)很喜欢你。早在2009年,你就告诉Jensen,这可能是训练神经网络的一个非常好的想法。让我们回顾一下使用图形处理单元(GPU)训练神经网络的早期直觉。实际上,我记得在2006年,我有一位研究生,他是一位非常优秀的计算机视觉专家。我曾在一次会议上与他交谈,他建议我考虑使用图形处理卡,因为它们在矩阵乘法方面表现出色,而我所做的基本上都是矩阵乘法。我考虑了一会儿,然后我们开始研究那些配备四个GPU的Tesla系统。最初,我们只是购买了游戏用的GPU,发现它们使运算速度提高了30倍。然后我们购买了一个配备四个GPU的Tesla系统,并在此基础上进行了一次演讲,效果非常好。2009年,我在NIPS会议上发表了演讲,我告诉在场的一千名机器学习研究人员,你们都应该去购买NVIDIA的GPU,因为它们是未来,你们需要它们来进行机器学习。然后我实际上给NVIDIA发了一封邮件,说我已经告诉一千名机器学习研究人员去购买你们的主板,你们能否免费给我一个?他们并没有回复。但是,当我后来把这个故事告诉Jensen时,他免费给了我一个。这真是太好了。我认为同样有趣的是,GPU是如何随着这个领域的发展而发展的。那么,你认为我们在计算领域的下一步应该如何发展呢?在我在谷歌的最后几年里,我一直在思考如何尝试进行模拟计算。这样,我们可以使用30瓦的功率(例如大脑),而不是使用一兆瓦的功率,并且可以在模拟硬件中运行这些大型语言模型。我从未让它发挥作用,但我开始真正欣赏数字计算。

Others are asking
ai为何使用GPU而不是CPU
AI 使用 GPU 而不是 CPU 主要有以下原因: 1. 强大的计算能力:GPU 在并行处理大量数据方面具有显著优势。例如,同年《Largescale Deep Unsupervised Learning using Graphics Processors》这篇论文指出,利用 GPU 比 CPU 快 70 倍,能将数周的工作压缩到几天甚至一天完成。 2. 适应深度学习需求:大型神经网络、输入的多个变量以及有效的反向传播 GPU 实现等方面,GPU 表现出色。如 MNIST 数据库能达到令人惊叹的 0.35%错误率。 3. 处理图形相关运算:GPU 原本就是为处理图像和图形相关运算工作而设计,其采用的核心技术如硬件 T&L 等,适合 AI 中的图形处理任务。 4. 分担 CPU 工作:GPU 的诞生源自对 CPU 的减负,使显卡减少对 CPU 的依赖,并进行部分原本 CPU 的工作。 5. 算力优势:算力可以直接转化为 GPU,一张显卡中的 GPU 是计算能力的关键。 6. 适应 AI 模型需求:当今所有 AI 模型都在使用大量专用芯片的 GPU 卡上运行。例如 NVIDIA A100 GPU 有 512 个“张量核心”,能大幅提高计算效率。但实际应用中,也存在一些限制,如数据传输、内存容量和优化方法等问题。
2025-02-14
comfyui的本地部署安装,GPU:RX6600 8G,CPU:R5 5600,内存:DDR4 8G*2
以下是关于 ComfyUI 本地部署安装的相关信息: ComfyUI 相比 WebUI,配置更低,系统资源占用更少,出图速度更快,最低可在小于 3G 的 GPU 上运行,甚至没有 GPU 光用 CPU 也可以运行,但速度极慢。SDXL 出来后提高了运行配置,最低需要 8GB 显存+32GB 运行内存,12GB 流畅运行,推荐 16GB 以上。运行内存最低 32GB,越高越好,最低配会经常爆显存。玩 SDwebui 和 ComfyUI 建议使用 6GB 以上显存的 NVIDIA 显卡(N 卡),内存在 16G 以上。硬盘会影响加载模型的速度,最好把软件和模型部署在 SSD 上。如果电脑能顺畅清晰地玩 3A 游戏,那玩 webui 和 ComfyUI 也没问题。配置上不封顶,根据自己的需求和预算来即可。 安装地址:https://github.com/comfyanonymous/ComfyUI 。可以下载安装包也可以直接 Git clone https://github.com/comfyanonymous/ComfyUI.git ,或者下载安装包 file:ComfyUI.zip ,下载安装包或者点击链接下载并解压至本地除 C 盘外的任意盘。然后找到文件名称为 run_nvidia_gpu 的文件双击并启动。启动完成即进入基础界面。 节点存放目录:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 。 模型存放目录: 大模型:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints 。 Lora:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras 。 Vae:D:\\COMFYUI\\ComFYUI_windows_portable\\ComfyUI\\models\\vae 。 已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型即可,这样就不用重复下载模型了。找到已安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件,将后缀.example 删除,然后右键用记事本打开。 您的电脑配置为 GPU:RX6600 8G,CPU:R5 5600,内存:DDR4 8G2,可能需要注意内存方面可能不太满足推荐配置,可能会影响运行效果。
2025-02-13
RuntimeError: All input tensors need to be on the same GPU, but found some tensors to not be on a GPU
以下是对您所遇到的报错“RuntimeError: All input tensors need to be on the same GPU, but found some tensors to not be on a GPU”的一些可能的解决方案: 1. 检查您的代码和模型设置,确保所有输入张量都被正确地分配到同一个 GPU 上。 2. 对于与显存相关的问题,如爆显存的情况,在训练时可以尝试调小批量大小,在推理时可以使用强制切片。 3. 调大虚拟内存,可能有助于解决一些与内存相关的报错。 同时,在处理与 AI 相关的报错时,还可能会遇到其他类似的问题,例如: 1. 页面文件太小,无法完成操作。解决方法是增大系统虚拟内存大小。 2. 出现“torch.cuda.OutOfMemoryError: CUDA out of memory”报错,通常是爆显存了。 3. 遇到“DataLoader workerexited unexpectedly”报错,可把虚拟内存再调大一点。 4. “CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling 'cublasCreate'”报错,一般也是爆显存。 5. “'HParams' object has no attribute 'xxx'”报错,可能是无法找到音色,一般是配置文件和模型没对应,打开配置文件拉到最下面查看是否有训练的音色。 6. “The expand size of the tensor at nonsingleton dimension 0”报错,可把 dataset/44k 下的内容全部删除,重新走一遍预处理流程。 7. “Given groups=1, weight of size to have 256 channels, but got 768 channels instead”报错,可能是 vec256 的模型用了 vec768 的配置文件,反之亦然,请参考旧模型兼容,确认配置文件和模型维度对应。 8. “配置文件中的编码器与模型维度不匹配”报错,可能是在修改配置文件中的“speech_encoder”时修改错了,检查配置文件中的“ssl_dim”一项,如果这项是 256,那您需要确认配置文件和模型维度的对应关系。
2025-01-17
常见GPU卡介绍与比较
以下是常见 GPU 卡的介绍与比较: 在选择 GPU 作为 AI 基础设施时,需要考虑多个因素: 训练与推理方面:训练大型 Transformer 模型通常需要在机器集群上完成,最好是每台服务器有多个 GPU、大量 VRAM 以及服务器之间的高带宽连接。许多模型在 NVIDIA H100 上最具成本效益,但获取较难且通常需要长期合作承诺。如今,NVIDIA A100 常用于大多数模型训练。对于大型语言模型(LLM)的推理,可能需要 H100 或 A100,而较小的模型如 Stable Diffusion 则对 VRAM 需求较少,初创公司也会使用 A10、A40、A4000、A5000 和 A6000 甚至 RTX 卡。 内存要求方面:大型 LLM 的参数数量众多,无法由单张卡容纳,需要分布到多个卡中。 硬件支持方面:虽然绝大多数工作负载在 NVIDIA 上运行,但也有公司开始尝试其他供应商,如谷歌 TPU 和英特尔的 Gaudi2,但这些供应商面临的挑战是模型性能高度依赖软件优化。 延迟要求方面:对延迟不太敏感的工作负载可使用功能较弱的 GPU 以降低计算成本,而面向用户的应用程序通常需要高端 GPU 卡来提供实时用户体验。 峰值方面:生成式 AI 公司的需求经常急剧上升,在低端 GPU 上处理峰值通常更容易,若流量来自参与度或留存率较低的用户,以牺牲性能为代价使用较低成本资源也有意义。 此外,算力可以理解为计算能力,在电脑中可直接转化为 GPU,显卡就是 GPU,除了 GPU 外,显存也是重要参数。GPU 是一种专门做图像和图形相关运算工作的微处理器,其诞生是为了给 CPU 减负,生产商主要有 NVIDIA 和 ATI。
2025-01-06
GPU的计算特性
GPU(图形处理器)具有以下计算特性: 1. 专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。 2. 诞生源自对 CPU 的减负,使显卡减少了对 CPU 的依赖,并进行部分原本 CPU 的工作,尤其是在 3D 图形处理时。 3. 所采用的核心技术有硬件 T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素 256 位渲染引擎等,硬件 T&L 技术可以说是 GPU 的标志。 4. 生产商主要有 NVIDIA 和 ATI。 5. 在矩阵乘法方面表现出色,早期使用游戏用的 GPU 能使运算速度提高 30 倍。 6. 随着 AI 领域的发展而不断发展,例如在训练神经网络方面发挥重要作用。
2025-01-06
常见GPU卡介绍与比较
以下是常见 GPU 卡的介绍与比较: 在 AI 基础设施的考虑因素中,比较 GPU 时需要关注以下几个方面: 训练与推理: 训练 Transformer 模型除了模型权重外,还需要存储 8 字节的数据用于训练。内存 12GB 的典型高端消费级 GPU 几乎无法用于训练 40 亿参数的模型。 训练大型模型通常在机器集群上完成,最好是每台服务器有多个 GPU、大量 VRAM 以及服务器之间的高带宽连接。 许多模型在 NVIDIA H100 上最具成本效益,但截至目前很难找到在 NVIDIA H100 上运行的模型,且通常需要一年以上的长期合作承诺。如今,更多选择在 NVIDIA A100 上运行大多数模型训练,但对于大型集群,仍需要长期承诺。 内存要求: 大型 LLM 的参数数量太多,任何卡都无法容纳,需要分布到多个卡中。 即使进行 LLM 推理,可能也需要 H100 或 A100。但较小的模型(如 Stable Diffusion)需要的 VRAM 要少得多,初创公司也会使用 A10、A40、A4000、A5000 和 A6000,甚至 RTX 卡。 硬件支持: 虽然绝大多数工作负载都在 NVIDIA 上运行,但也有一些公司开始尝试其他供应商,如谷歌 TPU、英特尔的 Gaudi2。 这些供应商面临的挑战是,模型的性能往往高度依赖于芯片的软件优化是否可用,可能需要执行 PoC 才能了解性能。 延迟要求: 对延迟不太敏感的工作负载(如批处理数据处理或不需要交互式 UI 响应的应用程序)可以使用功能较弱的 GPU,能将计算成本降低多达 3 4 倍。 面向用户的应用程序通常需要高端 GPU 卡来提供引人入胜的实时用户体验,优化模型是必要的,以使成本降低到可管理的范围。 峰值: 生成式 AI 公司的需求经常急剧上升,新产品一经发布,请求量每天增加 10 倍,或者每周持续增长 50%的情况并不罕见。 在低端 GPU 上处理这些峰值通常更容易,因为更多的计算节点可能随时可用。如果这种流量来自于参与度较低或留存率较低的用户,那么以牺牲性能为代价使用较低成本的资源也是有意义的。 此外,算力可以直接转化成 GPU,电脑里的显卡就是 GPU。一张显卡除了 GPU 外,显存也是很重要的参数。GPU 的生产商主要有 NVIDIA 和 ATI。GPU 作为一种专门在个人电脑、工作站、游戏机和一些移动设备上做图像和图形相关运算工作的微处理器,其诞生源自对 CPU 的减负,使显卡减少了对 CPU 的依赖,并进行部分原本 CPU 的工作。
2025-01-06
什么是cursor的composer特性
Cursor 的 Composer 特性主要包括以下方面: 1. 它是 Cursor 的原生自动完成功能,比 Copilot 更强大,具有良好的内存。 2. 由自定义模型提供支持,可以围绕光标建议编辑,而不仅仅是插入其他代码。 3. 能够一次修改多行。 4. 可以根据用户最近的更改和 linter 错误提出建议。 5. 免费用户可获得 2000 次免费建议,Pro 和商业计划用户可获得无限次建议。 默认情况下,Cursor 会尝试查找不同类型的有用信息来改进代码生成,除了用户手动包含的,还可能包括相关文件、最近查看的文件等。收集后,Cursor 会按与编辑/生成的相关性对上下文项进行排名,并将排名靠前的项目保留在大型语言模型的上下文中。
2024-09-09
我想要一个助手,能帮助我快速计算式子
如果您想要一个能帮助快速计算式子的助手,可以通过以下步骤实现: 1. 搭建示例网站: 创建应用:点击打开提供的函数计算应用模板,参考相关图示选择直接部署,并填写获取到的百炼应用 ID 以及 APIKEY,其他表单项保持默认,点击页面左下角的创建并部署默认环境,等待项目部署完成(预计耗时 1 分钟)。 访问网站:应用部署完成后,在应用详情的环境信息中找到示例网站的访问域名,点击即可查看,确认示例网站已经部署成功。 2. 为网站增加 AI 助手: 增加 AI 助手相关代码:回到应用详情页,在环境详情的最底部找到函数资源,点击函数名称,进入函数详情页。在代码视图中找到 public/index.html 文件,然后取消相应位置的代码注释。最后点击部署代码,等待部署完成。 验证网站上的 AI 助手:重新访问示例网站页面以查看最新效果,此时网站的右下角会出现 AI 助手图标,点击即可唤起 AI 助手。 此外,零代码自建决策助手可以帮您解决生活中的决策问题,决策链设计包括: 1. 加权得分计算:将每个选项在各个标准上的得分与相应的权重相乘,然后求和,得出每个选项的总加权得分。 2. 机会成本分析:考虑选择每个选项时可能放弃的其他机会。 3. 简单情景分析:为每个选项构想最佳和最坏的情况。 4. 决策矩阵分析:将前面步骤的分析结果汇总到一个表格中,包括预期收益、机会成本、净收益、长期影响和风险评估。 决策阶段包括: 1. 敏感性分析:通过调整不同因素的权重,检验决策是否稳健。 2. 情感检验:反思个人对每个选项的情感反应,并考虑其与理性分析的一致性。 3. 提供最终决策建议:基于前面的所有分析,提出一个综合的建议。 案例——帮你选工作: 假设您是一名在职的产品经理,想跳槽并拿到两个不错的 offer,向决策助手求助。整个流程始于您向决策助手提出问题,决策助手随即要求您提供 offer 的基本信息。在您提供完信息后,决策助手开始定义基本的评估标准,并让您审核,还会根据您的喜好和目标给出权重分配的建议。在您认可权重分配后,决策助手对每个选项进行评分,评分采用 1 到 10 分的制度,涵盖所有评估标准。评分完成后,决策助手会整理出一个清晰的表格,包含各项评估标准的权重以及每个选项在各个标准下的得分。
2025-04-12
请帮我生成一个大三毕业论文的题目,专业是关于计算机应用的,技术栈:Python(Pandas/Matplotlib),MYSQL,生成可视化图表,可生成HTML网站,包含数据分析,需要有最基本的功能,最好与生活中的某些东西联系起来
以下是为您生成的几个与生活相关的计算机应用专业大三毕业论文题目,供您参考: 1. 《基于 Python 和 MySQL 的居民日常消费数据分析及可视化网站构建》 2. 《利用 Python 和 MySQL 分析城市交通流量数据并实现可视化与网站展示》 3. 《基于 Python 和 MySQL 的家庭能源消耗数据分析与可视化网站设计》 4. 《运用 Python 和 MySQL 对校园图书馆借阅数据的分析及可视化网站开发》 5. 《通过 Python 和 MySQL 研究城市空气质量数据的可视化分析与网站实现》
2025-04-11
生成超过15000字的人工智能技术在智能化零售行业中的应用与商业模式创新论文,学科方向是计算机科学与技术专业
很抱歉,目前无法直接为您生成超过 15000 字的论文。但我可以为您提供一个论文大纲,以帮助您组织思路和开展研究: 标题:人工智能技术在智能化零售行业中的应用与商业模式创新 摘要:简述人工智能技术在智能化零售中的重要性、应用现状、创新商业模式以及研究的主要结论。 一、引言 (一)研究背景:介绍智能化零售行业的发展趋势和人工智能技术的兴起。 (二)研究目的与意义:阐述研究人工智能技术在该领域应用和商业模式创新的目的,以及对行业发展的重要意义。 (三)研究方法与结构:说明采用的研究方法,如文献综述、案例分析等,并概述论文的结构安排。 二、人工智能技术概述 (一)人工智能技术的定义与分类:解释人工智能的概念,分类如机器学习、深度学习、自然语言处理等。 (二)关键技术原理:详细介绍相关技术的原理,如机器学习中的监督学习、无监督学习等。 (三)技术发展历程与现状:回顾人工智能技术的发展历程,分析当前的技术水平和应用情况。 三、智能化零售行业概述 (一)智能化零售的概念与特点:定义智能化零售,阐述其特点如个性化服务、精准营销等。 (二)行业发展现状与趋势:分析智能化零售行业的现状,包括市场规模、竞争格局等,预测未来的发展趋势。 (三)面临的挑战与机遇:探讨行业发展中面临的问题,以及人工智能技术带来的机遇。 四、人工智能技术在智能化零售中的应用 (一)客户画像与精准营销:如何利用人工智能技术分析客户数据,实现精准营销。 (二)库存管理与供应链优化:通过人工智能算法优化库存水平和供应链流程。 (三)智能推荐与个性化服务:介绍基于人工智能的推荐系统,为客户提供个性化的购物体验。 (四)无人零售与智能支付:探讨无人零售店的技术实现和智能支付方式的应用。 (五)店铺布局与商品陈列优化:利用人工智能进行数据分析,优化店铺布局和商品陈列。 五、人工智能技术驱动的商业模式创新 (一)新的零售模式:如线上线下融合的智能零售模式。 (二)数据驱动的商业决策:依靠人工智能分析数据,制定更科学的商业决策。 (三)合作与共享经济模式:探讨与技术供应商、其他企业的合作模式,以及共享数据和资源的可能性。 (四)增值服务与收费模式创新:基于人工智能技术提供的新服务,创新收费模式。 六、案例分析 (一)选取成功应用人工智能技术的智能化零售企业案例。 (二)详细介绍其应用场景、商业模式创新和取得的成效。 (三)总结经验教训,为其他企业提供借鉴。 七、影响与挑战 (一)对消费者行为和市场竞争的影响:分析人工智能技术如何改变消费者购物行为和市场竞争格局。 (二)技术与数据安全问题:探讨人工智能应用中的技术漏洞和数据泄露风险。 (三)法律法规与伦理道德问题:研究相关法律法规的缺失,以及可能引发的伦理道德问题。 八、结论与展望 (一)研究成果总结:概括人工智能技术在智能化零售中的应用和商业模式创新的主要发现。 (二)未来研究方向与建议:提出进一步研究的方向和对企业、政府的建议。 希望以上大纲对您有所帮助,祝您顺利完成论文!
2025-04-07
计算两个时间差的绝对值,输出相差的完整天数。 获得用户输入的两个与时间相关的字符串,两个时间用逗号分隔,每个时间字符串格式示例如下:2018年08月01日17点21分21秒。 以此为要求写出python代码
以下是计算两个指定格式时间差的绝对值并输出相差完整天数的 Python 代码: ```python import datetime def calculate_days_difference: 解析时间字符串 time1 = datetime.datetime.strptime time2 = datetime.datetime.strptime 计算时间差 time_difference = abs 转换为天数并返回 return time_difference.days 示例用法 time1_str = "2023年08月01日17点21分21秒" time2_str = "2023年08月10日17点21分21秒" print ```
2025-03-22
科学计算大模型的代表模型有哪些
科学计算大模型的代表模型主要有以下几种: 1. Encoderonly 模型:适用于自然语言理解任务,如分类和情感分析,最知名的代表是 BERT。 2. Encoderdecoder 模型:同时结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容,代表模型如谷歌的 T5。 3. Decoderonly 模型:更擅长自然语言生成任务,如故事写作和博客生成,众多熟知的 AI 助手基本采用此结构,包括 ChatGPT。 大模型具有以下特点: 1. 预训练数据量大:往往来自互联网,包括论文、代码、公开网页等,先进的大模型通常用 TB 级别的数据进行预训练。 2. 参数众多:如 OpenAI 在 2020 年发布的 GPT3 就已达到 170B 的参数。 在数字化处理中,为让计算机理解 Token 之间的联系,需将 Token 表示成稠密矩阵向量,即 embedding,常见算法有基于统计的 Word2Vec、GloVe,基于深度网络的 CNN、RNN/LSTM,基于神经网络的 BERT、Doc2Vec 等。以 Transform 为代表的大模型采用自注意力(Selfattention)机制学习不同 token 之间的依赖关系,生成高质量 embedding。 大模型的“大”主要指用于表达 token 之间关系的参数多,如 GPT3 拥有 1750 亿参数。当神经元数量达到百亿、千亿级别时,会出现群体智能,即智能涌现,这在自然界如蚂蚁群体中有典型体现,人脑也由约 1000 亿个神经元构成复杂神经网络。
2025-03-20
计算机视觉
计算机视觉是机器认知世界的基础,人类获取的信息约 83%来自视觉,而计算机视觉旨在让计算机看懂图像或视频里的内容,像人一样通过视觉观察和理解世界。 其三大基础任务包括分类、检测和分割: 图像分类:根据图像中的语义信息对不同类别的图像进行区分。 目标检测:找出图像或视频中的目标物体,同时检测出物体的位置和大小。 图像分割:又可划分为语义分割和实例分割。语义分割不区分同类目标,实例分割则需要区分同类目标中的不同个体。 此外,计算机视觉还包括目标跟踪,对图像序列中的运动目标进行检测、提取、识别和跟踪,实现对运动目标的行为理解。 参考资料: 在企业应用中,计算机视觉的应用包括: 图像分类和物体识别,将图片作为输入,输出图像的内容分类,应用于面部识别。 物体识别,不仅分类或识别物体,还检测物体是否出现在图像里。 图像分割算法,识别物体位置并标记不同物体对应的像素点,如用于识别 X 光照射图片。 视觉追踪,检测视频中的奔跑者并追踪其轨迹和运动方向。
2025-03-19