Navigate to WaytoAGI Wiki →

Home/Question List/Question Detail

给出一份目前开源大模型的算力、存储要求和部署方案的报告，可以附带优化方案，字数10000字左右。

Answer

由于篇幅限制，我无法直接给出一份 10000 字左右的报告，但我可以为你提供一个简要的大纲：开源大模型的算力、存储要求和部署方案报告 一、引言 （一）背景介绍（二）目的和意义 二、大模型的算力要求 （一）训练算力需求

数据预处理
模型训练
超参数调整（二）推理算力需求
数据加载
模型推理
结果输出 三、大模型的存储要求 （一）训练数据存储
数据集大小
数据格式
数据存储方式（二）模型参数存储
模型大小
模型格式
模型存储方式（三）推理结果存储
结果大小
结果格式
结果存储方式 四、大模型的部署方案 （一）云平台部署
云计算服务提供商
云计算资源配置
云计算成本估算（二）本地部署
硬件设备需求
软件环境配置
网络连接要求 五、大模型的优化方案 （一）数据预处理优化
数据清洗
数据增强
数据压缩（二）模型架构优化
模型压缩
模型剪枝
模型量化（三）训练算法优化
优化器选择
学习率调整
训练轮数控制（四）推理加速优化
硬件加速
软件优化
模型编译优化 六、结论与展望 （一）总结大模型的算力、存储要求和部署方案（二）提出未来研究和发展方向的建议请注意，以上只是一个简要的大纲，具体内容需要根据实际情况进行详细调研和分析。如果你需要更详细的报告，请提供更多相关信息，我将尽力为你提供帮助。

Content generated by AI large model, please carefully verify (powered by aily)

References

基于多模态大模型给现实世界加一本说明书

智谱·AI 开源模型列表

谷歌开源可商用的大语言模型Gemma

从 0 到 1 了解大模型安全，看这篇就够了

多模态大模型入门指南-长文慎入【持续更新】

Others are asking

Nvidia 显卡算力天梯图

以下是为您提供的关于 Nvidia 显卡算力天梯图的相关信息：算力是指计算能力，可直接理解为显卡的性能。在电脑中，显卡就是 GPU，一张显卡的重要参数包括 GPU 和显存。 GPU 是一种专门做图像和图形相关运算工作的微处理器，其生产商主要有 NVIDIA 和 ATI。GPU 的强大主要决定了生图和训练的效率，越强大的算力在生图（推理）和训练上消耗的时间就越短。显存在生图过程决定了直接推理的图片大小，在训练时受制于训练工具的要求，显存容量是门槛。在选择算力时，需要综合 GPU 性能和显存大小两个参考维度。由于需要使用到 CUDA 加速，显卡大概率只能选择 NVIDIA 的。以下为您提供一些可能不太具备时效性的参考资料： 1. 各种显卡的稳定扩散性能测试报告（需要科学?️）：https://docs.google.com/spreadsheets/d/1Zlv4UFiciSgmJZncCujuXKHwc4BcxbjbSBg71SdeNk/editgid=0 2. GPU 测评结果方便大家选购：https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?field=fldzHOwXXK&record=reciB9KZtj&table=tblyh76bHrCi4PXq&view=vewUunvDn1

comfyui算力平台

以下是关于 ComfyUI 算力平台的相关信息：揽睿：属性：云平台邀请链接：https://lanruiai.com/register?invitation_code=0659 备注：WaytoAGI 邀请码 0659 可以得到 10 小时的免费时长厚德云：属性：云平台邀请链接：https://portal.houdeyun.cn/register?from=Waytoagi 备注：厚德云是专业的 AI 算力云平台，隶属于又拍云旗下，又拍云拥有 15 年云服务经验。注册后送 50 元代金券。ComfyUI 悟空换脸特效使用流程：百度飞桨：属性：云平台邀请链接：https://aistudio.baidu.com/community/app/106043?source=appCenter 备注：新注册 2 个小时。，明天给大家发放 50 小时的算力阿里云 PAI Artlab：属性：云平台邀请链接：直达地址：https://developer.aliyun.com/topic/paisports 备注：登录后领取免费试用，领取 500 元算力、OSS 20G 存储。AI 创作你的奥运专属海报，参与 PK 赢取台式升降桌、Lamy 钢笔套盒、双肩包等大奖！活动地址：https://mp.weixin.qq.com/s/y3Sk5PtVT5g8yFTMJASdFw onethingai：属性：云平台邀请链接：https://onethingai.com/invitation?code=dyAK4vY5 以云平台揽睿为例，搭建自己第一个 Comfyui 的方法如下： 1. 进入「应用启动器」页面，选择「comfyui 官方启动器」，点击「部署」按钮，点击「立即创建」，会进入「工作空间」页面。 2. 创建完成后稍等片刻，无需其他任何操作，等待「打开应用」按钮可点击后，点击该按钮就可以打开 comfyui 界面使用啦。 3. 启动/出图/训练进度可进入工作空间详情日志查看。

以下是一些关于 ComfyUI 算力的相关信息：云平台：揽睿：云平台，邀请链接为 https://lanruiai.com/register?invitation_code=0659 ，WaytoAGI 邀请码 0659 可以得到 10 小时的免费时长。百度飞桨：云平台，邀请链接为 https://aistudio.baidu.com/community/app/106043?source=appCenter ，新注册 2 个小时。点这里登记一下 https://waytoagi.feishu.cn/share/base/form/shrcnYyxqAWdsFq5qBso8mDsOjg?iframeFrom=docx&ccm_open=iframe ，明天给大家发放 50 小时的算力。阿里云 PAI Artlab：云平台，直达地址为 https://x.sm.cn/5hd9PfM ，登录后右上角领取免费试用，领取 500 元算力、OSS 20G 存储。AI 创作你的奥运专属海报，参与 PK 赢取台式升降桌、Lamy 钢笔套盒、双肩包等大奖！活动地址：https://mp.weixin.qq.com/s/y3Sk5PtVT5g8yFTMJASdFw 。 onethingai：邀请链接为 https://onethingai.com/invitation?code=dyAK4vY5 。以云平台揽睿为例，搭建 ComfyUI 的步骤： 1. 进入「应用启动器」页面，选择「comfyui 官方启动器」，点击「部署」按钮，点击「立即创建」，会进入「工作空间」页面。 2. 创建完成后稍等片刻，无需其他任何操作，等待「打开应用」按钮可点击后，点击该按钮就可以打开 comfyui 界面使用啦。 3. 启动/出图/训练进度可进入工作空间详情日志查看。

目前各大高校有哪些场景会实用算力

目前各大高校实用算力的场景可能包括以下方面： 1. 科研计算：如在物理学、化学、生物学等学科的研究中，进行复杂的模拟和数据分析。 2. 人工智能研究：包括模型训练、算法优化等。 3. 图形和图像处理：例如在设计、动画制作等专业中的应用。 4. 数据分析和处理：用于处理大规模的数据集，以支持学术研究和决策制定。需要注意的是，具体的应用场景会因高校的学科设置、研究方向和教学需求而有所不同。

大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义

以下是对您所提到的这些内容含义的解释：大语言模型：是一种基于大量文本数据进行训练的语言处理模型，其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下，模型参数越大能力越强。多模态：指能够处理多种不同类型的数据模态，如文本、图像、音频等，并将它们融合进行理解和生成。数据：是大语言模型训练和应用的基础，包括各种文本、图像、音频等信息。算力：指用于支持大语言模型训练和运行的计算能力。算法：是大语言模型实现各种功能的数学和逻辑方法。预训练：在大语言模型中，先在大规模数据上进行无特定任务的初步训练。微调：基于通用大模型，针对特定领域任务提供数据进行学习和调整，以适应特定领域的需求。 RAG：检索增强生成，通过引用外部数据源为模型做数据补充，适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。自注意力机制：是 Transformer 架构中的重要部分，能理解上下文和文本关联，通过不断检索和匹配来寻找依赖关系，处理词和词之间的位置组合，预测下一个词的概率。 Transformer：是大语言模型训练架构，用于翻译等任务，具备自注意力机制。 Token：在自然语言处理中，是文本的基本单位。神经网络：是大语言模型的基础架构，模拟人脑神经元的连接和信息处理方式。向量：在大语言模型中，用于表示文本等数据的数学形式。 Scaling Law：关于大语言模型规模和性能之间关系的规律。

大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义

以下是对您所提到的这些内容含义的解释：大语言模型：是一种基于大量文本数据进行训练的语言处理模型，其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下，模型参数越大能力越强。多模态：指能够处理多种不同类型的数据模态，如文本、图像、音频等，并将它们融合进行理解和生成。数据：是大语言模型训练和应用的基础，包括各种文本、图像、音频等信息。算力：指用于支持大语言模型训练和运行的计算能力。算法：是大语言模型实现各种功能的数学和逻辑方法。预训练：在大语言模型中，先在大规模数据上进行无特定任务的初步训练。微调：基于通用大模型，针对特定领域任务提供数据进行学习和调整，以适应特定领域的需求。 RAG：检索增强生成，通过引用外部数据源为模型做数据补充，适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。自注意力机制：是 Transformer 架构中的重要部分，能理解上下文和文本关联，通过不断检索和匹配来寻找依赖关系，处理词和词之间的位置组合，预测下一个词的概率。 Transformer：是大语言模型训练架构，用于翻译等任务，具备自注意力机制。 Token：在自然语言处理中，是文本的基本单位。神经网络：是大语言模型的基础架构，模拟人脑神经元的连接和信息处理方式。向量：在大语言模型中，用于表示文本等数据的数学形式。 Scaling Law：关于大语言模型规模和性能之间关系的规律。

撰写一篇汽车领域人工智能自动驾驶应用系统方案，参照以下要求：（1）选题应为课程相关的技术或者原理的应用。（2）重点撰写第2部分技术与服务，必须要使用到课程中所学到或者相关技术。（3）第6部分财务分析可根据情况适当缩减。（4）整体架构可以根据选题进行调整，可适当增加章节或者删减。（5）字体大小、标题等必须和模板相同。篇幅20页以上，不少于10000字，小四，宋体。以下为一篇样稿，可参考其框架撰写城市智能停车服务系统建设方案目录 1 项目背景 1 1.1 项目背景

以下是为您撰写的汽车领域人工智能自动驾驶应用系统方案的部分内容，您可以根据实际需求进行进一步的完善和补充：一、项目背景人工智能在汽车行业的应用已经十分广泛，正在深刻改变汽车的各个方面。自动驾驶技术利用 AI 进行图像识别、传感器数据分析和决策制定，使汽车能够自主导航和驾驶，如特斯拉、Waymo 和 Cruise 等公司都在积极开发和测试自动驾驶汽车。车辆安全系统中，AI 用于增强自动紧急制动、车道保持辅助和盲点检测等功能，通过分析摄像头和传感器数据预防事故。个性化用户体验方面，AI 可根据驾驶员偏好调整车辆设置，包括座椅位置、音乐选择和导航系统。预测性维护通过分析车辆实时数据，预测潜在故障和维护需求，提高车辆可靠性和效率。在汽车制造中，AI 用于自动化生产线，优化生产流程和质量控制。汽车销售和市场分析中，AI 帮助分析市场趋势、消费者行为和销售数据，优化营销策略和产品定价。电动化和能源管理方面，AI 在电动汽车的电池管理和充电策略中发挥作用，提高能源效率和延长电池寿命。共享出行服务借助 AI 优化路线规划、车辆调度和定价策略，提升服务效率和用户满意度。语音助手和车载娱乐由 AI 驱动，允许驾驶员通过语音控制车辆功能、获取信息和娱乐内容。车辆远程监控和诊断利用 AI 系统远程监控车辆状态，提供实时诊断和支持。二、技术与服务 1. 自动驾驶技术传感器融合：采用多种传感器，如激光雷达、摄像头、毫米波雷达等，收集车辆周围环境信息。利用 AI 算法对这些多源数据进行融合和分析，提高环境感知的准确性和可靠性。深度学习决策：基于深度神经网络，训练车辆的决策模型。通过大量的真实驾驶数据，让模型学习如何在各种复杂场景下做出最优的驾驶决策，如加速、减速、转向等。模拟训练：利用虚拟仿真环境进行大规模的自动驾驶训练。在模拟环境中，可以快速生成各种复杂和罕见的交通场景，加速模型的训练和优化。 2. 车辆安全系统实时监测与预警：利用 AI 实时分析来自车辆传感器的数据，如车速、加速度、转向角度等，以及外部环境信息，如道路状况、天气条件等。当检测到潜在的危险情况时，及时向驾驶员发出预警。自动紧急制动：基于 AI 的图像识别和距离检测技术，当判断车辆即将与前方障碍物发生碰撞且驾驶员未采取制动措施时，自动启动紧急制动系统，降低事故风险。 3. 个性化用户体验偏好学习：通过收集驾驶员的日常操作数据，如座椅调整习惯、音乐播放喜好、常用导航路线等，利用机器学习算法分析和学习驾驶员的偏好模式。智能推荐：根据学习到的偏好，为驾驶员提供个性化的推荐，如座椅自动调整、音乐推荐、导航路线规划等。 4. 预测性维护数据采集与分析：安装各类传感器收集车辆的运行数据，如发动机转速、油温、轮胎压力等。利用 AI 算法对这些数据进行分析，挖掘潜在的故障模式和趋势。故障预测模型：建立基于机器学习的故障预测模型，提前预测可能出现的故障，并及时通知驾驶员和维修人员，安排预防性维护。 5. 生产自动化质量检测：利用机器视觉技术和 AI 算法，对生产线上的汽车零部件进行自动检测，识别缺陷和瑕疵，提高产品质量。生产流程优化：通过分析生产数据，如设备运行状态、生产节拍等，利用 AI 优化生产流程，提高生产效率，降低生产成本。三、财务分析（可根据情况适当缩减） 1. 初始投资技术研发费用：包括自动驾驶算法开发、硬件设备采购、测试场地建设等方面的费用。车辆改装和设备安装成本：为实现自动驾驶功能，对车辆进行改装和安装相关传感器、计算设备等的成本。 2. 运营成本数据采集和处理费用：持续收集车辆运行数据和环境数据，并进行处理和分析的费用。维护和升级成本：对自动驾驶系统进行定期维护、软件升级和硬件更换的费用。 3. 收益来源车辆销售增值：配备自动驾驶和智能功能的汽车可以提高售价，增加销售收入。服务订阅费用：为用户提供个性化服务、远程监控和诊断等服务的订阅收费。 4. 盈利预测根据市场需求、成本控制和收益增长情况，进行短期和长期的盈利预测。以上内容仅供参考，您可以根据具体的项目需求和实际情况进一步完善和细化各个部分。

基于多维评价数据，使用大模型生成个性化的家庭教育方案的可靠性高吗？

基于多维评价数据使用大模型生成个性化的家庭教育方案具有一定的可靠性，但也存在一些限制。一方面，大模型在教育领域展现出了强大的能力。例如，能够为教师提供源源不断的真题库和错题练习库，模仿各类考试题型有模有样。在作文批改评分方面，如 GLM 模型，具备好词好句识别评测、作文综合评价评分等功能，能够综合考虑文章的多个维度给出评价，提供个性化反馈，保证评分的一致性等。另一方面，也存在一些挑战。对于高学段理科等复杂领域，大模型的表现可能有限。在解读学生作文中的深层次含义，如隐喻、双关等修辞技巧，以及涉及特定文化背景和历史知识的内容时，仍存在一定难度。然而，只要提示词到位、示例清晰，大模型在生成个性化家庭教育方案方面具有很大的潜力，可以为家长和孩子提供有价值的参考和帮助。但不能完全依赖大模型，还需要结合人工的判断和调整。

我想要自学AI相关的知识，但不知道从哪里开始，需要一个行动方案，我未来想做一个ai产品经理

以下是为您提供的自学 AI 知识并成为 AI 产品经理的行动方案： 1. 应用方面：深入了解 Prompt，选择适合自己的 AI 对话、绘画和语音产品，每天使用并用于解决实际问题或提升效率。 2. 分析方面：大量阅读各类文章、视频以及行业报告，理解各知识之间的关系。 3. 掌握相关技能：了解目前 AI 提示词工程师岗位的招聘技能要求，例如：本科及以上学历，计算机科学、人工智能、机器学习相关专业背景。熟悉 ChatGPT、Llama、Claude 等 AI 工具的使用及原理，并具有实际应用经验。熟练掌握 ChatGPT、Midjourney 等 AI 工具的使用及原理。负责制定和执行 AI 项目，如 Prompt 设计平台化方法和模板化方法。了解并熟悉 Prompt Engineering，包括常见的 Prompt 优化策略（例如 CoT、Fewshot 等）。对数据驱动的决策有深入的理解，能够基于数据分析做出决策。具有创新思维，能够基于业务需求提出并实践 AI first 的解决方案。对 AI 技术与算法领域抱有强烈的好奇心，并能付诸实践。对 AIGC 领域有深入的理解与实际工作经验，保持对 AI 技术前沿的关注。具备一定的编程和算法研究能力，能应用新的 AI 技术和算法于对话模型生成。具有一定的编程基础，熟练使用 Python、Git 等工具。 4. 了解产品经理工作：调研市场、思考需求、转化需求、思考解决方案、设计解决方案、分配任务、进行测试、实现解决方案。像善用提示词工程的人一样，将需求抽象再具象成产品。总之，要成为 AI 产品经理，需要不断学习和实践，适应行业的发展和变化。

请给我提供一个 AI辅助我进行知识管理的方案

以下是一个 AI 辅助知识管理的方案： 1. 利用提示词规划 PARA 分类模式：PARA 代表项目（Projects）、领域（Areas）、资源（Resources）和档案（Archives）。AI 可分析您的工作模式和内容类型，自动生成提示词，助您将信息和知识分类到相应部分，简化分类过程，加快组织和检索信息。核心是理解以行动为驱动的笔记逻辑。 2. 借助提示词设计笔记标签系统：有效的标签系统对知识管理很关键，AI 能分析笔记内容和使用习惯，推荐合适的标签和结构，提高检索效率。 3. 让知识助手 Bot 渐进式积累领域知识：随着在特定领域的深入，需要系统积累和更新知识。知识助手 Bot 可根据学习进度和兴趣点，定期推送相关文章、论文和资源，实现渐进式学习，扩展知识边界并确保知识更新。例如基于 dify.ai 将数百个思维模型整合成知识库，根据不同对话和条件判断为用户选择适用的思维模型分析工具，封装成智能分析的 Bot。 4. 基于已积累知识的 RAG 方法进行深度研究：RAG 是结合检索和生成的 AI 模型，应用于知识管理，能在深度研究时自动检索相关知识点和资料，辅助构建更全面深入的分析。 5. 打造个人知识导师，随时对话辅助梳理线索：创建个人知识管理员机器人，随时与之对话，询问特定知识点或寻求解决问题思路。它能基于知识库自学习，了解您的知识结构和需求，成为不可或缺的知识伙伴。 6. 构建最了解您的智能体作为 AI 写作助手：涵盖构思、草稿生成、内容迭代、润色与优化等全流程。构思阶段利用智能体生成创意点、主题或大纲；草稿生成基于构思让智能体生成文本草稿；内容迭代通过 promptchain 工具设计迭代提示修改完善草稿；润色与优化对最终文本进行语言风格和语调调整。通过实践和反馈优化 prompt 设计，使写作助手贴合个人风格和需求。此外，生成式人工智能在知识管理应用程序方面也有新兴应用，例如用作管理组织内基于文本（或可能基于图像或视频）知识的手段。一些研究表明，针对组织内特定知识体系微调模型培训，可有效管理组织知识。一些公司正与领先的商业提供商合作探索基于生成式人工智能的知识管理理念，但用户可能需要培训或帮助来创建有效提示，且知识输出应用前可能仍需编辑或审查。

excel表格导出的用户的对话记录，来进行自定义标签并打标，有哪些好用的现成方案或者工具

目前在 Excel 表格导出的用户对话记录进行自定义标签并打标方面，以下是一些常见且好用的工具和方案： 1. Microsoft Excel 本身：可以利用其数据筛选、排序和函数功能来辅助标签和打标。 2. Google Sheets：具有类似 Excel 的功能，且在线协作方便。 3. R 语言：通过编程实现复杂的数据分析和标签处理。 4. Python 及相关库，如 Pandas：能够灵活处理数据和进行标签操作。但具体选择哪种方案或工具，取决于您的具体需求、技术水平和使用习惯。

问题定义： 1. 核心问题陈述：创作一份个人参赛的、以光伏业务中财务工作与AI结合进行业务赋能为主题的展示类参赛方案框架。 2. 关键上下文信息：公司举办AI创新大赛，个人参赛，主题方向为工作和AI结合限定在业务赋能，公司业务是光伏领域。 3. 问题的具体范围界定：聚焦光伏业务中财务工作与AI结合进行业务赋能的展示方案框架创作。答案要求： 1. 内容范围： - 必须包含：整体参赛方案思路、光伏财务业务与AI结合的具体方向、展示方案大致框架。

很抱歉，您提供的知识库内容中没有与光伏业务中财务工作与 AI 结合进行业务赋能的参赛方案框架相关的信息。但以下是为您生成的一个可能的参赛方案框架示例：一、整体参赛方案思路本次参赛方案旨在探索如何将 AI 技术应用于光伏业务中的财务工作，以实现更高效、精准和智能化的业务赋能。通过深入分析光伏行业的特点和财务工作的需求，结合先进的 AI 技术，提出创新的解决方案，提升财务工作的效率和质量，为公司的光伏业务发展提供有力支持。二、光伏财务业务与 AI 结合的具体方向 1. 财务预测与分析利用机器学习算法对光伏项目的成本、收益进行预测，为投资决策提供数据支持。分析市场趋势和政策变化对财务状况的影响，提前制定应对策略。 2. 风险评估与管理运用大数据和人工智能技术，对光伏项目的风险进行实时监测和评估。建立风险预警模型，及时发现潜在的财务风险。 3. 成本优化与控制通过智能算法优化供应链管理，降低采购成本。分析生产过程中的能耗数据，实现成本的精细化控制。 4. 财务报表自动化生成与审计利用自然语言处理技术自动生成财务报表，提高工作效率。运用 AI 辅助审计，提高审计的准确性和效率。三、展示方案大致框架 1. 项目背景与目标介绍光伏行业的发展现状和公司的业务情况。阐述将财务工作与 AI 结合的目标和意义。 2. 技术方案与实现详细介绍所采用的 AI 技术和算法。展示技术方案的实现过程和关键步骤。 3. 应用案例与效果分享实际应用案例，展示 AI 在财务工作中的具体应用场景。分析应用效果，如成本降低、效率提升、风险控制等方面的成果。 4. 未来展望与挑战展望 AI 在光伏财务领域的未来发展趋势。探讨可能面临的挑战及应对策略。 5. 总结与结论总结方案的核心内容和创新点。强调对公司光伏业务的价值和贡献。以上框架仅供参考，您可以根据实际情况进行进一步的细化和完善。

mcp 有什么开源的方案吗

Anthropic 于 2024 年 11 月推出并开源了 MCP（模型上下文协议）。MCP 就像一个“转接头”或“通用插座”，能统一不同的外部服务，如 Google Drive、GitHub、Slack、本地文件系统等，通过标准化接口与大语言模型对接。开发者基于 MCP 规范开发一次“接口适配器”（MCP 服务器），就能让所有兼容 MCP 的模型（MCP 客户端）无缝接入，无需针对每个模型单独适配，大幅提升兼容性与开发效率。MCP 里面还包含 SSE（ServerSent Events），是一种允许服务器向浏览器推送实时更新的技术。MCP 像为 AI 模型量身定制的“USBC 接口”，可以标准化地连接 AI 系统与各类外部工具和数据源。与传统 API 相比，MCP 是单一协议，只要一次整合就能连接多个服务；具有动态发现功能，AI 模型能自动识别并使用可用的工具；支持双向通信，模型不仅能查询数据，还能主动触发操作。相关链接：

自动生成提示词的开源工具有哪些

以下是一些自动生成提示词的开源工具： 1. Freepik 推出的 Reimagine AI 工具：用户上传图片即可自动生成提示词，无需输入文字。它还能实时提供无限滚动结果展示，边操作边生成图像，通过调整提示词实时修改图片细节，并支持多种风格切换。相关链接：https://freepik.com/pikaso/reimagine 、https://x.com/imxiaohu/status/1770437135738581414?s=20 2. StreamMultiDiffusion 项目：使用区域文本提示实时生成图像，具有交互式操作体验，每个提示控制一个区域，实现精准图像生成。相关链接：https://arxiv.org/abs/2403.09055 、https://github.com/ironjr/StreamMultiDiffusion?tab=readmeovfile 、https://huggingface.co/spaces/ironjr/SemanticPalette 、https://x.com/imxiaohu/status/1770371036967850439?s=20 3. 【SD】自动写提示词脚本 One Button Prompt：可以在主菜单输入人物提示词，在“高级”中设置提示词混合，还具有一键运行放大的模块，包括完整的文生图放大和图生图放大，甚至可接入其他脚本和 controlnet。获取方式：添加公众号【白马与少年】，回复【SD】。

开源flux模型如何快速使用

以下是关于开源 Flux 模型快速使用的方法： 1. 模型的下载：如果因为环境问题，可以在网盘中下载。 siglipso400mpatch14384（视觉模型）：siglip 由 Google 开发的视觉特征提取模型，负责理解和编码图像内容。工作流程包括接收输入图像、分析图像的视觉内容并将这些视觉信息编码成一组特征向量。打开 ComfyUI\models\clip，在地址栏输入 CMD 回车，打开命令行，输入下面的命令拉取模型（也可以在网盘里下载）。 image_adapter.pt（适配器）：连接视觉模型和语言模型，优化数据转换。工作流程包括接收来自视觉模型的特征向量、转换和调整这些特征，使其适合语言模型处理。通过 https://huggingface.co/spaces/fancyfeast/joycaptionprealpha/tree/main/wpkklhc6 下载，放到 models 的 Joy_caption 文件夹里，如果该文件夹不存在，就新建一个。 MetaLlama3.18Bbnb4bit（语言模型）：大型语言模型，负责生成文本描述。工作流程包括接收经过适配器处理的特征、基于这些特征生成相应的文本描述、应用语言知识来确保描述的连贯性和准确性。打开 ComfyUI\models\LLM，地址栏输入 CMD 回车，在命令行里面输入下面命令。 2. 下载地址： ae.safetensors 和 flux1dev.safetensors 下载地址：https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。准备了夸克和百度的网盘链接，方便部分同学下载： flux 相关模型（体积较大）的夸克网盘链接：https://pan.quark.cn/s/b5e01255608b 。 flux 相关模型（体积较大）的百度网盘链接：https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码：ub9h 。如果 GPU 性能不足、显存不够，底模可以使用 fp8 的量化版模型，速度会快很多，下载地址：https://huggingface.co/Kijai/fluxfp8/tree/main 。 3. 工作流下载：最后我们再下载 dev 的工作流：。或者下面官方原版的图片链接，图片导入 comfyUI 就是工作流：https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。我们打开 ComfyUI，把工作流或图片拖拽到 ComfyUI 里。

开源AI Agent软件有哪些

以下是一些开源的 AI Agent 软件： 1. AutoGPT 和 BabyAGI：在去年 GPT4 刚发布时风靡全球科技圈，给出了让 LLM 自己做自动化多步骤推理的解题思路。 2. Coze：新一代的一站式 AI Bot 开发平台，适用于构建基于 AI 模型的各类问答 Bot，集成了丰富的插件工具。 3. Mircosoft 的 Copilot Studio：主要功能包括外挂数据、定义流程、调用 API 和操作，以及将 Copilot 部署到各种渠道。 4. 文心智能体：百度推出的基于文心大模型的智能体（Agent）平台，支持开发者根据自身需求打造大模型时代的产品能力。 5. MindOS 的 Agent 平台：允许用户定义 Agent 的个性、动机、知识，以及访问第三方数据和服务或执行设计良好的工作流。 6. 斑头雁：2B 基于企业知识库构建专属 AI Agent 的平台，适用于客服、营销、销售等多种场景，提供多种成熟模板，功能强大且开箱即用。 7. 钉钉 AI 超级助理：依托于钉钉强大的场景和数据优势，在处理高频工作场景如销售、客服、行程安排等方面表现出色。此外，智谱·AI 开源的语言模型中也有与 Agent 相关的，如 AgentLM7B、AgentLM13B、AgentLM70B 等。

帮我列举2025年3月1日以来，国内外、闭源开源模型厂商的更新记录。

以下是 2025 年 3 月 1 日以来，国内外、闭源开源模型厂商的部分更新记录： 2025 年 3 月 20 日，OpenAI 推出了一套全新的音频模型，旨在通过 API 为开发者提供更智能、更可定制的语音代理支持，包括改进的语音转文本和文本转语音功能，为语音交互应用带来显著提升。李开复公开表示 OpenAI 面临生存危机，商业模式不可持续。他强调中国的 DeepSeek 以极低成本提供接近的性能，开源模式将主导未来 AI 发展。他认为企业级 AI 应用将成为投资重点，资源限制反而促进了创新。李开复大胆预测，中国将出现三大 AI 玩家，竞争愈发激烈。 SuperCLUE 发布《中文大模型基准测评 2025 年 3 月报告》，指出 2022 2025 年经历多阶段发展，国内外模型差距缩小。测评显示 o3mini总分领先，国产模型表现亮眼，如 DeepSeekR1 等在部分能力上与国际领先模型相当，且小参数模型潜力大。性价比上，国产模型优势明显。DeepSeek 系列模型深度分析表明，其 R1 在多方面表现出色，蒸馏模型实用性高，不同第三方平台的联网搜索和稳定性有差异。以上信息来源包括：《》《》《》

现在Ai作图用什么？还是以前的Stable Diffusion吗？还是又出现了新的开源软件？

目前在 AI 作图领域，Stable Diffusion 仍然是常用的工具之一。Stable Diffusion 是 AI 绘画领域的核心模型，能够进行文生图和图生图等图像生成任务，其完全开源的特点使其能快速构建强大繁荣的上下游生态。除了 Stable Diffusion，也出现了一些新的相关开源软件和工具，例如：：Stability AI 开源的 AI 图像生成平台。：拥有超过 700 种经过测试的艺术风格，可快速搜索查找各类艺术家，并支持一键复制 Prompt。同时，市面上主流的 AI 绘图软件还有 Midjourney，其优势是操作简单方便，创作内容丰富，但需要科学上网并且付费。如果您想尝试使用 Stable Diffusion，可以参考 B 站【秋葉 aaaki】这个 Up 主的视频了解具体的安装方法。