Chat with Wiki - WayToAGI

Navigate to WaytoAGI Wiki →

Home/All Questions

请罗列出你掌握的OCR技术以【方式名称+曾使用过自认最熟练的操作】的格式填写

以下是我掌握的 OCR 技术： OCR 识别：对图片进行 OCR 识别，获取图片中的文本信息，并对识别结果进行调整和优化。

文档转训练集

将文档转训练集通常可以按照以下步骤进行： 1. 手动收集数据集：公司通常会雇用人员，为其提供标签说明，要求人们提出问题并写下答案。 2. 注重质量：预训练阶段的文本可能来自互联网，数量大但质量较低。在第二阶段，应更看重质量而非数量，例如采用 100,000 个高质量的对话文档。 3. 形成 SOP：初期可以先手动形成标准操作流程（SOP），然后逐步实现自动化，此过程初期可能需要大量人力。

如何训练自己的模型

训练自己的模型可以参考以下步骤： 1. 选择合适的底模，如 Baichuan27BChat 模型，配置模型本地路径和提示模板。在 Train 页面里选择 sft 训练方式，加载定义好的数据集，如 wechat 和 self_cognition。注意学习率和训练轮次的设置，要根据数据集大小和收敛情况来调整。使用 FlashAttention2 可减少显存需求，加速训练速度。显存小的情况下，可以减少 batch size 并开启量化训练，内置的 QLora 训练方式很实用。需要用到 xformers 的依赖。显存占用约 20G，训练时间根据聊天记录规模大小而定，少则几小时，多则几天。 2. 对于 AI 绘画模型的训练，如 Stable Diffusion：设置 sample_sampler，可选择多种 sampler，默认是“ddim”。设置 save_model_as，可选择多种格式，目前 SD WebUI 兼容"ckpt"和"safetensors"格式模型。完成训练参数配置后，运行训练脚本进行全参微调训练。选择合适的底模型，如 WeThinkIn_SD_二次元模型。利用 accelerate 库封装训练脚本，可根据需求切换训练环境参数。 3. 创建图像描述模型：模型由编码器和解码器组成，编码器将输入图像转换为特征向量，解码器根据特征生成描述文本，二者组合形成完整模型。自定义损失函数，如使用稀疏分类交叉熵并屏蔽填充部分。编译模型后开始训练，可使用单个 GPU 训练，每个 epoch 约 15 至 20 分钟，可根据需求增加训练次数。训练完成后进行推理与生成字幕，重构解码器结构，编写自定义推理循环以生成完整句子。

AGI 即通用人工智能（Artificial General Intelligence），是指能够像人类一样思考、学习和执行多种任务的人工智能系统。目前对 AGI 的相关研究和讨论包括： OpenAI 通用人工智能的计划曾因埃隆·马斯克的诉讼而受到影响。 GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。 OpenAI 内部会议分享了 AGI 的五个发展等级，分别为：聊天机器人：具备基本对话能力，依赖预设脚本和关键词匹配，用于客户服务和简单查询响应。推理者：具备人类推理水平，能解决复杂问题，如 ChatGPT。智能体：不仅具备推理能力，还能执行全自动化业务，但目前许多产品仍需人类参与。创新者：能够协助人类完成新发明，如谷歌 DeepMind 的 AlphaFold 模型。组织：最高级别的 AI，能够自动执行组织的全部业务流程。 ChatGPT 是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具。

AI对于3d的建模

在 3D 建模方面，AI 主要有以下应用和相关工具：应用：在 3D 模型生成中，AI 能够完成 3D 模型生成流程的“一步到位”。工作流中的每个环节通常需要 3D 美术工程师完成，而使用 3D 生成模型可直接生成一个可调整的 3D 粗模，显著提升效率。在游戏测试与优化环节，AI 承担改善角色动画、编程与加速、自动化游戏测试等功能，能通过生成文字、图片、视频、音乐来缩减时间和资源消耗，快速识别游戏开发中的基本问题并提出改善方法。在游戏设计中，AI 依托自然语言生成用法，在角色与故事生成、游戏机制创新等方面发挥作用，通过针对性训练数据集强化 NPC 模型的基础能力。大淘宝设计部的实践中，22 年中绘制头像还用 3D 建模，年末已用 AI 直接生成。23 年 AI 工具覆盖所有营销场景业务，带来降本增效，拓展设计师思维边界，改变工作流程，降低技能门槛，对设计师内在素养提出更高要求。工具： provisual.app：这是一个 3D 模型在线可视化平台，具有易于使用、无需特殊技能或软件、可节省时间和成本等优点。其功能包括在线协作、实时渲染、无限视角、材质和纹理编辑、高质量输出等，适用于产品设计、营销、教育等领域，目标客户为营销机构、创意机构、包装公司、在线商店、设计院的设计师、美术师等。 tripo3d.ai：这是一个人工智能驱动的 3D 建模平台，可以使用文本或图像在几秒钟内生成高质量且可直接使用的 3D 模型。 meshy：相关案例可参考 https://www.meshy.ai/ 。

ai如何提升产品经理的工作效率

AI 可以通过以下方式提升产品经理的工作效率： 1. 辅助精读论文：能帮助翻译、拆解公式，分析代码等。工具如 https://scispace.com 。 2. 编写小脚本：如写 SQL 查询、Python 脚本、正则表达式、图片批量处理等。 3. 撰写产品宣传文案：根据产品宣传渠道写营销文案、营销邮件、产品上架文案等。 4. 设计和整理调研问卷：生成调研框架，回收非结构化问卷，按指定框架生成指定表头表格。 5. 进行竞品分析：用 BingChat 或 ChatGPT Browsering 插件，按指定框架对比各项数据，如 DAU、用户结构、市场占比等。 6. 解释专业名词：很多垂直领域都有不少缩写或行业黑话，可以用 ChatGPT 解释举例、给场景说明。 7. 优化产品逻辑和代码：写完 PRD 后，让 GPT 从产品和研发两个视角写逻辑代码，既能发现产品逻辑表达问题，也方便 QA 同学测试。此外，还有以下相关内容： 1. 银海分享了用 10 个 Prompt 提示词做产品经理 AI 助手，效果平替 PMAI。PMAI 是一款面向产品经理的生产力工具，具有一键生成 PRD、输出解决方案、生成 SQL 等实用功能。产品体验地址：https://www.pmai.cn/?utm_source=qoZaR5O 。 2. 有案例表明，产品经理使用 ChatGPT 优化代码可以显著提升效率。如将一段近 1900 行的 SQL 查询代码的执行时间从 4200 秒缩短到 8 秒，效率提升 520 倍，复杂度降低 6 倍，同时还能保存所有历史数据，报表实现秒开。而且 GPT 还能根据真实业务需求提出与原代码不同的解决思路。

目前AI在HR领域的应用真实案例

以下是 AI 在 HR 领域的一些应用真实案例： 1. 在招聘初期，AI 可用于职位描述生成、简历分析、面试题设计。 2. 在员工绩效评估方面，AI 能够分析员工工作表现，识别绩效趋势和提升点，为管理层提供数据支持的绩效反馈。 3. 对于员工培训与发展，AI 也能发挥作用。例如，在智能人力资源方面，目前主要利用模型进行简历初筛、JD 自动生成、数据分析等工作。还有像 Deepseek“4+1”黄金提问法中的人力资源场景，如作为 IT 企业 HR，目标是 6 个月内培养 10 名全栈工程师，能独立负责项目。需要设计阶段性培训方案，并提出了具体的要求，用培训体系文档格式输出，包含能力评估标准。

推荐一个做ppt的AI

以下是为您推荐的做 PPT 的 AI 工具： 1. Gamma：这是一个在线 PPT 制作网站，允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式，如 GIF 和视频，以增强演示文稿的吸引力。网址：https://gamma.app/ 2. 美图 AI PPT：由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计，包含丰富的模板库和设计元素，适用于多种场合。网址：https://www.xdesign.com/ppt/ 3. Mindshow：一款 AI 驱动的 PPT 辅助工具，提供一系列智能设计功能，如自动布局、图像选择和文本优化等，还可能包括互动元素和动画效果。网址：https://www.mindshow.fun/ 4. 讯飞智文：由科大讯飞推出的 AI 辅助文档编辑工具，利用语音识别和自然语言处理领域的技术优势，提供智能文本生成、语音输入、文档格式化等功能。网址：https://zhiwen.xfyun.cn/ 5. 爱设计 PPT：在国内 AI 辅助制作 PPT 的产品中表现出色，背后有强大的团队，能敏锐把握市场机遇，已确立市场领先地位。这些工具通过自动化和智能化的设计流程，极大地简化了 PPT 的制作工作，您可以根据自己的需求和喜好选择合适的工具，以提高工作效率和演示效果。

我有很多产品视频，需要进行混剪，可以怎么通过AI减少工作时间，提升工作效率

以下是一些通过 AI 减少产品视频混剪工作时间、提升工作效率的方法： 1. 利用数字人技术：无需真人模特，只需上传产品图片，数字人即可手持产品进行口播展示。支持语音和口型同步，动作、姿势定制，提供 1000+多国家数字人模特，覆盖全球 28+种语言，能快速生成产品宣传视频，省去拍摄烦恼。您可以在线体验：。 2. 产品链接生成视频：输入产品链接，一键生成数字人产品介绍视频。目前产品链接主要支持 Amazon、Shopify、ETSY、Ebay、Appstore、Google Play、WIKI 等，其他网站来源持续接入中。操作指引为输入产品网站链接——选择数字人角色——点击立即生成。如遇生成失败的问题，可尝试删除链接后缀，点击重新生成。 3. AI 视频高光切片：智能提取视频高光片段，高效二创生成新视频。适用场景为有初始长视频素材，需要提取高光镜头对初始素材进行混剪投放到短视频平台。使用指引为点击上传视频——立即生成。您可以参考案例示意，如初始视频。

AI可以协助制造业企业做哪些工作

AI 可以协助制造业企业完成以下工作： 1. 产品设计和开发：利用 AI 生成工具如 Adobe Firefly、Midjourney 等，根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素，提高产品设计效率。 2. 工艺规划和优化：结合大语言模型的自然语言处理能力，自动生成制造工艺流程、设备选型、质量控制等方案，优化生产过程。 3. 设备维护和故障诊断：通过分析设备运行数据，预测设备故障，并自动生成维修建议，提高设备可靠性。 4. 供应链管理：根据历史数据和市场变化，自动生成采购计划、库存预测、物流优化等内容，提高供应链管理效率。 5. 客户服务：基于对话模型的 AI 客服机器人，自动生成个性化的客户回复，提升客户体验。此外，在制造业中，AI 还能用于预测性维护，帮助工厂避免停机；进行质量控制，检测产品缺陷以提高产品质量；优化供应链，提高效率和降低成本；控制工业机器人，提高生产效率；以及协助生产计划和供应链计划状态查询、产线预测性维保辅助、产品质量分析与溯源等工作。