Navigate to WaytoAGI Wiki →
Home/All Questions
请罗列出你掌握的OCR技术 以【方式名称+曾使用过自认最熟练的操作】的格式填写
以下是我掌握的 OCR 技术: OCR 识别:对图片进行 OCR 识别,获取图片中的文本信息,并对识别结果进行调整和优化。
2025-03-10
文档转训练集
将文档转训练集通常可以按照以下步骤进行: 1. 手动收集数据集:公司通常会雇用人员,为其提供标签说明,要求人们提出问题并写下答案。 2. 注重质量:预训练阶段的文本可能来自互联网,数量大但质量较低。在第二阶段,应更看重质量而非数量,例如采用 100,000 个高质量的对话文档。 3. 形成 SOP:初期可以先手动形成标准操作流程(SOP),然后逐步实现自动化,此过程初期可能需要大量人力。
2025-03-10
如何训练自己的模型
训练自己的模型可以参考以下步骤: 1. 选择合适的底模,如 Baichuan27BChat 模型,配置模型本地路径和提示模板。 在 Train 页面里选择 sft 训练方式,加载定义好的数据集,如 wechat 和 self_cognition。 注意学习率和训练轮次的设置,要根据数据集大小和收敛情况来调整。 使用 FlashAttention2 可减少显存需求,加速训练速度。 显存小的情况下,可以减少 batch size 并开启量化训练,内置的 QLora 训练方式很实用。 需要用到 xformers 的依赖。 显存占用约 20G,训练时间根据聊天记录规模大小而定,少则几小时,多则几天。 2. 对于 AI 绘画模型的训练,如 Stable Diffusion: 设置 sample_sampler,可选择多种 sampler,默认是“ddim”。 设置 save_model_as,可选择多种格式,目前 SD WebUI 兼容"ckpt"和"safetensors"格式模型。 完成训练参数配置后,运行训练脚本进行全参微调训练。 选择合适的底模型,如 WeThinkIn_SD_二次元模型。 利用 accelerate 库封装训练脚本,可根据需求切换训练环境参数。 3. 创建图像描述模型: 模型由编码器和解码器组成,编码器将输入图像转换为特征向量,解码器根据特征生成描述文本,二者组合形成完整模型。 自定义损失函数,如使用稀疏分类交叉熵并屏蔽填充部分。 编译模型后开始训练,可使用单个 GPU 训练,每个 epoch 约 15 至 20 分钟,可根据需求增加训练次数。 训练完成后进行推理与生成字幕,重构解码器结构,编写自定义推理循环以生成完整句子。
2025-03-10
AGI是什么
AGI 即通用人工智能(Artificial General Intelligence),是指能够像人类一样思考、学习和执行多种任务的人工智能系统。 目前对 AGI 的相关研究和讨论包括: OpenAI 通用人工智能的计划曾因埃隆·马斯克的诉讼而受到影响。 GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。 OpenAI 内部会议分享了 AGI 的五个发展等级,分别为: 聊天机器人:具备基本对话能力,依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者:具备人类推理水平,能解决复杂问题,如 ChatGPT。 智能体:不仅具备推理能力,还能执行全自动化业务,但目前许多产品仍需人类参与。 创新者:能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型。 组织:最高级别的 AI,能够自动执行组织的全部业务流程。 ChatGPT 是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具。
2025-03-10
AI对于3d的建模
在 3D 建模方面,AI 主要有以下应用和相关工具: 应用: 在 3D 模型生成中,AI 能够完成 3D 模型生成流程的“一步到位”。工作流中的每个环节通常需要 3D 美术工程师完成,而使用 3D 生成模型可直接生成一个可调整的 3D 粗模,显著提升效率。 在游戏测试与优化环节,AI 承担改善角色动画、编程与加速、自动化游戏测试等功能,能通过生成文字、图片、视频、音乐来缩减时间和资源消耗,快速识别游戏开发中的基本问题并提出改善方法。 在游戏设计中,AI 依托自然语言生成用法,在角色与故事生成、游戏机制创新等方面发挥作用,通过针对性训练数据集强化 NPC 模型的基础能力。 大淘宝设计部的实践中,22 年中绘制头像还用 3D 建模,年末已用 AI 直接生成。23 年 AI 工具覆盖所有营销场景业务,带来降本增效,拓展设计师思维边界,改变工作流程,降低技能门槛,对设计师内在素养提出更高要求。 工具: provisual.app:这是一个 3D 模型在线可视化平台,具有易于使用、无需特殊技能或软件、可节省时间和成本等优点。其功能包括在线协作、实时渲染、无限视角、材质和纹理编辑、高质量输出等,适用于产品设计、营销、教育等领域,目标客户为营销机构、创意机构、包装公司、在线商店、设计院的设计师、美术师等。 tripo3d.ai:这是一个人工智能驱动的 3D 建模平台,可以使用文本或图像在几秒钟内生成高质量且可直接使用的 3D 模型。 meshy:相关案例可参考 https://www.meshy.ai/ 。
2025-03-10
ai如何提升产品经理的工作效率
AI 可以通过以下方式提升产品经理的工作效率: 1. 辅助精读论文:能帮助翻译、拆解公式,分析代码等。工具如 https://scispace.com 。 2. 编写小脚本:如写 SQL 查询、Python 脚本、正则表达式、图片批量处理等。 3. 撰写产品宣传文案:根据产品宣传渠道写营销文案、营销邮件、产品上架文案等。 4. 设计和整理调研问卷:生成调研框架,回收非结构化问卷,按指定框架生成指定表头表格。 5. 进行竞品分析:用 BingChat 或 ChatGPT Browsering 插件,按指定框架对比各项数据,如 DAU、用户结构、市场占比等。 6. 解释专业名词:很多垂直领域都有不少缩写或行业黑话,可以用 ChatGPT 解释举例、给场景说明。 7. 优化产品逻辑和代码:写完 PRD 后,让 GPT 从产品和研发两个视角写逻辑代码,既能发现产品逻辑表达问题,也方便 QA 同学测试。 此外,还有以下相关内容: 1. 银海分享了用 10 个 Prompt 提示词做产品经理 AI 助手,效果平替 PMAI。PMAI 是一款面向产品经理的生产力工具,具有一键生成 PRD、输出解决方案、生成 SQL 等实用功能。产品体验地址:https://www.pmai.cn/?utm_source=qoZaR5O 。 2. 有案例表明,产品经理使用 ChatGPT 优化代码可以显著提升效率。如将一段近 1900 行的 SQL 查询代码的执行时间从 4200 秒缩短到 8 秒,效率提升 520 倍,复杂度降低 6 倍,同时还能保存所有历史数据,报表实现秒开。而且 GPT 还能根据真实业务需求提出与原代码不同的解决思路。
2025-03-10
目前AI在HR领域的应用真实案例
以下是 AI 在 HR 领域的一些应用真实案例: 1. 在招聘初期,AI 可用于职位描述生成、简历分析、面试题设计。 2. 在员工绩效评估方面,AI 能够分析员工工作表现,识别绩效趋势和提升点,为管理层提供数据支持的绩效反馈。 3. 对于员工培训与发展,AI 也能发挥作用。 例如,在智能人力资源方面,目前主要利用模型进行简历初筛、JD 自动生成、数据分析等工作。还有像 Deepseek“4+1”黄金提问法中的人力资源场景,如作为 IT 企业 HR,目标是 6 个月内培养 10 名全栈工程师,能独立负责项目。需要设计阶段性培训方案,并提出了具体的要求,用培训体系文档格式输出,包含能力评估标准。
2025-03-10
推荐一个做ppt的AI
以下是为您推荐的做 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 5. 爱设计 PPT:在国内 AI 辅助制作 PPT 的产品中表现出色,背后有强大的团队,能敏锐把握市场机遇,已确立市场领先地位。 这些工具通过自动化和智能化的设计流程,极大地简化了 PPT 的制作工作,您可以根据自己的需求和喜好选择合适的工具,以提高工作效率和演示效果。
2025-03-10
我有很多产品视频,需要进行混剪,可以怎么通过AI减少工作时间,提升工作效率
以下是一些通过 AI 减少产品视频混剪工作时间、提升工作效率的方法: 1. 利用数字人技术:无需真人模特,只需上传产品图片,数字人即可手持产品进行口播展示。支持语音和口型同步,动作、姿势定制,提供 1000+多国家数字人模特,覆盖全球 28+种语言,能快速生成产品宣传视频,省去拍摄烦恼。您可以在线体验: 。 2. 产品链接生成视频:输入产品链接,一键生成数字人产品介绍视频。目前产品链接主要支持 Amazon、Shopify、ETSY、Ebay、Appstore、Google Play、WIKI 等,其他网站来源持续接入中。操作指引为输入产品网站链接——选择数字人角色——点击立即生成。如遇生成失败的问题,可尝试删除链接后缀,点击重新生成。 3. AI 视频高光切片:智能提取视频高光片段,高效二创生成新视频。适用场景为有初始长视频素材,需要提取高光镜头对初始素材进行混剪投放到短视频平台。使用指引为点击上传视频——立即生成。您可以参考案例示意,如初始视频 。
2025-03-10
AI可以协助制造业企业做哪些工作
AI 可以协助制造业企业完成以下工作: 1. 产品设计和开发:利用 AI 生成工具如 Adobe Firefly、Midjourney 等,根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素,提高产品设计效率。 2. 工艺规划和优化:结合大语言模型的自然语言处理能力,自动生成制造工艺流程、设备选型、质量控制等方案,优化生产过程。 3. 设备维护和故障诊断:通过分析设备运行数据,预测设备故障,并自动生成维修建议,提高设备可靠性。 4. 供应链管理:根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容,提高供应链管理效率。 5. 客户服务:基于对话模型的 AI 客服机器人,自动生成个性化的客户回复,提升客户体验。 此外,在制造业中,AI 还能用于预测性维护,帮助工厂避免停机;进行质量控制,检测产品缺陷以提高产品质量;优化供应链,提高效率和降低成本;控制工业机器人,提高生产效率;以及协助生产计划和供应链计划状态查询、产线预测性维保辅助、产品质量分析与溯源等工作。
2025-03-10