Navigate to WaytoAGI Wiki →
Home/All Questions
打造企业AI应用场景
以下是关于打造企业 AI 应用场景的相关内容: 阿里云百炼: 阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。开发者和业务人员都能参与大模型应用的设计和构建。通过简单的界面操作,能在 5 分钟内开发出大模型应用,或在几小时内训练出专属模型,从而将更多精力专注于应用创新。 使用场景示例: 法律合规改写:招聘平台可通过百炼工作流封装多个法律合规 Agent 判断企业端要求是否符合劳动法等,并自动改写,减少人力审核需求。 关键信息抽取&打标签:法催机构可通过百炼工作流构建并串联相关 Agent,减少律师数据整理、分析和归类工作。 智能助理&客服:教育机构可通过百炼工作流搭建首页智能助手,通过意图分类能力分发用户 Query 并回答。 AI 决策相关: 在制定企业 AI 战略时,要在提高效率、促进创新的同时规避潜在风险。企业不需要短期内进行全面伦理审查,但可优化实际操作流程,满足市场需求并保持长远发展。 明确 AI 的适用范围:企业要针对自身业务需求明确使用边界。不是所有决策都需由 AI 完成,在复杂决策场景中,AI 适合辅助角色。常见适用场景包括数据密集型工作(如市场分析、客户画像、生产优化等)、重复性任务(自动化流程、预测维护等)、有限范围内的创新(在已有数据基础上提供初步建议)。企业管理层可引入内部评估机制,每季度评估 AI 在不同业务线中的表现,并设定不同使用权限。AI 可部署在低风险、可标准化任务上,涉及品牌形象、用户隐私、产品战略等决策应由人类主导。
2025-03-13
批量视频转文字
以下是关于批量视频转文字的相关信息: 通义听悟是阿里云推出的一款基于大模型的工作学习 AI 助手,能对音视频内容进行转写、检索、摘要和整理等。它可以实时记录交流内容并同步翻译,批量转写音视频文件并区分发言人,智能提炼全文概要、章节速览和发言总结,提取视频中的 PPT 并总结摘要,自动提取关键词和待办事项,编辑整理笔记并导出分享。通义听悟于 2023 年 6 月 1 日开始公测,并在 2023 年 11 月的云栖大会上正式上线。 舆情管理大师汽车 bot 小队具有视频直转文字的功能,能简化人工筛选过程,提炼关键内容用于复审。 在视频转绘制作视频过程中,对于批量跑图脚本设置,当对关键帧的图片试验完毕得到满意画面时,可来到图生图界面点击最下面的脚本按钮,选择 Ebsynth Utility 脚本。需填写对应的工程文件路径,注意 Mask option 选项控制是否使用蒙版。ControlNet 配置一般保持默认参数,还可配置脸部裁切,包括面部裁切选择、面部裁切分辨率、最大裁切尺寸、人脸去噪程度、面部放大倍数等参数,开启后可改善面部崩坏情况。设置完成点击生成按钮,最后会在工程文件夹中生成一个 img2img_key 的文件夹。
2025-03-13
token是什么
在大语言模型领域,Token 通常用来表示文本数据中的一个单元。在不同语境下,一个 token 可能代表一个字、一个词或一个句子。在英文中,一个 token 通常是一个词或标点符号;在一些汉语处理系统中,一个 token 可能是一个字或一个词。Token 是处理和理解文本数据的基本单元。 在深度学习的语言模型中,如 Transformer,输入的文本首先被切分成一系列的 tokens。这些 tokens 被转换成向量,然后被输入到神经网络中进行处理。因此,在这种情况下,token 可以被理解为语言模型接收和处理的最小的信息单元。在训练过程中,每个 token 会关联一个预测,这个预测可以是下一个 token 的预测,也可以是该 token 的属性预测,如词性、情感等。 训练 token 的数量会影响模型的性能和准确性。更多的训练 token 通常意味着更多的训练数据,这可能会提升模型的准确性和泛化能力。然而,处理更多的 token 也会增加计算的复杂性和计算资源的需求。 很多同学把 token 理解为中文语义里的“字节”,这种理解有一定相似度,因为“字节”是计算机存储和处理数据的基本单元,而“token”是语言模型处理文本信息的基本单元。但这种理解不够准确,“Token”在语言模型中的作用比“字节”在计算机中的作用更加复杂和多元。在大语言模型中,“token”不仅代表文本数据中的一个单位,而且每个“token”都可能携带了丰富的语义信息。比如,在处理一句话时,“token”可能表示一个字、一个词甚至一个短语,同时,每个“token”在模型中都有一个对应的向量表示,这个向量包含了该“token”的语义信息、句法信息等。 Unicode 是一种在计算机上使用的字符编码,为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。GPT 实际是将我们输入的文字转换成 token,然后通过 GPT 模型预测 token,再将 token 转换成文字,最后再输出给我们。GPT 的输入和输出都是一个个的 token,GPT 适用于几乎所有流行的自然语言,其 token 需要兼容几乎人类的所有自然语言,通过 unicode 编码来实现这个目的。
2025-03-13
ai的具体用途在哪些方面
人工智能(AI)的用途广泛,涵盖以下多个方面: 1. 医疗保健: 医学影像分析,辅助诊断疾病。 加速药物研发,识别潜在药物候选物和设计新治疗方法。 提供个性化医疗,分析患者数据制定个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈,识别并阻止欺诈行为。 信用评估,帮助金融机构做出贷款决策。 投资分析,分析市场数据辅助投资决策。 提供 24/7 客户服务,回答常见问题。 3. 零售和电子商务: 产品推荐,分析客户数据推荐可能感兴趣的产品。 改善搜索结果和提供个性化购物体验。 动态定价,根据市场需求调整产品价格。 提供聊天机器人服务,解决客户问题。 4. 制造业: 预测性维护,预测机器故障避免停机。 质量控制,检测产品缺陷提高质量。 优化供应链,提高效率降低成本。 控制工业机器人提高生产效率。 5. 交通运输: 开发自动驾驶汽车,提高交通安全性和效率。 优化交通信号灯和交通流量,缓解拥堵。 优化物流路线和配送计划,降低运输成本。 实现无人机送货,快速送达偏远地区。 6. 其他领域: 教育领域,提供个性化学习体验。 农业领域,分析农田数据提高农作物产量和质量。 娱乐领域,开发虚拟现实和增强现实体验。 能源领域,优化能源使用提高效率。 总之,AI 的应用场景还在不断扩展,未来将对我们的生活产生更深远的影响。
2025-03-13
AI 去视频字幕
以下是关于 AI 去视频字幕的相关信息: VSR 字幕去除工具:利用 AI 去除视频和图片中的字幕,支持智能填充处理,确保视觉质量。链接: 对于有字幕的 B 站视频,若视频栏下有字幕按钮,说明视频作者已上传字幕或后台适配了 AI 字幕。可安装油猴脚本,安装后刷新浏览器,点击字幕会多出“下载”按钮,可选择多种字幕格式,然后将字幕文字内容全选复制发送给 GPTs 进行总结。 【TecCreative】的创意工具箱中有智能识别视频语言并生成对应字幕的功能,满足海外多国投放场景需求。操作指引:点击上传视频——开始生成——字幕解析完成——下载 SRT 字幕。注意:支持 MP4 文件类型,大小上限为 50M。
2025-03-13
AI 去字幕
以下是关于 AI 去字幕的相关信息: 一种解决方案是: 用 whisper 生成原视频的英文字幕(预设 whisper 生成的字幕没问题,whisper 的问题不探讨)。 让 GPT 结合字幕全文翻译,并让其根据原英文字幕的拆分,将译文进行同样行数的拆分。 将 GPT 译文拆分的结果插入到原英文字幕文件中形成一个新的双语字幕文件。这个过程中所有的执行脚本都是让 GPT 写的。 另外,VSR 字幕去除工具可以利用 AI 去除视频和图片中的字幕,并支持智能填充处理,确保视觉质量。 还有一种方式是,在某些平台如【TecCreative】中,智能识别视频语言并生成对应字幕,满足海外多国投放场景需求。操作指引为:点击上传视频——开始生成——字幕解析完成——下载 SRT 字幕。但需注意支持 MP4 文件类型,大小上限为 50M。
2025-03-13
教育行业有那些基于aigc的业务实际落地的产品和案例?
以下是教育行业基于 AIGC 的一些业务实际落地的产品和案例: 教师的 AI 减负指南生成式人工智能在教学中的应用,包括教师使用 AI 的小技巧。涉及人员有张亚丽、富露露、张亚玲、张楚璇、吴箭枢等,学校有深圳大学附属中学、苏州工业园区娄葑学校、上海市静安区风华初级中学南校、江苏省苏州工业园区教师发展中心中学、苏州工业园区唯亭学校初中、中央民族大学附属中学等。 AIGC 人机协同国家课程项目化学科实践设计与实施,例如以科学《计量时间博物展》为例,以及基于思维可视化的项目式主题学习设计与实践,如以智驾未来课程为例。相关人员有祝琛、崔琴、张然、刘敏、王国庆、吴沁珂等,学校有深圳市南方科技大学教育集团实验二小、成都经济技术开发区实验小学校。 Al 创作家:用 AI 辅助设计桌游,解决学校实际问题,如北京市新英才学校的魏一然所做的工作。 生成式人工智能与教学变革:AI 领雁行动的探索与实践,相关人员有邹贤莲、向雪萍、陈治佑、余初冉、阊洪娇,学校有重庆两江新区行远小学校。 北京市新英才学校的跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 的帮助下备课和授课,生物和信息科技老师合作一起带着学生用训练 AI 模型,用以识别植物。 AIGC 常见名词解释,如 AIGC 意为人工智能生成内容,能进行 AIGC 的产品项目和媒介众多,包括语言文字类的 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等,语音声音类的 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,图片美术类的 Midjourney、Stable Diffusion 等。
2025-03-13
我是一名中职思政教师,我想开一个主题为AI赋能梦想的班会,班会内容要创新并且与计算机专业高一学生、技能强国相结合。想帮我想一个班会框架,内容具有在教室的可操作性,低成本的
以下是为您设计的一个以“AI 赋能梦想”为主题,适合中职计算机专业高一学生,在教室可操作且低成本的班会框架: 一、引入主题 1. 播放一段关于 AI 改变世界的短视频,引发学生兴趣。 2. 老师简单介绍本次班会的主题“AI 赋能梦想”以及与技能强国的联系。 二、知识讲解 1. 用 PPT 展示 AI 的基本概念和应用领域,如医疗、交通、教育等。 2. 结合计算机专业,讲解 AI 在该领域的发展前景和就业机会。 三、小组讨论 1. 分组讨论 AI 对未来职业的影响,以及如何通过学习计算机技能在 AI 时代立足。 2. 每组选派代表发言,分享讨论结果。 四、案例展示 1. 展示一些中职学生在 AI 相关领域取得成功的案例。 2. 分析他们成功的原因和所具备的技能。 五、创意设想 1. 让学生们设想自己如何利用 AI 技术实现个人梦想,写在纸条上。 2. 随机抽取学生分享他们的设想。 六、总结与展望 1. 老师总结本次班会的重点内容。 2. 鼓励学生努力学习,为技能强国贡献自己的力量,实现 AI 赋能的梦想。 希望这个班会框架能满足您的需求,祝您班会举办成功!
2025-03-13
生成图片的大模型
以下是关于生成图片的大模型的相关信息: SDXL 模型: 是 Stable Diffusion 开发公司最新发布的图像生成大模型。 以往使用的模型多在 sd1.5 官方模型上衍生微调,而 sdxl1.0 版本的官方大模型有极强升级。 base 模型参数数量为 35 亿,refiner 模型参数数量达 66 亿。 由 base 基础模型和 refiner 优化模型构成,可在 base 模型基础上用优化模型绘画,更有针对性优化出图质量。 优势: 审美偏好有很大提升,出图效果直逼 midjourney。 体积和分辨率更大,base+refiner 容量达 13G,基于 10241024 图片训练,可直接生成 1000 分辨率以上图片,细节和绘画质量惊人。 可图大模型: 由快手可图团队开发,基于潜在扩散的大规模文本到图像生成模型。 在数十亿图文对下训练,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面有巨大优势,支持中英双语,在中文特色内容理解方面更具竞争力。更多信息可查看技术报告。 SD 模型入门: 主模型后缀一般为.ckpt 或者.safetensors,体积在 2G 7G 之间。 管理模型需进入 WebUl 目录下的 models/Stablediffusion 目录。 在使用 WebUI 时左上角切换的就是主模型。
2025-03-13
从零开始的话,从哪开始学习和上手
如果您想从零开始学习 AI 并上手,以下是一些建议: 1. 阅读相关论文和博客:可以从“GPT1 到 Deepseek R1 所有公开论文 The 2025 AI Engineer Reading List”开始,其中涵盖了人工智能工程的多个领域,如 LLMs、基准、提示、RAG、代理、CodeGen、视觉、语音、扩散、微调等。 2. 学习 Prompt(提示词)技巧:掌握“分配角色”“给出示例(fewshots)”“思维链(ChainofThought)”这三板斧,深入研究这三个核心方面。 3. 了解 Stable Diffusion:通过知乎上的“教程:深入浅出完整解析 Stable Diffusion(SD)核心基础知识”,学习其资源、核心基础原理、网络结构、搭建使用和训练等方面的知识,包括模型工作流程、核心网络结构、推理流程、训练环境配置等。
2025-03-13