Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

小模型场景落地路线图

Answer

实施小模型(如轻量级机器学习模型或嵌入式AI模型)的场景落地需要精细的规划和执行。以下是一个详细的路线图,涵盖从概念到部署的各个阶段。

路线图

1. 需求分析

  • 目标定义: 明确项目的目标和期望结果,确定需要解决的问题和应用场景。
  • 可行性研究: 评估技术可行性、市场需求和成本效益。
  • 需求收集: 收集和分析来自利益相关者的需求,明确模型功能和性能指标。

2. 数据准备

  • 数据收集: 收集相关数据,这可以来自数据库、传感器、API等。
  • 数据清洗: 处理缺失值、异常值和重复数据。
  • 数据标注: 对数据进行分类和标注,以便用于监督学习模型。
  • 数据分割: 将数据分为训练集、验证集和测试集。

3. 模型选择

  • 模型探索: 调研和选择适合项目需求的小模型,如TinyML模型、MobileNet、SqueezeNet等。
  • 预训练模型: 考虑使用预训练模型进行微调,以节省时间和计算资源。

4. 模型训练

  • 训练环境搭建: 配置所需的硬件和软件环境(如TensorFlow Lite、PyTorch Mobile)。
  • 模型训练: 在训练集上训练模型,并使用验证集进行调优。
  • 超参数调优: 通过网格搜索或贝叶斯优化等方法优化模型超参数。

5. 模型优化

  • 模型压缩: 采用剪枝、量化等技术减少模型大小和计算量。
  • 模型精简: 删除不必要的特征和层,进一步简化模型结构。
  • 模型加速: 使用硬件加速(如TPU、GPU)优化模型推理速度。

6. 部署准备

  • 平台选择: 确定模型的部署平台(如移动设备、嵌入式系统、边缘设备)。
  • 代码整合: 将模型集成到应用程序或设备固件中。
  • 性能测试: 在目标环境中测试模型的性能,包括速度、内存占用和功耗等。

7. 模型部署

  • 部署环境搭建: 搭建生产环境,确保与开发环境一致。
  • 持续集成: 设置CI/CD管道,确保模型的持续集成和部署。
  • 安全措施: 实施必要的安全措施,保护模型和数据的隐私与安全。

8. 监控与维护

  • 监控系统: 部署监控系统,实时跟踪模型的性能和使用情况。
  • 模型更新: 定期更新和重新训练模型,以应对数据分布变化和新需求。
  • 用户反馈: 收集用户反馈,优化模型和应用程序。

9. 文档与培训

  • 文档编写: 编写详细的技术文档和用户手册。
  • 培训支持: 为使用和维护模型的人员提供培训和支持。

工具和技术

  • 数据处理: Pandas, NumPy, OpenCV
  • 模型训练: TensorFlow, PyTorch, scikit-learn
  • 模型优化: TensorFlow Lite, ONNX, TensorRT
  • 部署平台: Docker, Kubernetes, AWS Lambda, GCP Functions
  • 监控工具: Prometheus, Grafana, ELK Stack

实例项目

智能家居设备中的语音识别

  • 需求分析: 在智能家居设备中实现语音命令识别。
  • 数据准备: 收集和标注家居环境中的语音命令数据。
  • 模型选择: 使用MobileNet模型进行语音识别。
  • 模型训练: 在收集的语音数据上训练模型,并进行超参数调优。
  • 模型优化: 使用量化技术将模型大小减小到适合嵌入式设备。
  • 部署准备: 将模型集成到智能家居设备的固件中。
  • 模型部署: 在生产环境中部署,并进行性能测试和优化。
  • 监控与维护: 实时监控语音识别的性能,收集用户反馈进行改进。

通过上述路线图,开发团队可以系统地实现小模型在不同场景下的落地,从而确保模型的高效性和实用性。

Content generated by AI large model, please carefully verify (powered by aily)

References

周鸿祎免费课AI系列第一讲

还有最后一个,我觉得大模型道路之三,是加速场景落地,2023年的重点是大模型本身,大模型光做一个聊天机器人是没有意义的,在企业内部你光跟机器人聊天,聊得最多,它跟你的业务系统无法融合,跟你的应用无法结合,还是没有用。所以,2024年我觉得在场景应用,场景应用除了To B的场景,很多传统的To C的场景都值得重做一遍。大家想想,苹果肯定要把它的手机场景重塑一遍,微软把它的Office365,浏览器、Bing搜索重塑了一遍,所以我讲的不是加持,是重塑。你要重新思考,如果我有一个专有大模型,我这个大模型怎么改变我的功能和用户体验。所以,我很赞同国际上一个公司说的话,我先找场景,场景找好了,再训一个自己的大模型。

周鸿祎免费课AI系列第一讲

还有最后一个,我觉得大模型道路之三,是加速场景落地,2023年的重点是大模型本身,大模型光做一个聊天机器人是没有意义的,在企业内部你光跟机器人聊天,聊得最多,它跟你的业务系统无法融合,跟你的应用无法结合,还是没有用。所以,2024年我觉得在场景应用,场景应用除了To B的场景,很多传统的To C的场景都值得重做一遍。大家想想,苹果肯定要把它的手机场景重塑一遍,微软把它的Office365,浏览器、Bing搜索重塑了一遍,所以我讲的不是加持,是重塑。你要重新思考,如果我有一个专有大模型,我这个大模型怎么改变我的功能和用户体验。所以,我很赞同国际上一个公司说的话,我先找场景,场景找好了,再训一个自己的大模型。

周鸿祎免费课AI系列第一讲

大模型会两个极端,一个极端是越做越大,一个极端是越做越小。这里的小模型是个不准确的说法,大跟小,都是对的。所谓小模型就是“小参数的、小数据”的大模型,它的架构是大模型,但是它的规模比较小。比如说,英伟达推出Chat with RTX,大模型在终端上跑,像三星对苹果的刺激,没有人评价这个事儿,但是这个事儿很重要。现在手机的算力已经过剩了。如果手机就给大家刷视频,玩游戏,实际上手机的算力是过剩的。所以,手机上现在已经能,刚才讲了Mobile LLama的版本不到1B的参数量已经能在手机上跑。这个小模型的概念是什么?我和大家讲两点:它不是和OpenAI去比全功能,它往往是一个垂直模型,是个专业模型。它不是用在最高精尖的领域,比如苹果,让Siri更好地理解人的讲话,根本不需要GPT4,甚至GPT3.5都不需要,一个小模型就完全可以来胜任。

Others are asking
能画技术路线图的prompt
以下是关于能画技术路线图的 prompt 相关内容: Midjourney Bot 的 Prompt 类型: 基本 Prompts:可以只是一个单词、短语或表情符号。 高级 Prompts:包括一个或多个图片 URL、多个文本短语以及一个或多个参数。其中,图片 URL 始终位于 prompt 的最前面,以影响完成结果的风格和内容。提示文字是对希望生成的图像的文本描述,精心编写的提示有助于生成惊艳的图像。参数可以改变生成图片的方式,需放在提示语的末尾。 ComfyUI Flux 与 runway 制作绘画视频: 生成图片:提示词告诉 flux 生成一张技术草图,如 CAD。 绘制的视频:在 runway 里面,使用提示词从空白页面开始逐行创建,并把生成的图片作为尾帧。 草图上色:使用 flux 的 controlNet,depth 固定,目前 Union 版本不建议权重调太高,结束时间也需注意。 Prompt engineering(提示工程): 开发测试用例:定义任务和成功标准后,创建多样化的测试用例,包括典型示例和边界情况,以确保提示具有鲁棒性。 设计初步提示:制定初步提示,概述任务定义、良好响应的特征及必要上下文,添加规范输入和输出的示例供参考。 根据测试用例测试提示:使用初步提示将测试用例输入,评估模型响应与预期输出和成功标准的一致性,使用一致的评分标准进行系统性的性能评估。
2025-04-19
我已经有了论文大纲,需要生成技术路线图,哪个AI可以实现
以下是一些可以帮助您生成技术路线图的 AI 工具和方法: 1. 利用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 2. 使用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 3. 对于生成“延伸思考”的问题,可以让 AI 根据特定的参照(比如之前的产出或是新增的参考文案)输出具备更高关联度的内容。 4. 可以用同一段提示词对比不同模型的输出,择优深挖。 5. 在满意的内容节点上添加“文本编辑器显示”,对文本进行精加工。 6. 先确定整个调研报告的大纲目录,例如通过手机识别示例报告的目录截图。 7. 让 AI 总结语言风格,如将范文交给 Claude 2 总结语言风格。 8. 让 GPT4 按照目录逐步生成章节内容,设置循环结构,根据情况决定是否调用 webpolit 插件查询相关信息。 9. 在需要搜索网络信息的章节处打上标签,让 GPT4 自主搜索信息再来生成内容。 需要注意的是,AI 工具可以作为辅助,但不能完全替代您的专业判断和创造性思维。在使用 AI 进行相关工作时,应保持批判性思维,并确保成果的质量和学术诚信。
2025-04-08
ChatGPT 各项技术能力路线图
以下是关于 ChatGPT 技术能力路线图的相关内容: 阶段一:开卷有益阶段 理解人类语言,学习语义关系、语法规律,能够应对未见过的语言处理情况。 GPT3 习得各种词汇和语法规则、编程语言及不同语言之间的关系,但存在回答不受约束的问题,指挥很重要。 阶段二:模版规范阶段 对话模版矫正模型,可形成优质对话并实现延展能力,知道什么该说和不该说。 通过任务对话范文训练,实现理解指令要求和例子要求的能力。 同时,在 AGI 实现路径与技术预测方面: 主要技术路线与理论框架包括可能性,如硬件与计算架构的趋势(量子计算、神经形态芯片、云计算资源扩展等),软件与算法进展(深度学习、元学习、强化学习、神经符号混合、AutoML、AutoGPT 等),以及人工智能安全与对齐研究(对齐难题、可解释性等)。 实现 AGI 所需的里程碑与风险点包括可能的时间表(如 2030、2040、2050 关键技术预测)和潜在的“奇点”时刻与触发条件(硬件爆发、算法重大突破、意外的研究范式转折等)。 此外,AI 的发展历程: 从 1950 年提出,近 20 年在国内互联网发展下普及。 最初应用是基于 NLP 技术的聊天机器人和客服机器人。 随后中英文翻译、语音识别、人脸识别等技术取得突破,在日常生活中广泛应用。 以前技术突破多限于特定领域,模型应用范围狭窄。 随着 OpenAI ChatGPT 等大型语言模型的突破,展示了新的发展路线,通过大规模模型预训练,涌现出广泛的智能应用。 这种集多功能于一体的模型为 AI 未来发展提供新方向,也带来新焦虑,但“人机共生”几乎是人类发展的必然。
2025-02-27
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
金融业相关AI应用场景或AI技术介绍
在金融业中,AI 有以下应用场景和技术: 1. 风控和反欺诈:用于识别和阻止欺诈行为,降低金融机构的风险。 2. 信用评估:评估借款人的信用风险,帮助金融机构做出更好的贷款决策。 3. 投资分析:分析市场数据,辅助投资者做出更明智的投资决策。 4. 客户服务:提供 24/7 的客户服务,回答客户常见问题。 例如,Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能够一次处理多达数百万份文档,在短时间内浏览数十亿份包括 PDF、PowerPoint、电子表格和转录内容等,并返回具体答案,主要面向金融服务公司,如对冲基金和投资银行,同时也适用于律师事务所等其他专业领域。
2025-04-15
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出10个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您生成的 10 个业务价值高、具备可行性的 AI 应用场景介绍: 1. 人才招聘与筛选 What:利用 AI 技术对求职者的简历进行自动筛选和分析,评估其与岗位的匹配度。 Why:节省 HR 大量的时间和精力,提高招聘效率和准确性。 How:通过自然语言处理和机器学习算法,训练模型识别关键信息和技能。 2. 员工培训与发展 What:根据员工的技能水平和职业发展目标,定制个性化的培训计划。 Why:提升员工的能力和绩效,增强员工对企业的忠诚度。 How:利用大数据分析员工的工作表现和学习需求,推荐相关课程和学习资源。 3. 薪酬福利管理 What:运用 AI 预测市场薪酬趋势,为企业制定合理的薪酬策略。 Why:保持企业薪酬的竞争力,吸引和留住优秀人才。 How:收集和分析行业薪酬数据,结合企业的财务状况和战略目标进行优化。 4. 员工绩效评估 What:借助 AI 实时监测员工的工作表现,提供客观的绩效评估。 Why:减少人为偏差,确保评估的公正性和准确性。 How:利用工作流程数据和行为分析模型进行评估。 5. 员工关系管理 What:通过 AI 分析员工的情绪和满意度,及时发现问题并解决。 Why:营造良好的工作氛围,提高员工的工作积极性和创造力。 How:使用情感分析技术处理员工的反馈和交流信息。 6. 组织架构优化 What:利用 AI 分析企业的业务流程和人员配置,提供组织架构调整建议。 Why:提高企业的运营效率和灵活性,适应市场变化。 How:基于数据分析和模拟优化算法进行评估和推荐。 7. 人力资源规划 What:根据企业的战略目标和业务发展预测人力资源需求。 Why:提前做好人才储备和招聘计划,保障企业的正常运营。 How:运用数据分析和预测模型进行规划。 8. 企业文化传播 What:使用 AI 生成个性化的企业文化宣传内容,提高传播效果。 Why:增强员工对企业文化的认同感和归属感。 How:利用自然语言生成技术和个性化推荐算法。 9. 智能客服 What:在 HR 服务中引入 AI 客服,解答员工常见问题。 Why:快速响应员工需求,提高服务质量。 How:训练智能客服模型,涵盖常见的 HR 问题和解决方案。 10. 人才库管理 What:利用 AI 对人才库进行分类和更新,提高人才库的利用效率。 Why:方便快速找到合适的人才,降低招聘成本。 How:运用数据挖掘和分类算法进行管理。
2025-04-14
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出3-5个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您提供的 3 个业务价值高、具备可行性的 AI 应用场景介绍: 场景一:AI 在企业招聘中的应用 What:利用 AI 技术进行简历筛选、人才匹配和面试评估。 Why:能够快速处理大量简历,提高招聘效率和准确性,节省人力和时间成本,同时更精准地找到符合岗位需求的人才。 How:通过引入相关的 AI 招聘软件,与企业现有的招聘系统集成,对简历进行关键词提取和分析,利用机器学习算法进行人才匹配,并通过视频面试中的语音和表情分析辅助评估候选人。 场景二:AI 助力个性化人力资源管理 What:根据员工的个人特点和工作表现,提供个性化的培训计划、职业发展建议和绩效评估。 Why:能够充分发挥员工的潜力,提高员工满意度和忠诚度,促进企业的长期发展。 How:收集员工的工作数据、学习记录和绩效表现等信息,运用 AI 算法进行分析和预测,为员工制定专属的发展方案,并通过移动应用或内部系统向员工推送相关建议和培训课程。 场景三:AI 打造无人值守的 HR 平台 What:实现 HR 业务的自动化处理,如员工请假审批、薪酬计算和福利发放等。 Why:减少人工操作的错误和繁琐流程,提高 HR 工作的效率和准确性,使 HR 人员能够专注于更有价值的战略工作。 How:整合企业内部的各种 HR 系统和数据,利用 RPA 和 AI 技术实现流程的自动化,同时建立监控和预警机制,确保平台的稳定运行。
2025-04-14
准确的讲述垂直大模型的概念,国内外的应用现状、场景,发展趋势,最好能附带图片。内容尽量详细、逻辑通顺。
垂直大模型是专注于特定领域的大模型,例如小语种交流、临床医学、AI 蛋白质结构预测等。 在国内,大模型分为通用模型如文心一言、讯飞星火等,处理自然语言;也有垂直模型专注特定领域。 大模型因其强大的语言理解和生成能力,在多个领域和应用场景中表现出色。比较火的应用场景包括: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信:促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 6. 教育和学习辅助:创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可以根据文本描述生成相应的图像,甚至在未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询:理解和回答医疗相关的问题,提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询:帮助解读法律文件,提供合规建议,降低法律服务的门槛。 关于发展趋势,尽管当前市场以基础大模型为主,但将大模型与行业专业知识结合,以满足不同行业的需求,成为未来发展的关键。例如腾讯研究院的《行业大模型调研报告》指出,如何将大模型与行业专业知识结合是重点。同时,在发展过程中也需要注意其在隐私、安全和伦理方面的挑战。 很抱歉,暂时无法为您提供相关图片。
2025-04-11
随着 ChatGPT、Deepseek 等 AI 技术的爆发式发展,人工智能正在加速渗透各行业应用场景,包括茶饮行业。请你对 AI 技术在茶饮行业的影响进行研究分析,并提出 AI 技术可以在连锁奶茶店如何应用的设想。
以下是关于 AI 技术在茶饮行业的影响分析及在连锁奶茶店应用的设想: 影响分析: 1. 提升运营效率:通过自动化流程和智能预测,优化库存管理、员工排班等环节。 2. 改善客户体验:利用智能客服快速响应顾客咨询,提供个性化推荐。 3. 精准营销:基于大数据分析顾客偏好,制定更有针对性的营销策略。 应用设想: 1. 智能点单系统:根据顾客的历史订单和偏好,为其推荐饮品和搭配。 2. 库存管理优化:借助 AI 预测销售趋势,精准控制原材料库存。 3. 员工培训辅助:利用虚拟培训工具,提升员工的服务技能和产品知识。 4. 营销决策支持:通过数据分析,确定最佳的促销活动和推广渠道。 目前的知识库中,相关的具体研究报告主要有: 1. 浙江大学:《DeepSeek 技术溯源及前沿探索朱强》(2025/03/19),介绍了语言模型从基于统计的 Ngram 到 Transformer 的技术演化,以及大模型的发展,如 GPT 系列。 2. 浙江大学:《DeepSeek:回望 AI 三大主义与加强通识教育报告》(2025/03/05),围绕人工智能展开,介绍其发展历程、三大主义、技术进展、应用成果以及教育举措。 3. 清华大学:《气象人工智能技术与应用报告》(2024/12/25),围绕气象人工智能展开,介绍了其发展和应用情况。 如需下载这些研究报告,可。
2025-04-09
AI在企业落地
企业落地 AI 可以参考以下内容: Anthropic 在 AI Engineer Summit 2025 上分享了相关最佳实践,并总结了常见错误。核心挑战包括如何入手、如何评估效果、技术选择困惑(如是否需要微调)。关键经验是评估先行,明确“智能度、成本、延迟”之间的平衡,避免过早微调,先进行基础优化。例如 Intercom 通过评估优化 AI Agent Fin,使其处理 86%的客服请求,其中 51%无需人工介入。相关链接: 影刀 RPA+AI Power 方面:大模型有输入和输出限制,AI Power 集成丰富组件及技能组件可拓展 AI 服务能力边界,打造 AI Agent,如搜索引擎组件可让 AI 接入互联网获取实时信息,RPA 组件可直接调用影刀 RPA 客户端应用实现自动化操作。其具有无缝多样的使用方式,如嵌入方式包括网页分享、对话助理、API 集成等。企业系统分散,AI Power 提供多种调用方式方便企业灵活选择接入方式。此外,影刀 AI Power 为企业提供教学培训、技术答疑、场景共创等贴身服务支持,帮助企业把 AI 落地。 此外,相关知识库还介绍了面向学习者、创作者和企业的不同服务: 面向学习者:社区提供清晰学习路径,学习者通过丰富课程、活动和竞赛提升自己,积累能力成为高素质 AI 人才。 面向创作者:创作者掌握 AI 技术利用社区资源创作,满足企业需求,为社区发展注入活力。 面向企业:链接 AI 产品和传统企业,通过与社区合作获得优质内容与服务,从学习者中获取潜在流量。社区合作实践为学习者和创作者提供应用场景和技术经验。
2025-04-12
AI在BizDevOps中的场景落地及应用
以下是关于 AI 在 BizDevOps 中的场景落地及应用的相关内容: AI 在 DevOps 中的应用: AI 可以承担指定计划、拆分任务和调用工具的角色,但目前无法完全评定任务结果的正确性和质量。 现阶段更适合让 AI 辅助完成部分任务,如画原型图、设计表结构、写自动化测试代码等,但需要人类验证后才能进行下一步操作。 完全依赖 AI 可能带来风险,如生产环境出错或被黑客恶意利用漏洞。 AI 的记忆能力: ChatGPT 支持记忆功能,可通过摘要保存对话内容以延续角色和对话风格,但新开会话可能在高推理任务中效果更好。 建议将角色设定和部分对话作为样例(fewshot)放入提示词中,以优化生成质量。 学习 GPT 的妙招: 结合视频教程、文字转录和基础资料,通过 ChatGPT 讲解学习内容。 角色反转,自己当老师,ChatGPT 当学生,通过提问互动和查漏补缺能有效提升学习效果。 AI 对软件工程的影响: 涵盖自动代码生成、智能调试、AI 驱动的 DevOps 和敏捷开发优化。 自动代码生成工具(如 GitHub Copilot)提高编程效率,AI 也助力智能测试与运维。 DevOps 迎来 AI 驱动的 CI/CD 和 AIOps,提升部署自动化和智能监控能力。 AI 让敏捷开发更加高效,通过自动化需求分析、测试优化和团队协作增强生产力。 其他相关动态: OpenAI CEO 宣布开发 AI 设备,目标颠覆智能手机。 OpenAI 推出全新 Deep Research,让 ChatGPT 成为研究助理。
2025-04-01
chatbi落地方案
以下是关于 ChatGPT 落地方案的相关内容: 产品经理如何用 ChatGPT: 背景前提:非专业 BI 工程师,依靠 GPT 提示和查询资料解决不擅长领域问题及学习成长。使用免费的 ChatGPT3.5 版本,因充值问题未解决,且账号登录出现问题无法截图还原完整对话过程。 使用过程: 先整理与 GPT 交互的基本思路及步骤,包括旧代码输入、需求及现状问题输入、调试优化、结果输出验证。 旧代码输入时,1900 行代码直接粘贴报错,采取分次输入再联合的方式,让 GPT 理解旧代码实现效果及熟悉查询表和字段,方便后续生成优化代码直接在数据库运行。原 SQL 主要逻辑是统计近 30 天内每天的业务数据日报,按天和地区分组汇总,需查询多张表几百万条数据。GPT 理解基本正确,并主动提出优化建议。 LLM 落地思考: 对大模型的任务理解、编程能力、输出遵循有较高要求,需要 LLM 前处理与后处理工程兜底,因企业流程自动化出错影响面广。该方向能帮助企业完成数字化转型并升级至业务自动化,多为定制化服务,业务爆发期可能在几年后经济回暖时,目前需求方可能优先是国企与金融等数字化成熟且有国家 AI+任务驱动的地方。 采用 RAG 方案进行知识应用的工程框架,包括 AI 搜索、智能客服、流水线问题定位等场景,通过给予大模型已有行业知识解决问题,但前处理过程对方案效果影响较大。 ToC 业务方面,当前爆款产品如 ChatGPT、Midjourney 等,暂未出现像微信这样的大杀器 C 端产品,未来 C 端产品形态难以确定。
2025-03-22
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14