市面上与阿里百炼平台类似的工作流竞品有以下几种:
用成本相对较高,大家可以选择以下供应商中|模型厂商|类型|特点|成本|网址/文档||-|-|-|-|-||智谱<br>GLM-4V|通用视觉类大模型|拍立得最早使用的模型<br>接口响应速度快<br>指令灵活性差一些<br>一个接口支持图片/视频/文本,视频和图片类型不能同时输入|调用:0.05元/千tokens|[智谱接口调用示例](https://bigmodel.cn/dev/api/normal-model/glm-4v)||阿里云百炼<br>qwen-vl-plus|通用视觉类大模型|拍立得目前使用的模型<br>指令灵活性比较丰富<br>接口调用入门流程长一些,密钥安全性更高|调用:¥0.008/千tokens<br>训练:¥0.03/千tokens|[通义千问接口调用示例](https://bailian.console.aliyun.com/?spm=5176.21213303.J_qCOwPWspKEuWcmp8qiZNQ.33.14162f3drQWnj1&scm=20140722.S_card@@%E4%BA%A7%E5%93%81@@2983180._.ID_card@@%E4%BA%A7%E5%93%81@@2983180-RL_%E7%99%BE%E7%82%BC%E5%A4%A7%E6%A8%A1%E5%9E%8B-LOC_search~UND~card~UND~item-OR_ser-V_3-RE_cardNew-P0_0#/model-market/detail/qwen-vl-plus?tabKey=sdk)||阶跃星辰|通用视觉类大模型|响应速度快<br>支持视频理解|输入:¥0.005~0.015/千tokens<br>输出:¥0.02~0.07/千tokens|[阶跃星辰接口调用示例](https://platform.stepfun.com/docs/guide/image_chat)||百度PaddlePaddle|OCR,垂直小模型|文本识别能力补齐增强|私有化部署服务费<br>API调用在¥0.05~0.1/次|[Paddle OCR开源地址](https://github.com/PaddlePaddle/PaddleOCR)|
1.上传输入图片2.理解图片信息,提取图片中的文本内容信息3.场景提示词优化/图像风格化处理4.返回文本/图像结果[heading3]1.5开源代码[content]为了简化流程,我们选择了阿里云百炼大模型平台并实现了零代码版本的工作流,您仅需要安装python相关依赖,填写入API_KEY,app_id信息,微调您的prompt信息,就可以马上的部署运行。代码开源地址:https://github.com/inhai-wiki/Pailido_AlibabaCloud?tab=readme-ov-file1.环境准备Python 3.8+2.依赖安装3.项目启动启动后访问下面的地址如果您的手机跟您的电脑都在同一wifi下,可以使用手机访问下面这个ip地址,手机端也可以进行访问~注意,由于手机安全限制的问题,我们必须得部署到服务器(https协议的)上才可以使用,这边就主要给大家通过网页端进行简单演示。4.配置信息Pailido支持了灵活的配置API_KEY信息,同时能够保存在用户手机本地,也可以快速的添加自定义场景,仅需输入场景名称和阿里云百炼上的appid信息即可。配置阿里云百炼APP_KEY配置阿里云百炼的场景名称和appid如何获取appid?“踏上取经之路,比抵达灵山更重要。”阿里云百炼大模型平台,专注企业级大模型服务我们下期共学再会End
阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。不论是开发者还是业务人员,都能深入参与大模型应用的设计和构建。您可以通过简单的界面操作,在5分钟内开发出一款大模型应用,或在几小时内训练出一个专属模型,从而将更多精力专注于应用创新。使用场景示例:场景1、法律合规改写:客户是一家招聘平台,每天需要处理百万级别的企业招聘需求,通过百炼工作流封装多个法律合规Agent判断企业端的要求是否符合劳动法要求,是否有性别歧视风险等等,并自动改写,减少了大量人力审核的需求场景2、关键信息抽取&打标签:客户是一家法催机构,每天需要处理十万到百万级别的借款人的相关信息,包括数额、借款时长、沟通次数以及反馈等等的大量不同来源的文本,通过百炼工作流,客户构建并串联了案件画像Agent、借款人画像Agent、法院画像Agent并最终通过打标签Agent经过意图分析节点自动化执行下一步,减少了大量律师数据整理,分析以及归类的工作场景3、智能助理&客服:客户是一家有C端APP的教育机构,有几十万的DAU,客户通过百炼工作流搭建了首页的智能助手,通过意图分类的能力,将不同的用户Query分发到不同的场景模型中,针对用户自己的场景进行回答