Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

企业级的ai服务或者解决方案有哪些

Answer

以下是一些企业级的 AI 服务或解决方案:

  1. 美国的 Zephyr AI 公司,于 2024 年 3 月 13 日完成 A 轮融资,融资金额 1.11 亿美元,主营 AI 药物发现和精准医疗。
  2. Together AI 公司,2024 年 3 月 13 日完成 A 轮融资,融资金额 1.06 亿美元,从事 AI 基础设施和开源生成。
  3. Glean 公司,2024 年 2 月 27 日完成 D 轮融资,融资金额 2.03 亿美元,专注于 AI 驱动企业搜索。
  4. Figure 公司,2024 年 2 月 24 日完成 B 轮融资,融资金额 6.75 亿美元,业务为 AI 机器人。
  5. Abridge 公司,2024 年 2 月 23 日完成 C 轮融资,融资金额 1.5 亿美元,从事 AI 医疗对话转录。
  6. Recogni 公司,2024 年 2 月 20 日完成 C 轮融资,融资金额 1.02 亿美元,提供 AI 接口解决方案。

在 AI 应用方面:

  1. AI 智能写作助手,如 Grammarly、秘塔写作猫,利用自然语言处理技术,市场规模达数十亿美元。
  2. 淘宝拍照搜商品,通过图像识别和机器学习技术,市场规模达数百亿美元。
  3. 小爱同学、Siri 等 AI 语音助手定制开发,运用语音识别和自然语言理解技术,市场规模在百亿美元以上。
  4. Keep 智能训练计划,基于数据分析和机器学习,市场规模达数十亿美元。
  5. 大众点评智能推荐,借助数据挖掘和自然语言处理,市场规模达百亿美元规模。
  6. 阿里小蜜等电商客服,采用自然语言处理和机器学习技术,市场规模达数十亿美元。

影刀 RPA + AI Power 具有以下特点:

  1. 功能亮点:集成丰富的 AI 组件及各种技能组件,拓展 AI 服务的能力边界,打造 AI Agent,如搜索引擎组件可让 AI 接入互联网获取实时信息,RPA 组件可直接调用影刀 RPA 客户端应用实现 AI 自动化操作。
  2. 无缝多样的使用方式:提供网页分享、对话助理、API 集成等嵌入方式,方便企业在不同业务场景下灵活选择接入方式,打通分散的系统,实现便捷的 AI 交互。
  3. 贴身的企业级服务支持:提供教学培训、技术答疑、场景共创等贴身服务,帮助企业把产品用起来,把 AI 落地下去,找到最佳实践,助力业务成功。
Content generated by AI large model, please carefully verify (powered by aily)

References

2024年美国融资金额超过1亿美元的AI公司(截止2024.10.15)

|项目名称|融资时间|融资金额(亿美元)|轮次|估值(亿美元)|主营|产业链标签|话题标签|投资方|其他信息||-|-|-|-|-|-|-|-|-|-||Zephyr AI|2024-03-13|1.11|A||AI药物发现和精准医疗|应用|医学|Revolution Growth,礼来公司基金会,EPIQ Capital Group,Jeff Skoll|||Together AI|2024-03-13|1.06|A|12|AI基础设施和开源生成|模型|硬件和云平台|Salesforce Ventures,NEA,Kleiner Perkins,Lux Capital|||Glean|2024-02-27|2.03|D|22|AI驱动企业搜索|应用|企业服务|Lightspeed Venture Partners,Kleiner Perkins,Sequoia,Databricks Ventures|||Figure|2024-02-24|6.75|B|27|AI机器人|应用|机器人|Nvidia,OpenAI,微软|||Abridge|2024-02-23|1.5|C|8.5|AI医疗对话转录|应用|医学|Redpoint,Lightspeed Venture Partners,USV,IVP,Spark Capital|||Recogni|2024-02-20|1.02|C||AI接口解决方案|基础设施|芯片|GreatPoint Ventures,Celesta Capital,Pledge Ventures,Mayfield,DNS Capital||信息来源:Techcrunch

100个AI应用

|序号|已有产品|主题|使用技术|市场规模|一句话介绍|项目功能||-|-|-|-|-|-|-||1|Grammarly、秘塔写作猫|AI智能写作助手|自然语言处理|数十亿美元|利用AI技术辅助用户进行高质量写作。|Grammarly可检查语法、拼写错误并提供改进建议,秘塔写作猫能进行智能润色和内容创作辅助。||2|淘宝拍照搜商品|AI图像识别商品推荐|图像识别、机器学习|数百亿美元|通过图像识别为用户推荐相似商品。|用户在淘宝使用拍照搜商品功能,上传图片后系统快速推荐类似商品。||3|小爱同学、Siri|AI语音助手定制开发|语音识别、自然语言理解|百亿美元以上|为不同需求定制专属语音助手。|小爱同学可控制智能家居、回答问题等,Siri能进行语音交互和任务处理。||4|Keep智能训练计划|AI个性化健身计划制定|数据分析、机器学习|数十亿美元|根据用户数据制定个性化健身方案。|Keep的智能训练计划结合用户身体状况和目标生成专属健身方案。||5|大众点评智能推荐|AI美食推荐平台|数据挖掘、自然语言处理|百亿美元规模|基于用户口味偏好推荐美食。|大众点评通过用户评价和偏好数据为用户推荐餐厅和美食。||6|阿里小蜜等电商客服|AI智能客服外包服务|自然语言处理、机器学习|数十亿美元|为企业提供智能客服解决方案。|阿里小蜜可自动回答客户问题,处理订单查询等任务。|

详解:影刀RPA + AI Power

大模型只能接收特定类型的输入内容,并按要求输出结果,但无法直接代替用户自动执行操作,这就极大限制了AI的能力,在实际的业务场景中仍需要大量的人工配合才能发挥作用。AI Power集成了丰富的AI组件及各种技能组件,可以极大地拓展AI服务的能力边界,打造AI Agent。比如搜索引擎组件可以让AI接入互联网获取实时信息,RPA组件可以直接调用影刀RPA客户端应用,从而实现AI自动化操作等。[heading2]无缝多样的使用方式[content]嵌入方式:网页分享、对话助理、API集成等企业有非常多分散的系统,对外的官网、客服群,内部的OA、CRM、ERP等,业务数据全都分散在这一个个信息孤岛上,很难用一套方案打通所有系统。AI Power提供网页使用、API对接、影刀RPA内置指令等多种调用方式,方便企业在不同的业务场景下灵活选择最适合的接入方式,让内部员工、外部客户等便捷地与AI交互。[heading2]贴身的企业级服务支持[content]服务内容:提供教学培训、技术答疑、场景共创等方面的贴身服务大模型类的AI对大部分企业来说都是新东西,企业既缺少对应的开发经历,也缺少相关的人才储备,从0开始非常困难,也容易走弯路。影刀AI Power拥有完整的产品运营、客户成功、技术支持团队,为每个客户提供贴身服务,帮助企业把产品用起来,把AI落地下去,找到最佳实践,助力业务成功。

Others are asking
企业级rag系统开发框架
企业级 RAG 系统开发框架如下: 首先,通过数据预处理引擎(如 Unstructured)将企业无结构文件(如 PDF、幻灯片、文本文件)从数据孤岛(如 Google Drive 和 Notion)加载、转换为 LLM 可查询格式,并将这些文件“分块”成更小的文本块,以实现更精确的检索,然后作为向量嵌入和存储在数据库(如 Pinecone)中。 当用户提出问题时,系统会检索语义上最相关的上下文块,并将其折叠到“元提示”中,与检索到的信息一起馈送给 LLM。LLM 会从检索到的上下文中合成答复返回给用户。 在实际生产中,AI 应用程序具有更复杂的流程,包含多个检索步骤和“提示链”,不同类型的任务并行执行多个“提示链”,然后将结果综合在一起生成最终输出。 RAG 是检索增强生成(Retrieval Augmented Generation)的简称,概括起来是知识检索+内容生成,主要组成包括数据提取、embedding(向量化)、创建索引、检索、自动排序(Rerank)、LLM 归纳生成。其核心在于能否将内容检索得又快又准。 RAG 的优势在于: 大语言模型技术存在输出结果不可预测、知识有截止日期、无法满足实际业务需求等问题,而 RAG 可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解 LLM 如何生成最终的结果。 RAG 可以和微调结合使用,两者并不冲突。微调适用于模型需要复制特定的结构、样式或格式时,RAG 适用于模型需要回答特定的询问或解决特定的信息检索任务。但 RAG 不适合教模型来理解广泛的领域或学习新的语言、格式或样式。 同时,通用的基础大模型无法满足实际业务需求的原因包括: 知识的局限性:模型自身的知识源于训练数据,对于实时性、非公开或离线的数据无法获取。 幻觉问题:大模型基于数学概率的文字预测,存在提供虚假、过时、通用或低可信度信息的情况。 数据安全性:企业重视数据安全,不愿承担数据泄露风险将私域数据上传第三方平台训练。
2025-03-08
什么是AGI,如何在做企业级程序开发的工作中使用提高自己的工作效率
AGI 即通用人工智能(Artificial General Intelligence),指的是具备像人类一样广泛的认知能力和学习能力,可以执行多种复杂任务的人工智能。 在企业级程序开发工作中提高效率,可以考虑以下几点: 1. 利用自动化工具和脚本:例如自动化测试工具、代码生成工具等,减少重复性工作。 2. 采用敏捷开发方法:如 Scrum 或 Kanban,提高团队协作和项目管理效率。 3. 学习和应用新的编程语言和框架:选择适合项目需求的高效技术。 4. 优化代码结构和算法:提高程序的性能和运行效率。 5. 建立良好的代码规范和文档:便于团队成员理解和维护代码。 6. 利用云计算资源:根据需求灵活扩展计算和存储能力。 7. 持续学习和交流:参加技术社区和培训,了解行业最新动态和最佳实践。
2025-02-11
企业级应用集成AI大模型架构白皮书
以下是关于企业级应用集成 AI 大模型架构的相关内容: 从整体分层的角度来看,目前大模型整体架构可以分为以下几层: 1. 基础层:为大模型提供硬件支撑,数据支持等,例如 A100、数据服务器等等。 2. 数据层:这里的数据层指的不是用于基层模型训练的数据基集,而是企业根据自己的特性,维护的垂域数据。分为静态的知识库,和动态的三方数据集。 3. 模型层:包括 LLm 或多模态模型。LLm 即 largelanguagemodel 大语言模型,例如 GPT,一般使用 transformer 算法来实现。多模态模型即市面上的文生图、图生图等的模型,训练所用的数据与 llm 不同,用的是图文或声音等多模态的数据集。 4. 平台层:模型与应用间的平台部分,比如大模型的评测体系,或者 langchain 平台等,提供模型与应用间的组成部分。 5. 表现层:也就是应用层,用户实际看到的地方。 此外,以下报告也涉及相关内容: 1. 量子位智库发布的《》概述了大模型技术在多个行业中的应用和发展趋势。强调大模型在编程、教育、医疗等领域的重要性,并预测其将推动生产力和创新服务的增长。大模型业务模式涵盖应用开发、模型 API 和模型服务,其中模型服务和 API 是核心。报告还讨论了大模型在不同地域和行业的落地情况,以及企业在大模型技术投资方面的需求。 2. 亿欧智库发布的《》聚焦于企业中人工智能大模型的应用和落地情况。报告涵盖了 AI 大模型在企业中的应用现状、发展趋势以及面临的挑战。它详细分析了 AI 技术如何推动企业创新、提高效率和降低成本,并探讨了不同行业如何利用 AI 大模型实现数字化转型。此外,白皮书还提供了关于如何克服实施过程中的障碍和最大化 AI 大模型价值的见解。 对于大模型 API,与大模型对话产品的提示词不同。对于大模型 API,需要利用插件预先获取的网页内容变量、提示词和 API 请求参数,拼搭出完整的 API 提示请求,精确引导 API 返回想要的生成结果。根据 BigModel 官网给出的请求示例,可以看到需要在请求中传递 Model 类型、系统提示词、用户提示词、top_p、temperature 等关键参数。可以构建相应的 API 请求内容,包括设定系统提示词定义基础任务、设定用户提示词提供具体任务数据并要求大模型按 JSON 格式返回生成结果等。如果缺少参数设定的经验,也可以先询问 AI 文本总结类的模型 API 请求,temperature 设定多少合适,再逐步调试效果即可。
2025-02-06
企业级AI的现状如何了?
目前企业级 AI 的现状呈现出以下特点: 1. 应用方面:更多迁移到具体业务场景,企业重点放在自主构建应用程序上,如客户支持和内部聊天机器人等,同时也在尝试更新颖的应用,如编写消费品配方、缩小分子发现范围和进行销售推荐。 2. 资源配置和态度:企业对生成式 AI 的资源配置和态度在过去 6 个月发生显著变化,预算几乎增加两倍,将更多应用部署在较小的开源模型上,并将更多业务从早期实验转移到生产环境中。 3. 市场机会:生成式人工智能在 2023 年席卷消费市场,2024 年企业领域的收入机会预计数倍于消费市场。 4. 创新与挑战:基础模型的出现使企业构建自己的 AI 应用程序更易,但“GPT wrappers(GPT 套壳)”存在局限性。目前尚不清楚当更多面向企业的 AI 应用上市时情况是否会改变。那些能在“LLM+UI”公式之外创新,并帮助企业更好利用专有数据的应用将表现出色。 5. 赋能企业:许多公司正将 AI 融入工作流程以快速达成 KPI、扩张规模和降低成本。应用公司在 AI 50 强榜单中占据主导地位。不远的将来,有望看到 UX 和 UI 围绕 AI 的功能进行重新设计。
2025-01-11
万字长文带你使用Coze打造企业级 万字长文带你使用Coze打造企业级
以下是一些关于使用 Coze 打造企业级的相关资源: 基础教程: 大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库(https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb ) 大聪明:保姆级教程:Coze 打工你躺平(https://waytoagi.feishu.cn/wiki/PQoUwXwpvi2ex7kJOrIcnQTCnYb ) 安仔:Coze 全方位入门剖析免费打造自己的 AI Agent(https://waytoagi.feishu.cn/wiki/SaCFwcw9xi2qcrkmSxscxTxLnxb ) Coze“图像流”抢先体验(https://waytoagi.feishu.cn/wiki/AHs2whOS2izNJakGA1NcD5BEnuf ) YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏(https://waytoagi.feishu.cn/wiki/CTajwJnyZizxlJk8a4AcJYywnfe ) 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档(https://waytoagi.feishu.cn/wiki/ExHMwCDZ7i6NA7knCWucFvFvnvJ ) 知识库相关: 官方文档:创建并使用知识库(https://www.coze.cn/docs/guides/use_knowledge ) 官方文档:知识库最佳实践(https://www.coze.cn/docs/guides/product_knowledge_bot ) 用 Coze 做一个基于知识库的 QA bot,TA 熟读了我所有的文章(https://zhuanlan.zhihu.com/p/699276883 ) 手把手教你如何用扣子(COZE)打造一个企业级的知识库机器人(https://zhuanlan.zhihu.com/p/695935995 ) Coze 汽车售后服务知识库 Bot 拆解(https://waytoagi.feishu.cn/wiki/N4wBwPY1oifcNJkZsyHc6McdnYg?renamingWikiNode=true )
2024-12-24
企业级别ai模型使用敏感词场景设计
很抱歉,目前知识库中没有关于企业级别 AI 模型使用敏感词场景设计的相关内容。但一般来说,在进行企业级别 AI 模型使用敏感词场景设计时,需要考虑以下几个方面: 1. 明确敏感词的定义和范围:根据企业的业务特点、法律法规要求以及道德规范,确定哪些词汇被视为敏感词。 2. 数据采集和预处理:在收集数据用于训练模型时,对包含敏感词的数据进行特殊处理或标记。 3. 模型训练中的考虑:调整模型的参数和算法,以降低对敏感词的过度依赖或错误理解。 4. 实时监测和更新:随着业务和社会环境的变化,及时更新敏感词列表,并对模型进行相应的调整和优化。 5. 人工审核与干预:对于模型输出中涉及敏感词的内容,设置人工审核环节,确保准确性和合规性。 希望以上思路能对您有所帮助,如果您需要更详细准确的设计方案,建议咨询专业的 AI 技术团队或相关专家。
2024-09-10
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
额,我想问下关于数字人相关的解决方案
以下是关于数字人的相关解决方案: 摊位信息方面:包括 AI 肖像及写真、AIphone 创意手机壳、AI 照片转动漫、AI 如意写真、AI 数字人短视频和直播、爱原物 AI 设计、AI 摄影写真、量化 AI 助手应用、AI 玄学+珠宝、阿里无影 AI 云电脑和建筑设计、现场算 AI 塔罗牌等。 算法驱动的数字人:开源代码仓库有 ASR 语音识别(如 openai 的 whisper、wenet、speech_recognition)、AI Agent(大模型有 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可用 LangChain 模块自定义)、TTS(如微软的 edgetts、VITS、sovitssvc)。人物建模模型可通过手动建模或 AIGC 方式生成人物动态效果。但简单构建方式存在如生成指定人物声音、TTS 音频精确驱动数字人口型及动作、数字人使用知识库做出专业回答等问题。 剪映数字人“个性化”方案:剪映作为字节跳动旗下产品,在抖音平台广泛应用,海外版 CapCut 成绩优异。其具有声音克隆和公模数字人能力,搭配 facefusion 换脸技术可实现零成本口播数字人。制作流程为打开剪映,添加文本到文字轨道并修改,点击朗读进行声音克隆,选择数字人形象并换上克隆音色,最后一键智能生成字幕并调整文字样式校准。剪映下载地址: 。
2025-03-19
我想建立一个知识库,自动生成解决方案
以下是关于建立知识库并自动生成解决方案的相关信息: smartBot 的应用场景: 1. 辅助使用者对某个行业/领域/问题进行深度解读和分析,并建立系统性的认知过程。 2. 根据预设流程,自动化形成对某个专业方向/领域/行业的系统化知识图谱。 基于知识图谱的问答系统: 1. 结合知识图谱中的丰富信息,能够提供精确且富有洞察力的答案,无论问题是关于具体事实还是复杂关系。 2. 以 Bilibili 知识区为核心,将分散的知识点整合成语义网络,涵盖广泛主题领域,揭示不同概念间潜在关系。 3. 对 Bilibili 知识区重点视频字幕进行数据清洗和分词处理,确保数据准确性和一致性。 4. 利用 NLP 技术解析和优化用户查询,自动补充或纠正模糊查询词,提高查询准确性和覆盖面。 5. 采用先进深度学习技术,对用户查询进行深入语义理解和上下文分析,提供更精准搜索结果。 知识库构建与业务完整性: 1. 从文档切片、向量化到数据入库,构建完整的知识库。 2. 结合检索模块和生成模块,提供从检索到生成的完整解决方案。 用 Coze 免费打造微信 AI 机器人的步骤: 1. 设计方面:确定功能范围。 2. 搭建步骤: 开始节点和结束节点由 coze 自动生成。 开始节点配置:输入变量名写“Question”,描述写“用户输入的问题”,变量类型选“String”。 知识库配置:将开始节点和知识库左侧节点连接,引用开始节点的变量“Question”,添加创建好的知识库,并将知识库右侧节点与结束节点左侧连接。 结束节点配置:用于输出 AI 机器人的最终结果,回答格式设置为“您的问题:{{question}} 问题的答案:{{answer}}”,定义“question”引用“开始节点的 Question”,“answer”引用“知识库节点的输出 output”,选择使用设定内容直接回答。 试运行测试:点击右上角“试运行”,输入问题后点击“运行”,查看工作流每一步的详细输入和输出。
2025-03-16
具身智能软硬件解决方案。
具身智能的软硬件解决方案包括以下方面: 算法层: 技术层级: 任务层级:可细分为任务级、技能级、动作级、基元级、伺服级,通常关注前四个级别。 解决方案层级:通常可拆分为大脑+小脑两个层级。大脑负责人机交互与规划决策,小脑负责运动控制及将语义信息理解转化为动作。 大脑侧:负责人机交互,能通过视觉在语义层面理解场景、任务等并进行决策。大模型的发展对大脑有促进作用,大脑的长期发展高度依赖多模态大模型。如 2024 年 3 月,有鹿机器人发布了基于 LPLM10B 的软硬件结合产品 Master 2000。 整机硬件方案:基于下游场景需求设计运动、感知、计算和通信硬件方案。具身智能厂商倾向于软硬件全流程自主控制,自己制作机体,原因包括机体和数据模式未统一,训练数据与机体构造紧密联系,以及考虑二级供应商是否成熟和整机利润。部分强大厂商如 Tesla 具备制作更底层电机、传感器的能力,软硬件一体化制造能带来更高利润。 智能类型:包括认知智能和物理智能。认知智能涉及思考、规划和决策能力,完全由大脑驱动;物理智能指机器人的感知和与环境的运动互动能力,感知环节由大脑侧算法实现,行动环节由小脑侧算法和硬件配合完成。 发展趋势: 人形化:外形向人类细部特征靠拢,功能具备真实人类运动、灵活和环境判断能力。 成本下降显著:核心零部件成本降低,人形机器人成本及售价呈下降趋势。 构成元素:包括大脑(意图理解、环境感知、规划决策)、小脑(运动控制、语义信息理解转化为动作)、整机硬件方案。
2025-03-07
使用豆包即梦和通义app绘制海报封面都是出现文字不对的情况,有哪些改进的或者是更好的解决方案
以下是针对使用豆包即梦和通义 app 绘制海报封面出现文字不对情况的改进和解决方案: 使用豆包即梦: 1. 为其他城市定制艺术字海报:可以使用豆包来生成个性化设计。豆包会根据城市特色和地标调整提示词,创造符合城市风格的艺术作品。 打开豆包网站 https://www.doubao.com/chat 。 输入对应内容获得城市的 AI 绘画提示词。 2. 优化海报细节: 利用即梦中的消除笔工具修正细节错误。例如,若生成图片中有元素不协调或小细节(如文字笔画、图案)错误,可用消除笔去除不需要的部分。 多抽卡获取更理想设计。AI 绘画核心在于多抽卡,若首次生成效果不佳,可多次尝试或调整提示词细节抽卡,直至找到满意设计。 希望这些方案能帮助您解决问题,创作出满意的海报封面。
2025-03-07
我想要获得短视频脚本创作到视频剪辑的解决方案
以下是从短视频脚本创作到视频剪辑的全面解决方案: 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户提供文本描述,Pictory 将帮助生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:AI 视频创作工具,能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 案例参考: 桂大羊提供了保姆级教程,基于大语言模型和绘图模型,探索了文生图到图生视频的创作实践。例如,在一带一路背景下丝绸之路这个角度的创作中,选择了大语言模型 chatgpt、kimi 进行剧本分镜设定,文生图 midjourney 生成视觉画面,图生视频选择即梦 dreamina 制作动态画面,suno 音乐编曲,ondoku 主角台词配音,视频剪辑使用剪映,部分音效在网上无版权下载或使用剪映自带音效。同时确立了时长(1 分钟左右的 AI 生成画面,加上闭幕不超过 2 分钟)和风格(大致定义为中国风)。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-04
deepseek经常服务器繁忙的解决方案?
以下是一些解决 DeepSeek 服务器繁忙的方案: 1. 尝试以下搜索网站: 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/ 硅基流动:https://siliconflow.cn/zhcn/ 字节跳动火山擎:https://console.partner.volcengine.com/auth/login?redirectURI=%2Fpartner%2F 百度云千帆:https://login.bce.baidu.com/ 英伟达:https://build.nvidia.com/deepseekai/deepseekr1 Groq:https://groq.com/ Chutes:https://chutes.ai/app 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabscom/6 Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 2. 可以通过以下步骤使用网页聊天解决: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 还可以使用以下网站(部分需要魔法,不做教学支持): 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/(bot.n.cn) 硅基流动:https://cloud.siliconflow.cn/i/RjJgQqae AskManyAI:https://dazi.co/login?i=7db38e6e 字节跳动火山引擎:https://console.volcengine.com/ark/region:ark+cnbeijing/experience 百度云千帆:https://console.bce.baidu.com/qian3an/modelcenter/model/buildIn/list 英伟达 NIM Groq:https://groq.com/ Fireworks:https://fireworks.ai/models/fireworks/deepseekr1 Chutes:https://chutes.ai/app/chute/ Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabs.com/ Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1
2025-02-20
如何本地部署大模型,如何选择是否使用云服务商
以下是关于本地部署大模型以及选择是否使用云服务商的相关内容: 本地部署大模型的主要步骤: 1. 选择合适的部署方式,包括本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署等,根据自身的资源、安全和性能需求进行选择。 2. 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 3. 选择合适的预训练模型作为基础,可以使用开源的预训练模型如 BERT、GPT 等,也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,优化模型结构和训练过程以提高性能。 5. 部署和调试模型,将训练好的模型部署到生产环境,对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 以 SDXL 为例的本地部署步骤: 1. SDXL 的大模型分为两个部分,base+refiner 是必须下载的,base 是基础模型,用于文生图操作;refiner 是精炼模型,用于对生成的模型进行细化,生成细节更丰富的图片。还有一个配套的 VAE 模型,用于调节图片的画面效果和色彩。 2. 想要在 webUI 中使用 SDXL 的大模型,首先要在秋叶启动器中将 webUI 的版本升级到 1.5 以上。 3. 将模型放入对应的文件夹中,base 和 refiner 放在“……\\sdwebuiakiv4.2\\models\\Stablediffusion”路径下;vae 放在“……\\sdwebuiakiv4.2\\models\\VAE”路径下。完成之后,启动 webUI,就可以在模型中看到 SDXL 的模型。 以 LLM 大语言模型为例的本地部署步骤: 1. 下载并安装 Ollama,点击进入根据电脑系统下载 Ollama:https://ollama.com/download ,下载完成后,双击打开,点击“Install”,安装完成后,将下方地址复制进浏览器中。如果出现下方字样,表示安装完成:http://127.0.0.1:11434/ 。 2. 下载 qwen2:0.5b 模型(0.5b 是为了方便测试,下载快,自己设备充足的话,可以下载更大的模型)。如果是 windows 电脑,点击 win+R,输入 cmd,点击回车;如果是 Mac 电脑,按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。复制相关命令行,粘贴进入,点击回车,等待下载完成。 总的来说,部署大模型需要综合考虑多方面因素,包括部署方式、数据准备、模型训练、部署调试以及安全性等。需要根据具体需求选择合适的方法,并注意优化各个环节以提高模型性能和应用效果。
2025-04-14
AI服务器配置
以下是关于 AI 服务器配置的相关内容: 对于 Coze AI 机器人对接微信的服务器配置: 1. 如果按照上一篇教程操作,此次配置只需修改容器编排模板。最新的容器编排模板如下,同时提供无描述性的参考配置方便新手直接参考使用。 2. 若之前没有容器编排模板,新建一个即可,新建和修改逻辑类似。 3. 更新后的编排模板,若之前创建过相似机器人容器编排服务,建议先删除以防冲突,删除步骤如下。 4. 基于新的编排模板创建新的容器编排,然后启动服务。 5. 服务启动成功后,进入 COW 服务扫码绑定微信机器人,具体步骤参考上一篇入门教程。 对于视频相关的 AI 服务器配置: 1. 购买服务器:直接点击去购买:https://buy.cloud.tencent.com/lighthouse?blueprintType=APP_OS&blueprintOfficialId=lhbpr8j2ftq0&regionId=8&zone=apbeijing3&bundleId=bundle_rs_mc_med1_02&loginSet=AUTO&from=lhconsole ,并根据以下配置购买。 2. 购买并付款完成后,回到服务器“控制台”。 3. 点击服务器卡片空白处添加防火墙,添加 8887、8080 端口。 4. 点击右上角“登录”按钮,扫码验证后在命令行窗口中操作,注意复制粘贴代码的方式和命令执行完毕的标志。 5. 在命令行中依次输入相关命令。 6. 保存并打开外网面板地址,输入账号和密码。
2025-04-10
如何利用AIGC技术给企业提供咨询服务
利用 AIGC 技术为企业提供咨询服务可以从以下几个方面入手: 1. 招募具备实战经验的 AI 讲师与咨询专家:工信部大数据产业人才基地依托丰富的企业渠道资源,计划为传统行业客户提供 AI 技术培训、场景化咨询与解决方案落地服务,并面向社区招募相关人才。 2. 开展公开课:针对 B 端渠道持续展开公益科普,形式免费,部分渠道有一定经费,内容为企业端的 AI 应用场景案例和 AI 通识类的科普分享,目的是建立与企业渠道之间的信任,构建收费培训/咨询的转化通道。 3. 组织线下培训:通过培训转化或直接招生,开设两天一夜、三天两夜的培训班,一般 50 人以上开班,建议 100 人。 4. 提供咨询陪跑服务:包括 AI 营销能力搭建,企业客服机器人搭建、企业端内容分析智能体搭建、企业运营数据大盘搭建、无人直播/数字人直播间搭建等。 此外,一些成功的案例和产品也可供参考: 1. 为阿里妈妈、阿里国际、搜狗、途虎、太平洋保险、哔哩哔哩、滴滴、百度金融、浦发银行、花旗银行、振华重工、中国电信、中国移动、中兴通讯、SMG 等企业提供设计咨询与训练。 2. Runway 上线文字生成语音功能,英文效果好,中文存在外国人口音问题,功能可选择语音模型多。 3. Delphi 可以将个人的所有视频、播客、PDF、博客文章等信息训练为一个分身,并能用分身对外提供咨询服务,支持文字、语音甚至视频沟通,还支持对话内容的数据分析以优化交流。 4. Osum 是一款人工智能市场研究工具,可通过按下按钮获取产品或企业的详细研究、SWOT 分析、买家人物画像、增长机会等信息,还提供销售前景分析器,并能在几秒钟内为任何商务或产品提供完整 SWOT 分析。
2025-04-01
mcp服务是什么
MCP(模型上下文协议)是一项创新标准,由 Anthropic 于 2024 年 11 月推出并开源。它是为 AI 模型统一连接数据与工具的标准接口,旨在让大语言模型能够无缝连接至第三方的数据源。 MCP 的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 MCP 与传统 API 的关键区别在于: 单一协议:MCP 像一个统一接口,只要一次整合,就能连接多个服务。 动态发现:AI 模型能自动识别并使用可用的工具,不用提前写死每个接口。 双向通信:MCP 支持类似 WebSockets 的实时双向通信,模型不仅能查询数据,还能主动触发操作。 传统 API 更适合的场景包括: 需要细粒度控制、功能严格限制。 更偏好紧耦合以提升性能。 希望最大化交互的可预测性。 快速集成 MCP 的步骤: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 通过 MCP,我们可以让 AI 使用各种强大工具,比如查询实时天气、联网搜索最新信息、调用私人数据库等。
2025-03-27
我公司想部署一个deepseek-R1,用云服务器请问大概需要多少钱?
部署 DeepSeekR1 模型使用云服务器的价格因云计算厂商而异: 华为昇腾社区:部署 DeepSeekR1 模型用 BF16 权重进行推理至少需要 4 台 Atlas 800I A2(864G)服务器,用 W8A8 量化权重进行推理则至少需要 2 台 Atlas 800I A2。服务器调用 Docker 下载部署权重资源,非 API 调用模式。 阿里云(人工智能平台 PAI):以 R1 为例,所需计算资源价格 316.25/小时。模型部署成在线服务,在人工智能平台 PAI 下的模型部署下的模型在线服务 EAS。 阿里云(阿里云百炼):免费额度:10000000/10000000,通过 API 调用。 腾讯云(自建服务器):多机分布式部署,节点数量:2 个,单节点配置:HCCPNV6 机型,可在线体验(需开通 T1 平台服务)。 腾讯云(调用 API):API 调用 DeepSeek 系列模型限时免费。即日起至北京时间 2025 年 2 月 25 日 23:59:59,所有腾讯云用户均可享受 DeepSeekV3、DeepSeekR1 模型限时免费服务,单账号限制接口并发上限为 5。在此之后,模型价格将恢复至原价。 京东云:“deepseekr1:1.5b、“deepseekr1:7b”、“deepseekr1:32b”,1.89/小时起;服务器部署的方式。 gitee ai:R1 价格 0.1 元/次,基于沐曦曦云 GPU 及曦源一号国产替代算力集群,有在线体验。 需要注意的是,价格可能会有所变动,具体以各云计算厂商的最新公布为准。
2025-03-25
可以为我找到在线更换图片颜色服务的AI网站吗
以下是一些可以在线更换图片颜色服务的 AI 网站相关信息: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下将图片放大到足够的倍数。 在最近新上线的 controlnet 模型中,Recolor 新模型可将黑白图片重新上色。 对于人物照片还原,可选择 realisian 的写实大模型,通过提示词描述颜色和对应内容,如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景等。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 您可以通过以下网址获取更详细内容:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2025-03-25