Navigate to WaytoAGI Wiki →
Home/All Questions
储运与AI
AI 在储运领域有以下应用: 自动驾驶:可用于开发自动驾驶汽车,提高运输安全性和效率。 交通管理:优化交通信号灯和交通流量,缓解交通拥堵。 物流和配送:优化物流路线和配送计划,降低运输成本。 无人机送货:将货物快速送达偏远地区。 智能物流方面: 自动识别技术:如条码识别、射频识别(RFID)等,能自动获取物体相关信息,提高数据采集准确性和效率。应用场景包括仓储管理中的自动化仓库、智能分拣系统等。 数据挖掘技术:从大量数据中挖掘知识和规则,为物流决策提供支持。应用于运输调度中的智能路径规划、实时交通状况监测等。 人工智能技术:包括神经网络决策和优化。 GIS 技术:实现订单信息、网点物流运作的透明度和效率。 智能物流利用条形码、射频识别技术(RFID)、传感器、全球定位系统(GPS)等物联网技术,广泛应用于物流业的运输、仓储、配送、包装、装卸等基本活动环节,目的是实现货物运输自动化运作和高效率优化管理,提高服务水平,降低成本,减少资源消耗。在实施过程中强调物流过程数据智慧化、网络协同化和决策智慧化,功能上要实现 6 个“正确”,关键技术包括物品识别、地点跟踪、物品溯源、物品监控、实时响应等。随着技术进步和社会需求变化,智能物流将持续发展,未来可能更注重绿色低碳、个性化服务等方面。物联网为物流业将传统物流技术与智能化系统运作管理相结合提供了良好平台,能更好更快地实现智能物流的信息化、智能化、自动化、透明化、系统的运作模式。
2025-03-28
如何建立个人知识库
建立个人知识库可以通过以下方式: 1. 利用 GPT 打造个人知识库: 使用 embeddings:将文本转换成向量,节省空间,可理解为索引。把大文本拆分成小文本块并转换为 embeddings 向量,保存在向量储存库中。当用户提问时,将问题转换为向量并与库中向量比对,提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API。 理解 embeddings:embeddings 是浮点数字的向量,向量间距离衡量关联性,小距离表示高关联度。 2. 本地部署大模型以及搭建个人知识库: 了解 RAG:利用大模型能力搭建知识库是 RAG 技术的应用。在大模型训练数据截止后,通过检索外部数据并在生成步骤中传递给 LLM。RAG 应用包括文档加载、文本分割、存储、检索和输出 5 个过程。 文本加载器:将用户提供的文本加载到内存中,便于后续处理。
2025-03-28
gpt4o图像生成
GPT4o 是 OpenAI 推出的具有强大图像生成能力的多模态模型,能够实现精确、准确、照片级真实感输出。其核心功能包括生成美观且实用的图像,如白板演示、科学实验图解等。亮点功能有精确的文本渲染,能在图像中准确生成文字,如街道标志、菜单、邀请函等;支持多样化场景生成,从照片级真实感到漫画风格均可;具有上下文感知能力,能利用内在知识库和对话上下文生成符合语境的内容。技术上通过联合训练在线图像和文本的分布,学会了图像与语言及图像之间的关系,经过后期训练优化,在视觉流畅性和一致性方面表现出色。实际应用场景包括信息传递、创意设计、教育与演示等。但也存在某些场景或细节的限制。安全性方面,OpenAI 强调了保护。目前该功能已集成到 ChatGPT 中,用户可直接体验。 此外,在 3 月 26 日的 AI 资讯汇总中,OpenAI 推出了 GPT4o 图像生成能力。昨晚 Open AI 更新 GPT4o 图像生成功能后,其真正强大之处在于几乎可以通过自然语言对话完成复杂的 SD 图像生成工作流的所有玩法,如重新打光、扩图、换脸、融脸、风格化、风格迁移、换装、换发型等。
2025-03-28
如何创建一个属于自己的智能体,需要怎么投喂
创建属于自己的智能体并进行投喂,主要包括以下步骤: 1. 工作流调试完成后,将其加入到智能体中。可以选择工作流绑定卡片数据,智能体通过卡片回复。绑定卡片数据可自行研究,如有疑问可留言。 2. 发布智能体: 选择需要的发布渠道,重点如飞书多维表格。 记得智能体提示词的 4 个变量,发布时会自动出现。 填写上架信息(为快速审核,选择仅自己可用),确认发布并等待审核。审核通过后,即可在多维表格中使用。 3. 创建飞书多维表格,添加相关字段。配置相关内容,选择“自动更新”,输入 4 个字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 4. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 5. 点击多维表格右上角的“自动化”,创建想要的自动化流程。 此外,创建智能体还包括以下具体操作: 1. 使用单 Agent 对话流模式创建智能体。 2. 编排对话流,创建新的对话流并与智能体关联。 3. 进行测试,找到一篇小红书笔记,试运行对话流,在对话窗口输入地址,看到数据则成功。回到智能体编排页面同样测试,确保对话流执行成功。 4. 发布智能体,选择多维表格,进行配置。包括输出类型选文本、输入类型选字段选择器,完善上架信息,选择发布范围等。 如果没有创建智能体的灵感,可以查看相关案例集或通过与特定工具进行对话获取。通过扣子助手可快速进行创建,参考相应的 Prompt 进行操作。最后发布作品。
2025-03-28
真人头像改为漫画风格
要将真人头像改为漫画风格,可以参考以下方法: 1. 使用 SDXL Prompt Styler 插件: 转绘成折纸风时,最好不要加入线稿边缘(canny)的 controlnet 控制,或把 canny 的控制强度(strength)调到较小,因为手绘线条和折纸风格互斥。 若转成漫画风格并想较好保留人物外轮廓,加入 canny 控制能更好还原人物原本造型。 有时插件内置预设的提示词组合不一定能达到想要的效果,可在 prompt 中添加更多相关风格的关键词,如印象派风格可添加 impressionism、monet、oil painting 等。 该工作流结合 Vid2Vid Style Transfer with IPA&Hotshot XL 工作流,可较好实现视频不同风格的稳定转绘。 2. 选择复杂提示词: 如 Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 。 若觉得提示词简单,可选择更复杂的。 可根据需求调整提示词,如照片风格不好可更换照片重新生成;若觉得 Disney 风格太过卡通,可把提示词中的 Disney 换成 Pixar;若为女孩,可把 boy 换成 girl。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。 3. 使用 Coze“图像流”进行智能换脸: 该节点需要 2 个图,一个是脸图,一个是底稿图。第一个 reference 指的是参考的脸,即会换上去的脸;第二个 template 指的是背景图,即脸会被换掉的图;skin 指的是美肤。 美肤拉到 1 可能导致脸部磨皮涂抹痕迹严重。 在没有很明显的人脸或纯动漫风格时可能会报错,在文生图的提示词里加上写实风格能提高成功率。也可自己放进两张真实的图来替换脸,添加方式在开始框加上一个输入参数,类型为 image 即可。
2025-03-28
大模型时代组织和个人面临的挑战和应对策略是什么?
在大模型时代,组织和个人面临着以下挑战和应对策略: 挑战: 1. 算力投资风险:大规模算力投资使公司转变为重资产模式,可能影响公司估值和投资人收益。获取高性能算力成本高昂,包括 GPU 价格及后续部署、运营、调试和使用成本。 2. 估值泡沫风险:创业公司为抬高估值规避算力风险,可能成为突破的绊脚石,类似荷兰郁金香泡沫,当风口过去,真实收入将成为关键指标。 应对策略: 1. 对于创业公司: 挖掘新的价值点,如探索大模型在不同领域的应用,或开发中间层服务,如训练、数据处理、算力服务等。 避免盲目追逐原创大模型,根据自身情况选择合适的发展路径,如套壳开源大模型或拼装大模型时注重创新和突破。 2. 对于投资人: 保持独立判断,不人云亦云,吸取以往经验教训,专注于更有创意和机会的公司或项目。
2025-03-28
怎么让deepseek给我写一篇论文
以下是关于如何让 DeepSeek 为您写一篇论文的相关信息: 1. 引用参考文献:可以上传您已写好的文章让 DeepSeek 参考,常见的参考模式是上传,也可以将觉得 OK 的输出复制或手动修改作为自由节点贴在当前对话流中。 2. 利用自由节点:自由节点功能可以让您在交流中随时参考之前的内容,不会打断思考,有助于集中精力。 3. 比较模式:可以同时使用多个大模型为您写同一篇内容。 4. 控制文风与字数:在提示词中描述特定小说家的文风特征来控制创作风格,用 O1 模型对创作的字数进行控制,或通过多轮对话让 DeepSeek 增删改查来调整字数。 5. 写作思路探讨:写理性文章时,可先与 DeepSeek 讨论思路。 6. 文章分析与点评:可以让 DeepSeek 从写作角度、读者角度分析文章,指出缺点和不足并给出改善和提升的空间,还能对作者进行心理侧写。比如找出最喜欢的文章投喂给 DeepSeek R1,让其进行多次分析。 需要注意的是,DeepSeek 在写文方面全面领先,但长文可能会太发散,文风用力过猛,可能导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案可能雷同。
2025-03-28
如何用ai创作一部小说,路径是怎样的,需要用到哪些工具
用 AI 创作一部小说通常包括以下路径和可能用到的工具: 路径: 1. 小说内容构思:明确小说的主题、情节、角色等核心要素。 2. 角色与场景设定:细致描绘角色的特点和故事发生的场景。 3. 情节推进与发展:合理安排故事的起承转合,增加冲突和悬念。 4. 语言表达与修饰:使文字生动、准确,富有感染力。 工具: 1. 文本生成工具:如 ChatGPT 等,可辅助生成小说的框架、情节、对话等内容。 2. 图像生成工具:如 Stable Diffusion 或 Midjourney,用于生成角色和场景的视觉描述,帮助激发创作灵感。 如果要将小说制作成视频,还需要以下步骤和工具: 步骤: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)提取关键场景、角色和情节。 2. 生成角色与场景描述:利用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:借助 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整。 9. 输出与分享:完成编辑后,输出最终视频,并在所需平台上分享。 工具及网址: 1. Stable Diffusion:一种 AI 图像生成模型,网址:https://github.com/StabilityAI 2. Midjourney:AI 图像生成工具,网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台,网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能,网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具,网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具,网址:https://www.aihub.cn/tools/video/gushiai/ 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-28
ai画原型图和交互涉及
AI 画原型图和交互涉及以下方面: 在 AI 作图中,趣味性创作需要具备反差、反逻辑、超现实等元素,美感创作要求美术基础不出错且形式与内容结合。例如纹身图创作,需强调人机交互,对图进行二次、多次调整。以魔法少女为例,可通过发散联想写提示词,展示不同详略程度提示词的生图效果,并进行实操。 赛题实操方面,以中式或日式风格的女孩为例,详细讲解描述主体特征的方法,包括服装、发型、妆容等,还提及描述元素、环境的要点。此外,介绍了深图尺寸更新,讲解画面风格控制词,以及写风格与 Lora 可能存在的冲突情况。 Lora 权重及提示词试用中,先探讨人像特写时背景设定,接着尝试写动植物提示词,如蛇、孔雀等,分析生成画面与预期差异。还提及提交图需涵盖的内容,包括展示室内外画风,并展示之前测试 Lora 的图片,讲解做图思路及提交 6 张图的相关要点。 AppAgent 是一种让 AI 模仿人类在手机上操作 APP 的技术,对于涉及原型和 UE 的工作,基于模仿数据的反推可使设计出的产品原型和 UE 交互更优。它是一种 AI 学习模型,由腾讯和德州大学达拉斯分校的研究团开发。主要功能特点包括多模态代理,能够处理和理解多种类型的信息;直观交互,能通过模仿人类直观动作与智能手机交互。
2025-03-28
ai小说
以下是关于 AI 小说的相关内容: 1. Stuart 分享的用 coze 写起点爆款小说《夜无疆》的工作流: 工作流效果:以起点 Top1 的《夜无疆》为题创作小说,虽未达到小说家水平,但至少达到高中生中不错的水平,是从通常的 AI 写作水平到新级别的质的飞跃,其中思路值得学习。 工作流步骤: 用 bing 搜索标题相关内容。 用程序将搜索结果结构化(不熟悉程序可忽略或复制文中代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型写文章。 输出文章内容。 2. AI x 即兴戏剧工作坊: 形式:现场用肢体语言摆出姿势,用 AI 绘画画出,最后表演出一个即兴剧。 使用工具:写短篇小说可用 midreal.ai 以“即兴喜剧”开头,AI 绘画可用 GPT4/悠船/midjourney,Canva 做电影格式模板用于编辑。 3. 全新 AI 整活第六期——DeepSeek 小说家: 要求:以 Deepseek 为工具,反转为主题,在 1000 字短篇小说内挥洒创意。 比赛周期: 开启时间:2025 年 2 月 9 日。 截止时间:2025 年 2 月 16 日晚 8 点。 评选时间:2025 年 2 月 16 日晚 8 点社区直播 AI 评选。 社区共学:时间为 2 月 9 日晚 8 点,地址在通往 AGI 之路视频号解锁 DeepSeek 写小说。 投递传送门:https://pd.qq.com/s/p9z7r8c0?businessType=9 。
2025-03-28