Navigate to WaytoAGI Wiki →
Home/All Questions
ai绘画
AI 绘画具有多方面的特点和影响: 1. 与艺术界的双向影响: 从生成艺术作品到辅助艺术创作,逐渐改变传统艺术面貌,艺术界的反馈也促使其显著进展。 技术进步使 AI 绘画在创作质量和速度上有新突破,为艺术家提供新工具和可能性,推动传统艺术数字化和普及化。 引发一系列讨论和争议,如人们对 AI 创作艺术品的接受程度、艺术家的复杂态度、对从业者职业安全的焦虑及“侵权”嫌疑等,反映新技术对行业生态和现有法律伦理框架的挑战。 为艺术创作提供新可能,帮助艺术家探索新表达方式、提高制作效率、降低成本,促进艺术与观众互动,提供个性化体验。 2. 关键词指南: 公式包括主题、环境、气氛、灯光、色彩、构图、风格参考等方面。 比如,可将喜欢的艺术家、灯光、颜色等风格放入相应的关键词里。 3. 艺术与科技的融合: 呈现前所未有的奇妙景象,将艺术与先进技术完美结合,引领艺术界走向未来。 利用机器学习和深度学习等技术模拟人类创作过程,生成令人惊叹的作品,为艺术家提供新工具和观众带来新体验。 打破传统手工绘画技巧的局限,开拓全新创作领域,为缺乏绘画技巧的人提供参与机会,使艺术更民主化和包容。
2025-03-25
数据采集 存储规范
以下是关于数据采集和存储的规范: 风险评估:GDPR 规定数据控制者或处理者所进行的数据处理应当符合初始收集时的目的。企业在核查目标业务领域的数据使用和处理环节时,要比较数据使用和处理的目的、范围、主体等内容相对于初始收集时是否有变化。若有变化,需在使用和处理数据前对数据主体重新告知并取得合法有效同意。 遵循准确、必要、及时原则:数据处理应遵循准确、必要、及时的原则,并以相关、必要为限度。企业在核查时,要判断数据处理与收集目的的相关性、发生时间以及是否为实现收集目的所必要。 确保数据主体限制数据处理的权利:GDPR 明确数据主体有权限制数据控制者或处理者对其数据的处理活动。企业要核查是否建立特定机制或提供途径,确保数据主体在特定情形(如质疑数据准确性、数据处理非法且反对删除数据等)下可限制处理。 确保数据主体反对特定数据处理的权利:GDPR 明确数据主体有权反对数据控制者或处理者的特定数据处理活动。企业要核查是否建立特定机制或提供途径,确保数据主体在特定情形(如直接营销、数据画像等)下有权反对特定数据处理。 数据的存储:需遵循相关法规和标准进行规范存储。
2025-03-25
AI 硬件与软件市场趋势
以下是关于 AI 硬件与软件市场趋势的相关信息: 定见咨询发布的《人工智能行业 AI 硬件全景洞察报告:下一波 AI 创新机遇在物理空间》指出,AI 硬件将经历传统硬件+AI、AI 驱动型硬件到 AI 作为基础设施的三个阶段,深圳凭借产业集群优势成为全球 AI 硬件创新的热点地区。AI 推动软硬件协同创新,硬件产品的高价值区向软件偏移,软件端价值交付从订阅模式转向服务付费。报告还分析了 AI 硬件的分类、智能化简史、市场趋势、竞争格局、细分品类市场情况,以及典型团队的创新路径与策略。 机器之心的进化/理解 AI 驱动的软件 2.0 智能革命方面,在虚拟世界中做模拟,Meta 和 Nvidia 自然不能缺席。佐治亚理工学院的计算机科学家 Dhruv Batra 及 Meta AI 团队创造了名叫 AI 栖息地(AI Habitat)虚拟世界,目标是提高模拟速度。Nvidia 的 Omniverse 平台提供支持的 NVIDIA Isaac Sim 是一款可扩展的机器人模拟器与合成数据生成工具,能提供逼真的虚拟环境和物理引擎,用于开发、测试和管理智能代理。随着参与到这个领域的公司越来越多,数据和训练的需求也会越来越大,势必会有新的适合 EAI 的基础模型诞生。ARK Invest 在他们的 Big Ideas 2022 报告中提到,到 2030 年,硬件和软件的融合可以让人工智能训练的成本以每年 60%的速度下降,AI 硬件和软件公司的市值可以以大约 50%的年化速度扩大,从 2021 年的 2.5 万亿美元剧增到 2030 年的 87 万亿美元。 在 2024 年,人工智能几乎是所有软件公司和终端客户的首要任务。AI 软件公司将有效地有三种起源和结果:运行在现有软件之上的 AI 工具;运行在现有软件之上的 AI 工具,有机会取代现有的软件;成为劳动力的 AI 工具。我们正处于软件吞噬和增强劳动力的最初阶段。
2025-03-25
flowith
Flowith 是致力于打造“终极形态的 AI 创作工具”,探索人和 AI 终极交互形态的产品。 2025AGENT 智能体全球创作大赛正在进行中,截止时间为 3 月 28 日。参赛者可使用包括但不限于 Manus、Flowith Oracle、OpenManus、Coze 等任何 Agent 技术平台。所有参赛作品需包含详细实施过程和成果展示,联合微博、小红书、即刻等多个平台面向全球创作者开放。比赛奖金设置为:第一名 15000 元,第二名 8000 元,第三名 5000 元,第四名、第五名 3000 元,各个赛道第一名 3000 元,同时还有机会获得微博、小红书、即刻等平台的流量支持。学习资料: 。 在 24 年初公测发布时,Flowith 获得大量海内外关注、知名科技媒体主动报道,并获得 Meta、Google、Nvidia、OpenAI 等企业的官方支持与合作,2024 年 8 月正式发布亮相时,夺得 Product Hunt 榜单桂冠。已服务数十万海内外用户,预计 2025 年第二季度用户数将超过百万。 更多信息: 官网:https://try.flowith.io/ 产品网站: 产品文档及详细说明:https://doc.flowith.io/ 官方小红书: X: Product Hunt: 使用指南方面,创建多线程任务流时,首先需选择合适的 AI 模式,一般任务常规模式即可,针对复杂任务有 Oracle(先知)模式。Oracle 模式会根据提示词理解目的,自动拆分子任务,并让用户介入每个任务提供引导或确认产出,类似 AI 驱动的人机共创模式。在起始的提示词中需讲明创作目的、角色、语言风格、读者画像、内容和执行方式。以分析《少数派报告》为例,确定驱动力等任务节点后,可新建对应节点并给出明确提示词展开主线任务。
2025-03-25
大神解读大模型底层
大模型的底层原理主要包括以下几个方面: 1. 生成式:大模型根据已有的输入为基础,不断计算生成下一个字词(token),逐字完成回答。例如,从给定的提示词“how”开始,通过计算推理依次输出“are”“you”等,直到计算出下一个词是“”时结束输出。 2. 预训练:大模型“脑袋”里存储的知识都是预先学习好的,这个预先学习并把对知识的理解存储记忆在“脑袋”里的过程称为预训练。以 GPT3 为例,训练它使用了约 4990 亿 token 的数据集,相当于 86 万本《西游记》。预训练需要花费大量时间和算力资源,且在没有外部帮助的情况下,大模型所知道的知识信息是不完备和滞后的。 3. 转换器模型(Transformer):Transformer 是一种处理文本内容的经典模型架构,虽然其具体细节不清楚不影响使用大模型,但感兴趣的可以通过相关链接进一步了解。 4. 参数规模:依靠概率计算逐字接龙的方法看似难以生成高质量回答,但随着参数规模的增加,如从 GPT1 的 1.5 亿到 GPT3.5 的 1750 亿,实现了量变到质变的突破,“涌现”出惊人的“智能”。这种“涌现”现象在人类的进化和个体学习成长历程中也存在。
2025-03-24
自动化模拟操作
以下是关于自动化模拟操作的相关信息: 智谱的 AutoGLM 目前处于内测阶段,申请入口在智谱清言 APP 中,直接跟 AutoGLM 内测申请小助手对话提交申请即可。智谱将传统表单的提交通过 Tools 的方式做到了对话中,提升了体验。目前该应用只能在安卓设备上使用,因为数据的获取和操作是通过安卓的无障碍权限来控制的。无障碍服务是一套可以模拟操作的系统级别的 API,用户同意应用获取无障碍服务的权限之后就可以模拟操作,来控制用户的手机。无障碍被广泛用于抢红包、自动回复、一键获取权限等应用中。但开启无障碍服务后,可能会引起手机卡顿和存在隐私问题。登录 AutoGLM 后的第一件事是引导开启无障碍权限和悬浮球权限,权限授权正常后可进入首页。 GPT4VAct 是一个多模态 AI 助手,能够像人类一样模拟通过鼠标和键盘进行网页浏览。它可以模拟人类浏览网页时的行为,如点击链接、填写表单、滚动页面等。通过视觉理解技术识别网页上的元素,目的是让 AI 能够自动完成一些需要人工操作的任务,从而提高工作效率。其主要特点包括视觉处理(支持程度有限)、自动标记(使用 JS DOM 自动标记器为 UI 元素分配数字 ID,支持 COCO 数据格式的导出)、鼠标和键盘操作(能够执行点击和输入字符操作),但目前不支持输入特殊键码、滚动、提示用户提供更多信息、记住与任务相关的信息等功能。 AI Agent 要做好的核心是 Tools,如果想让 Agent 变得有用,需要解决 Tools 的问题。像荣耀的手机自动驾驶、智谱的 AutoGLM 采用类似 RPA 的方式模拟人类操作,不用跟应用厂家直接对接。
2025-03-24
有没有帮忙修改简历的提示词
以下是一些可能有助于修改简历的提示词相关内容: 有用户使用 DeepSeek 进行过诸如脑爆活动方案、分析总结复盘内容、生成专业软件使用过程、写小说框架、写论文、写文案、写小红书笔记、写周报、做设计头脑风暴等多种任务,其中也包括修改简历。 在 Prompt 之术中,提到塑造角色时,如果是一个特定的角色,如公司运营专员,需要将相关详细信息注入,包括公司主营业务、目标受众、产品、价值点、工作内容、核心技巧技能等,以明确角色任务。 在 AI 写作打磨文章方面,如使用 Claude 3.5 进行词句润色和文章打磨优化,注意在同一个聊天窗口操作,同时提示词没有标准答案,可按自己的做法修改。
2025-03-24
最近有什么新的AI
以下是近期的一些新的 AI 相关资讯: 3 月 12 日: 【AI 3D】BlenderMCP 能与 Claude AI 沟通,在 Blender 实现快速 3D 建模;MIDI 可实现单幅图像到 3D 场景生成;Move AI 更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】MMStoryAgent 是 AI 多模态故事生成系统。 【AI 视频】VACE 是阿里推出的一体化视频创作和编辑技术;VideoPainter 是腾讯开源的视频编辑技术;Wonder Dynamics 推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】OpenAI 为开发者推出一套 AI Agent 开发套件;R1Omni 是阿里情感识别模型,通过视频识别情感;Luma AI 发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能;Manus 宣布与阿里通义千问团队达成战略合作。 3 月 21 日: 【AI 绘画】网传神秘 Halfmoon 文本转图像模型为 Reve 对比 Midjourney 效果;Topaz Labs 推出 Gigapixel v8.3.0,将任何图像放大 16 倍;FLORA 引入 gemini 2.0 自然语言编辑图像能力。 【AI 视频】pika 超创内测“操控原视频中物体运动”能力;Krea 上线视频模型训练能力,可控制视频风格/动作/物体等。 【AI 3D】SpatialLM 是用于空间理解的大型语言模型。 【AI 模型及应用】OpenAI 发布 2 个语音模型(文本转语音/语音转文本)+1 个演示网站;Claude 支持搜索功能。 10 月 19 日: Perplexity AI 新功能:内部知识搜索,结合公共网页和内部知识库,适用于各类团队;Space 空间,支持团队协作、个性化 AI 以及文件上传与存储功能。 XGO Rider 机器人:桌面双轮足式 AI 机器人,具备自平衡功能,是 STEM 学习工具,支持编程执行任务,提升动手能力。 Mistral 新 AI 模型:Les Ministraux,专为边缘设备设计,优化隐私优先任务,具备 128k 上下文窗口,性能优于 Llama 和 Gemma 模型。
2025-03-24
dify
使用 Dify 构建知识库的具体步骤如下: 1. 准备数据: 收集需要纳入知识库的文本数据,包括文档、表格等格式。 对数据进行清洗、分段等预处理,确保数据质量。 2. 创建数据集: 在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集。 为数据集编写良好的描述,描述清楚数据集包含的内容和特点。 3. 配置索引方式: Dify 提供了三种索引方式供选择:高质量模式、经济模式和 Q&A 分段模式。 根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。 4. 集成至应用: 将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。 在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。 5. 持续优化: 收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。 定期更新知识库,增加新的内容以保持知识库的时效性。 总的来说,Dify 提供了一个可视化的知识库管理工具,使得构建和维护知识库变得相对简单。关键步骤包括数据准备、数据集创建、索引配置,以及将知识库集成到应用中并持续优化。 Dify 是一个开源的大模型应用开发平台,它通过结合后端即服务和 LLMOps 的理念,为用户提供了一个直观的界面来快速构建和部署生产级别的生成式 AI 应用。该平台具备强大的工作流构建工具,支持广泛的模型集成,提供了一个功能丰富的提示词 IDE,以及一个全面的 RAG Pipeline,用于文档处理和检索。此外,Dify 还允许用户定义 Agent 智能体,并通过 LLMOps 功能对应用程序的性能进行持续监控和优化。Dify 提供云服务和本地部署选项,满足不同用户的需求,并且通过其开源特性,确保了对数据的完全控制和快速的产品迭代。Dify 的设计理念注重简单性、克制和快速迭代,旨在帮助用户将 AI 应用的创意快速转化为现实,无论是创业团队构建 MVP、企业集成 LLM 以增强现有应用的能力,还是技术爱好者探索 LLM 的潜力,Dify 都提供了相应的支持和工具。Dify 官方手册:https://docs.dify.ai/v/zhhans 。一般地,如果是个人研究,推荐单独使用 Dify,如果是企业级落地项目推荐使用多种框架结合,效果更好。 Dify 有两种使用方式: 1. 云服务版本。直接在官网 dify.ai 上注册账号使用。 2. 部署社区版。开源,可商用,但是不能作为多租户服务使用。对个人使用完全无限制。 部署前提条件:2 核 4G 云服务器一台=159 元(不懂的也不用懂,不重要)。其实本地也可以,但是本地更折腾,作者自己不喜欢在自己电脑上部署 Web 服务,所以也懒得给大伙分享。【小插曲】今天在腾讯云开新服务器的时候,发现腾讯云居然提供了一键部署,更简单了!而且看了下,挺便宜的,羊毛不薅白不薅。
2025-03-24
mcp介绍
模型上下文协议(MCP)是一种全新的开放协议,专门用于标准化地为大语言模型(LLMs)提供应用场景和数据背景。它就像AI领域的“USBC接口”,能让不同的AI模型与外部工具和数据源轻松连接。 MCP的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换AI模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI系统扩展时,只需连接新的MCP服务器。 与传统API相比,通常AI系统连接外部工具时,需要单独整合多个不同的API,每个API都有独立的代码、文档、认证方式、错误处理和后续维护,极大地增加了开发复杂度。传统API就像每扇门都有一把不同的钥匙,要求开发者为每个服务或数据源单独编写代码和整合方案。 MCP最早由Anthropic公司开发,目的是帮助AI模型(如Claude)更容易地连接工具和数据源。但现在,MCP已经成为一个开放协议,越来越多的企业和开发者开始采用它,逐渐成为AI与工具互动的新标准。 在某些情况下,传统API更适合,比如应用场景需要精准且严格受控的交互方式,包括需要细粒度控制、功能严格限制,更偏好紧耦合以提升性能,希望最大化交互的可预测性。 要开始使用MCP,可按照以下步骤: 1. 定义能力:明确MCP服务器提供的功能。 2. 实现MCP层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与MCP服务器建立安全稳定的连接。 总结来说,MCP是为AI模型统一连接数据与工具的标准接口,让AI与外部数据、工具的连接变得更加标准化和高效,而传统API是每个服务单独连接,开发更复杂。例如,Claude可以通过简单的MCP集成直接连接到GitHub、创建新存储库并创建PR。
2025-03-24