Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

机器决策理论

Answer

机器决策理论: 情感计算与机器决策密切相关。情感对人类具有重要意义,包括生存功能(如遇危险时的生理反应有助于保障进化)、沟通功能(不同情感表达使内涵不同)、决策功能(大脑通过“系统一”主要依赖情感和经验迅速做出判断)、动机功能(激发和维持个体行为)、维系功能(是社会化过程中的纽带)。 情感计算的最终目标是赋予计算机类似于人的情感能力,主要有“识别”“表达”和“决策”三个方向。“识别”可基于文本、语音、视觉、生理等数据进行情感分析,或融合不同模态信息;“表达”让计算机以合适载体表示情感;“决策”利用情感机制进行更好决策。 在人工智能实现方法中,解决让计算机表现得像人类一样的问题有自上而下(模拟人类推理)和自下而上(模拟人脑结构)两种可能的方法,还有新兴的多智能体系统、进化方法或遗传算法等其他可能实现智能的方法。

Content generated by AI large model, please carefully verify (powered by aily)

References

情感计算

[title]情感计算如果机器不能很好地模拟情感,那么人们可能永远也不会觉得机器具有智能。——人工智能之父马文·明斯基情感是保障人类形成社会习性、支撑高级思维的心理要素。如果人类不具有情感,那么维持生存的将只有原始冲动和生存欲望。情感对人类有很重要的意义,主要表现在:生存功能。人类会为了适应环境而做出有利于生存或发展的生理反应,如遇危险时的紧张害怕,受到威胁时的愤怒亢奋,获得食物时的喜悦兴奋。这种生理反应,有助于保障人类的进化。沟通功能。同样的文字语言使用不同的情感来表达,其内涵是完全不同的。相比于语音或文字,增加表情、肢体动作等多种情感表达方式,能够更加充分的表达人类的意图。决策功能。大脑通过快(“系统一”)和慢(“系统二”)两种方式进行决策。而“系统一”主要依赖于情感、经验等迅速做出判断。动机功能。情感能够激发和维持个体的行为。维系功能。情感是人类社会化过程中阶层、族群、家庭等维系的纽带。情感计算就是为了使计算机能够识别、感知、推断和理解人类的情感。最终目标是赋予计算机类似于人的情感能力。

情感计算

情感计算主要有「识别」、「表达」和「决策」三个方向。「识别」让计算机准确识别人类的情感。可以基于从文本、语音、视觉、生理等数据进行情感分析。或者将不同模态之间的信息进行融合分析,使情感计算更准确,具有更高的鲁棒性。文本情感计算是NLP的一大研究热点,主要研究情感状态与文本信息的对应关系。主要由文本情感特征标注、文本情感特征提取和文本情感分类组成。语音情感计算主要研究两个部分:一个是语音所包含的语言情感内容,另一个是声音本省所具有的情感特征。视觉情感计算主要研究两个部分:一个是面部表情的情感识别,另一个是肢体动作的情感识别。生理信号情感计算,最常用的生理特征是脑电、眼动、肌电、皮肤电、心电、呼吸信号等。「表达」让计算机能够把情感以合适的信息载体表示出来;「决策」利用情感机制来进行更好地决策。[heading3]参考资料[content][《2022情感计算白皮书》,之江实验室](https://www.sohu.com/a/617242720_483389)[情感计算:让机器更加智能](https://cloud.tencent.com/developer/article/1519957)

人工智能简介和历史

[title]人工智能简介和历史[heading1]实现人工智能的不同方法如果我们希望让一台计算机表现得像人类一样,需要在计算机内模拟人类的思维方式。因此,我们需要理解是什么造就了人类的“智能”。我们必须理解自己的决策过程是如何进行的,才能够为机器编写智能程序。如果你稍微做一下自我觉察,就会发现有些过程是下意识发生的,例如我们可以不假思索地区分出猫和狗,而有些过程则需要推理。解决这个问题有两种可能的方法:|自上而下的方法(符号推理)|自下而上的方法(神经网络)|<br>|-|-|<br>|自上而下的方法模拟人类通过推理来解决问题的方式。它包括对人类知识的提炼,并用计算机可读的形式来表示,此外还需要开发一种在计算机内部模拟推理的方法。|自下而上的方法模拟人脑的结构,由大量称为神经元的简单单元组成。每个神经元的行为取决于输入数据的加权平均值,我们可以提供训练数据来训练神经元网络,从而解决有用的问题。|还有一些其他可能实现智能的方法:新兴的、依靠协同的多智能体系统(multi-agent),它基于这样一个事实,即复杂的智能行为可以来自大量简单智能系统的相互作用。根据进化控制论,在元系统跃迁的过程中,智能可以从更简单的反应行为中产生。进化方法或遗传算法(genetic algorithm),是一种基于进化原理的优化过程。[1]译者注:元系统跃迁,[Metasystem Transition](https://en.wikipedia.org/wiki/Metasystem_transition),是指通过演化涌现出更高层次的组织或者控制。我们将在课程的后续部分考虑这些方法,但现在我们将重点关注自上而下、自下而上两个主要方向。

Others are asking
搭建可以自主决策规划和行动的agent
搭建可以自主决策规划和行动的 agent 通常涉及以下几个方面: 一、Agent 的概念 Agent 是一种能够在环境中自主感知、思考并采取行动的实体。可以将其想象成一个具有特定目标和行为能力的智能角色,能根据环境变化做出相应决策和反应。 二、LLM Agent LLM Agent 是结合大型语言模型(LLM)和自主智能体(Agent)特性的系统,能够利用大型语言模型的自然语言处理能力,理解用户输入,并在此基础上进行智能决策和行动。 三、LLM Agent 的组成部分 1. 规划(Planning) 定义:规划是 Agent 的思维模型,负责将复杂任务分解成可执行的子任务,并评估这些子任务的执行策略。 实现方式:通过使用大型语言模型的提示工程(如 ReAct、CoT 推理模式)来实现精准任务拆解和分步解决。 2. 记忆(Memory) 定义:记忆即信息存储与回忆,包括短期记忆和长期记忆。 实现方式:短期记忆用于存储对话上下文,支持多轮对话;长期记忆存储用户特征和业务数据,通常通过向量数据库等技术实现快速存取。 3. 工具(Tools) 定义:工具是 Agent 感知环境、执行决策的辅助手段,如 API 调用、插件扩展等。 实现方式:通过接入外部工具(如 API、插件)扩展 Agent 的能力,例如使用插件解析文档、生成图像等。 4. 行动(Action) 定义:行动是 Agent 将规划和记忆转换为具体输出的过程,包括与外部环境的互动或工具调用。 实现方式:根据规划和记忆执行具体行动,如智能客服回复、查询天气预报、AI 机器人抓起物体等。 四、Anthropic 的建议 随着 LLM 在几个关键能力上的成熟,如理解复杂输入、进行推理和规划、可靠使用工具以及从错误中恢复,智能体开始在生产环境中涌现。智能体通过与人类用户的命令或交互式对话开始工作。一旦任务明确,智能体就会独立进行规划和操作,必要时会向人类寻求更多信息或判断。 在执行过程中,智能体需要在每个步骤从环境中获取“基准事实”(如工具调用结果或代码执行情况)以评估其进展。智能体可以在检查点或遇到障碍时暂停等待人类反馈。任务通常在完成时终止,但也常常包含停止条件(如最大迭代次数)以保持控制。 智能体适用于难以或无法预测所需步骤数量的开放性问题,且无法硬编码固定路径的场景。但智能体的自主性意味着更高的成本和潜在的错误累积。建议在沙盒环境中进行广泛测试,并设置适当的防护措施。 五、实例探究 Generative Agents 是一个有趣的实验,其中 25 个虚拟角色,每个角色都由 LLM 支持的 Agents 控制,在沙盒环境中生活和交互,其灵感来自《模拟人生》。生成 Agents 的设计将 LLM 与记忆、规划和反射机制相结合,使 Agents 能够根据过去的经验进行行为,并与其他 Agents 进行交互。 记忆流是一个长期记忆模块(外部数据库),用自然语言记录智能体经验的完整列表。检索模型会根据相关性、新近度和重要性,呈现上下文以告知 Agents 的行为。反射机制随着时间的推移将记忆合成更高层次的推论,并指导智能体未来的行为。规划与反应将反思和环境信息转化为行动,规划本质上是为了优化当前与时间的可信度。
2025-03-21
机器学习的子领域包括: 监督学习,常用算法如线性回归、决策树、支持向量机(SVM)。 无监督学习,如聚类、降维等算法。 强化学习,那深度学习是哪一种啊
深度学习是机器学习的一个子领域。 在机器学习中,深度学习是一种利用深度神经网络来学习数据特征和模式的方法。 深度学习的特点包括: 1. 具有复杂的网络结构,如前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等。 2. 能够自动从大量数据中提取高级特征。 深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成果。
2025-01-21
流程图有哪些工具可以制作,流程图主要用于展示一个过程或系统的步骤和决策点。图中通过不同形状的框(如椭圆形、矩形)和箭头来表示各种步骤、条件判断和流程走向, 有哪些AI工具可以直接制作吗
以下是一些可以制作流程图的 AI 工具: 1. Lucidchart: 注册并登录:。 选择模板:在模板库中搜索“项目管理流程图”。 编辑图表:根据项目需求添加和编辑图形和流程步骤。 优化布局:利用 AI 自动布局功能,优化图表的外观。 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 2. ChatGPT: 确定制作目标。 通过自然语法描述逻辑,生成 Mermaid 图形语法。 在线校验测试是否成功。
2024-12-19
上面的流程图有哪些工具可以制作,流程图主要用于展示一个过程或系统的步骤和决策点。图中通过不同形状的框(如椭圆形、矩形)和箭头来表示各种步骤、条件判断和流程走向, 有哪些AI工具可以直接制作吗
以下是一些可以制作您所描述的流程图的 AI 工具: Lucidchart: 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据您的项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 此外,文中还提到了关于智能体和人工智能在解决科学问题方面的一些相关内容,但未直接涉及流程图制作工具的更多信息。
2024-12-19
智能体感知决策执行
智能体是在现代计算机科学和人工智能领域中一个基础且重要的概念。 智能体的应用领域广泛,包括: 1. 自动驾驶:汽车中的智能体感知周围环境,做出驾驶决策。 2. 家居自动化:智能家居设备根据环境和用户行为自动调节。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:金融市场中的智能交易算法根据市场数据做决策。 5. 客服聊天机器人:通过自然语言处理与用户互动,提供客户支持。 6. 机器人:各类机器人中集成的智能控制系统。 设计和实现一个智能体通常涉及以下步骤: 1. 定义目标:明确智能体要实现的目标或任务。 2. 感知系统:设计传感器系统采集环境数据。 3. 决策机制:定义决策算法,根据感知数据和目标做决策。 4. 行动系统:设计执行器或输出设备执行决策。 5. 学习与优化:若为学习型智能体,设计学习算法以改进。 具身智能是将机器学习算法适配至物理实体从而与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过多种模态与用户交互,具身智能体则将大模型嵌入物理实体,通过传感器与人类交流。人形机器人是具身智能的代表产品,其三要素为本体、智能、环境,高度耦合是高级智能的基础。不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人。具身智能体的行动分为“感知决策行动反馈”四个步骤,分别由四个模块完成并形成闭环。具身智能需要具备感知、决策和执行三种核心能力,执行能力是技术难点,涉及硬件设计,可泛化的通用执行能力是短板。LLM 为具身智能热潮来临提供了机会,其强泛化能力和 zeroshot 能力使不再需要为每个任务手工调校机器人。
2024-11-29
根据我的论文主题撰写一段引言:《通用人工智能时代的博弈论应用:数据科学与决策价值》
在当今科技飞速发展的时代,通用人工智能(AGI)的崛起正以前所未有的态势改变着我们的生活和社会。随着数据量的爆炸式增长以及决策环境的日益复杂,博弈论作为一门研究决策主体相互作用时的策略选择及均衡问题的学科,在通用人工智能时代展现出了独特的应用价值。 在数据科学领域,海量的数据为我们提供了丰富的信息,但如何从这些数据中提取有价值的知识并做出明智的决策,成为了一个关键挑战。博弈论的引入为解决这一问题提供了新的思路和方法。它帮助我们理解不同数据主体之间的竞争与合作关系,从而优化数据的采集、处理和分析过程。 在决策价值方面,通用人工智能系统需要在复杂多变的环境中做出最优决策。博弈论通过对不同策略的收益和风险进行分析,为决策提供了理论依据和数学模型,使得决策更加科学、合理和高效。 综上所述,研究通用人工智能时代的博弈论应用,对于推动数据科学的发展以及提升决策的价值具有重要的理论和实践意义。
2024-09-28
社群机器人
以下是关于社群机器人的相关内容: 制作 Coze 社群机器人的大致流程看似步骤繁多,但由于 Coze 本身的设计和强大的社区力量,实际操作并不复杂,关键是要“迈出第一步”。在制作过程中,与社区成员设计方案时的深入讨论、在 Coze 平台上灵活组装功能时的高效畅快以及在不断调试优化中见证机器人成长,都充满乐趣。未来会有更多社区加入制作社群机器人的行列,让更多人感受 AI 智能体的魅力,那时的社群机器人不仅是助手,更是凝聚社区集体智慧的伙伴。目前的社区机器人还有不足,作者会继续优化,看其能否更好地服务社区。 如果对学习 Coze 和 AI Agent 有兴趣,可以加入免费的 AI Agent 共学群,该群组会基于 WaytoAGI 社区等高质量信息源分享相关玩法、经验和前沿资讯。可搜索微信号 Andywuwu07 或扫描二维码加微信,备注 AI 共学以便被拉入群。 此外,以综合服务的社群机器人为例,一个好的文章或复杂任务不是一次 AI 工作就能完成的,需要任务拆解,比如对用户问题做意图判断,根据意图将线路转接到正确的专属 AI 机器人那里,整个过程称为工作流,通过搭建工作流来完成复杂任务。
2025-04-15
MacBook 如何做一个 RPA 机器人
以下是在 MacBook 上制作 RPA 机器人的详细步骤: 搭建前准备: 硬件准备: MacBook(需能科学上网) 一部 iPhone 手机 主板 Arduino UNO R4 Wifi(200RMB) 舵机 9g(32RMB) 杜邦线,公对公 7 条(手残党可多备) (可选)八爪鱼支架(10RMB) (二选一)usbtypeC 转接头,或一根两头 typeC 的线 Arduino UNO R4 WIFI 开发板 MG90s/SG90 舵机 9g 云台支架 可选八爪鱼手机支架 杜邦线公对公 搭建步骤: 完成代码: 在 Github 上下载完整代码。 根据需求修改文件: 【必改】在 head.py 中找到填写主板串口的地方,改成串口地址(可通过主板写入的第 3 步里的小字或 Tools>Get Board Info 重新查询,复制 sn 号替换 usbmodem 后面的编码)。 【必改】查询 iPhone 的 ip 地址,填到 talk.py 里(iPhone 设置>无线局域网>点击当前 wifi 旁的感叹号>找到 ipv4 地址里写的 ip 地址)。 【必改】把 open ai key 填到 talk.py 里。 【可选】在 talk.py 里,可以修改: Openai 调用的 model。 system prompt(机器人的人设)。 机器人的音色。 录音的设置。 【可选】在 head.py 里,可以修改不对话后,等待多久恢复人脸追踪。 运行程序: 在 MacBook 上按下 command+space(空格)打开一个新的终端,依次输入如下代码(每一次代码运行完以后再输入下一个),全部完成后,关闭端口。 将 iPhone 的屏幕关闭时间设置为 5 分钟或永不。 打开 iPhone 的 pythonista 并复制 face.py 的代码进去,运行。注意:每一次如果需要重新运行 pythonista,请先杀后台再运行,否则会因为端口已经被占用而无法播放声音。 找到下载下来的 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”。 将 arduino R4 与 MacBook 相连,在终端中输入以下代码,运行后程序会申请一次摄像头权限,点击允许,然后出现运行失败,再运行一次即可。这个程序一旦运行,无法自然退出,建议直接拔掉 R4 的线或者终端输入 control+c 或者直接关闭终端,但多强制退出几次以后运行就会卡住需要重启或清进程。 再次在 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”,在终端中输入以下代码,运行后程序会申请一次录音权限,点击允许,然后出现运行失败,再运行一次即可。如果运行中出现任何报错,将本文档,代码,报错信息给到 GPT4,让他帮助你就好~可能是有一些库没有预装。 把 talk.py 的终端放在最前面你能看到,出现 recording...的时候就可以说话了。 三个程序同时运行、iPhone 和 MacBook 在同一 wifi,iPhone 没有调静音的情况下,就可以正常对话啦。
2025-04-11
怎么搭建微信机器人?
以下是搭建微信机器人的步骤: 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。 2. 如果想为这个 AI 赋予提示词,可以返回相应步骤进行更改。例如在“目录 4 里的第 17 步”或“第三章,第 7 步”,其中双引号内的 value 部分,便是设置 AI 提示词的地方。 3. 此后,进行任何更改,都需要重新打印登陆二维码。并且一个月内,不要上来就加好友、最好不要私聊聊天。 4. 报错"wxsid"是因为微信未实名,实名即可解决。 5. 如果没有手机登录,可以使用夜神模拟器模拟手机登录。 6. 重新在“文件”的【终端】里,直接输入 nohup python3 app.py&tail f nohup.out 重新扫码登录。 7. 多次重新登录后,就在宝塔“首页右上角点击重启,重启一下服务器”,清理进程。 8. 熟悉 linux 操作的话,也可以通过重启进程的方式来重启服务。 9. 如果想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 此外: 1. Link AI 提供的 100 个,合计 3500 万 GPT3.5 Token 的礼品码。可以用来实现画图、搜索、识图等功能,COW 插件里几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里,领兑换码。 2. 添加微信,拉您进机器人群,先行体验。 如果您仍旧遇到问题,可以先查询社区知识库,或者加“通往 AGI 之路”群,社区小伙伴们会尽力帮助。也可以加 Stuart 个人微信询问。
2025-04-11
创建飞书ai机器人
创建飞书 AI 机器人的步骤如下: 1. 工作流搭建: 打开 Comfyui 界面后,右键点击界面,即可找到 Comfyui LLM party 的目录,您既可以学习如何手动连接这些节点,从而实现一个最简单的 AI 女友工作流,也可以直接将工作流文件拖拽到 Comfyui 界面中一键复刻。 2. 飞书机器人创建: 飞书应用建立: 在中创建自建应用。 进入应用获取 app_id 与 app_secret。 添加应用能力>开启机器人应用能力。 权限管理>消息与群组>选择需要的权限打开。 安全设置>将 comfyUI 运行的电脑 IP 加入白名单。 发布机器人以应用生效。 获取群组或用户 id: 要先把创建的机器人拉到群组中或者拉进私聊。 飞书开发平台找到发送消息的开发文档。 右侧点击获取 token。 选择 receive id type,chat_id 对应群组,open_id 与 user_id 对应个人,点击选择成员,复制对应的 id 即可。 如果需要让机器人发送语音,需要自行在电脑上安装 ffmpeg 。
2025-04-11
微信机器人如何配置
微信机器人的配置步骤如下: 1. sum4all 配置 进入插件目录:/root/chatgptonwechat/plugins 找到 sum4all 插件目录下的 config.json.template,复制并粘贴重命名为:config.json 注册并获取 sum4all key:https://pro.sum4all.site/register?aff=T6rP ,新用户注册有送免费额度,大家先使用这个进行试用,后续可改为自己的 openAI key。 把复制的 key,粘贴到 sum4all 的 config.json 文件内。(上方有功能阐述,你想要哪个,就把哪个改成 ture) 2. Apilot 配置 进入插件目录:/root/chatgptonwechat/plugins 找到 Apilot 文件下的 config.json.template,复制并粘贴重命名为:config.json 去 https://admin.alapi.cn/account/center 注册,并复制 key 把复制来的 key,粘贴进入。保存。 3. 分段对话配置替换 找到这个路径:/root/chatgptonwechat/channel/wechat,直接下载以下文件进行替换。 此外,微信的配置相对较简单,只需要主项目的 config.json 文件看看是否有"channel_type"参数,参数值为:"wx",即:"channel_type":"wx"。完成以上所有配置部分后,可以准备启动步骤了: 使用 nohup 命令在后台运行程序。 执行完启动脚本,等待 30s 左右,会看到终端有一个微信登录的二维码,微信扫码登录。 如果您想使用更多辅助功能,比如使用总结文件能力,总结网页内容能力,此时需要安装各种插件。这部分配置查看插件配置管理部分。
2025-04-10
利用飞书多维表格,做一个类似于客服机器人 可以怎么做?
利用飞书多维表格做一个类似于客服机器人,可以按照以下步骤进行: 1. 创建一个拟人化的 bot,比如起名叫青青,设定其为人设是一个可爱有趣的少女,擅长回答各种刁钻的问题。完成 BOT 捏好后点击发布。 2. 发布时配置飞书多维表格: 输出为文本时,第一步配置为文本。 配置多维表格输入表单,选择用控件的字段选择器,给字段标题随便起个名字如“question”。 在完善捷径的商家信息这里,可以选择全量发布,也可以选择仅自己可用。为了审核快一些,可以选择仅自己可用。等审核通过之后,就可以在飞书多维表格里面看到发布成功。 3. 还可以探索字段捷径的各种玩法(不含 bot),比如直接创建一个多维表格,第一列是几个成语,第二列是 AI 字段捷径生成的对成语的解释。左边输入一列,比如一列成语,右边配置 AI 字段。 此外,还有一些相关信息供您参考: “Show Me 扣子 AI 挑战赛大消费行业专场圆满落幕,探索 AI 与大消费行业的深度结合”中提到了一些相关作品,如帮助企业快速建立产品智能客服体系、ERP 高智版:扣子销售订单管理大师、亚马逊商品评论智析、AI 电商设计师等。 2024 年历史更新(归档)中包含了关于飞书多维表格字段捷径配置 COZE 的 BOT 青青的相关内容。
2025-04-08
如果是小白新手,理论应用到实践中最重要的是什么
对于小白新手,将理论应用到实践中,以下几点最为重要: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,可找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,如图像、音乐、视频等,可根据自身兴趣选择特定模块深入学习,同时掌握提示词技巧。 4. 实践和尝试:理论学习后,实践是巩固知识的关键。尝试使用各种产品做出作品,知识库中有很多实践后的作品和文章分享,欢迎分享自己的实践成果。 5. 体验 AI 产品:与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验,激发对 AI 潜力的认识。 此外,就像有人认为“只要知道它的原理和历史,自然而然就会知道它的底线和顶点在哪里”,但实践中的体验和尝试同样不可或缺。
2025-04-13
学的理论模型如何高效指导实践,在教学中
在教学中,关于如何让学习的理论模型高效指导实践,以下是相关内容: 本系列课程是由 Deeplearning 联合谷歌 Gemini 团队开发的免费在线课程,以 Gemini 模型作为教学模型,教授如何使用多模态提示词与模型交互。但课程内容在国内存在部分无法应用的情况,且缺乏某些概念。因此,对部分教程内容进行了重新整理和刊发,并适当混合了一些入门概念,以增强普世价值。(如有需要,请访问) 在本节课程中您可以学到: 通过实践,与视频内容交互,辅助工作与学习。 通过实践,学习 Function Calling 概念与实际应用。 扩展阅读: )
2025-04-13
我应该如何系统学习本站的内容,以应用为主,基础理论为辅
如果您想系统学习本站内容,以应用为主、基础理论为辅,可以参考以下步骤: 基础理论方面: 了解人工智能、机器学习、深度学习的定义及其之间的关系。 简要回顾 AI 的发展历程和重要里程碑。 掌握数学基础,包括统计学基础(熟悉均值、中位数、方差等统计概念)、线性代数(了解向量、矩阵等基本概念)、概率论(基础的概率论知识,如条件概率、贝叶斯定理)。 算法和模型方面: 对于监督学习,了解常用算法,如线性回归、决策树、支持向量机(SVM)。 熟悉无监督学习中的聚类、降维等算法。 了解强化学习的基本概念。 评估和调优方面: 学会如何评估模型性能,包括交叉验证、精确度、召回率等。 掌握使用网格搜索等技术优化模型参数的方法。 神经网络基础方面: 理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 关于知识库的使用,以 Agent 板块为例: 链接: 用法:从下往上看,一个一个点进去,都有视频。 注意事项:共学都有视频,都是手把手从注册开始的教学,不会就多看几遍,基本保障一个工具能调通、一个 Agent 能搭好。确实内容有点多,点进去看看哪个工具您听过就从哪个工具开始,不然太累。 链接: 用法:看了一些视频之后,您就知道您要看理论还是应用了,找到导航,想看哪里点哪里。 备注:智能千帆、阿里云百炼都是有视频的,其余没有视频。 注意事项:内容较多,您如果都看到这里了,就要考虑聚焦了,先挑一个,开始手把手一起做起来,看看能不能持续用起来,只要您开始用起来,这事儿就成啦!快捷菜单找不到的话,看这里。
2025-03-10
关于AI绘画的所有理论知识
以下是关于 AI 绘画的理论知识: 1. 色彩方面: 颜色的冷暖特性:任何色系都有冷暖之分,并非绝对。黄色等暖色系色相占比不同会改变冷暖感觉。 色彩空间感:暖色看起来前进,冷色看起来后退。 色彩搭配:一般作品采用前暖后冷的色彩搭配,即背景用冷色,主体前景用红色或暖色调,冷色后退可增强空间感和纵深感。家装中冷色器可让房间看起来更大,远浅近深更有开放感。 色彩三要素:色相、明度和纯度。色相指颜色种类,明度指亮度,纯度指饱和度。 色彩心理学:色彩能影响人的情绪,在设计、市场营销、心理治疗等方面有重要作用,每年有流行色,不同颜色可表现多种正面和负面情绪。 色环和配色:三原色可调配出所有颜色,色环中有间色、复色,配色方案有同类色、邻近色、互补色等,不同配色有不同效果。 2. 光源方面: 光源分类:包含自然光(如太阳光、月光)、人造光(如手电筒、路灯、闪光灯等,掌控性和对比度强)、环境光(来自周围自然环境,是折射光线,在表现主体与环境关系时重要)。 光的方向:不同方向光线能体现氛围、表达情绪,如逆光加底光用于塑造反派等,还列举顺光、侧光等不同光的效果及作用。 光的质量:硬光、强光和柔光区别明显,强光和硬光会形成强烈阴影,光线清晰,光与环境对比度高,能凸显主体;柔光与之相对,几乎无阴影,很柔和有氛围感。 光与提示词:光的知识对写提示词很重要,掌握这些才能写出有氛围感的提示词塑造角色形象。 3. 构图方面: 摄影构图:多样且不必严谨遵循特定规则,可同时满足多种构图方式,如 S 构图、三角形构图、引导线构图等,掌握构图知识能分析出更多图片信息。 AI 绘画构图:AI 生图的构图一般不会出大问题,除非刻意用提示词引导。
2025-03-06
我想学习制作机器人 机器狗等的原理及方法,给我一份理论指导和操作指南吧。
以下是关于制作机器人和机器狗的理论指导和操作指南: 具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,能接受多种模态指令实现复杂任务。具身智能体则将大模型嵌入物理实体,通过传感器与人类交流,强调与物理环境交互。人形机器人是具身智能的代表产品。 具身智能有三要素: 1. 本体:即硬件载体,不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人(机器狗)。 2. 智能:包括大模型、语音、图像、控制、导航等算法。 3. 环境:本体所交互的物理世界,本体、智能、环境高度耦合是高级智能基础。 具身智能还有四个模块:感知决策行动反馈。一个具身智能体的行动分为这四个步骤,分别由四个模块完成并形成闭环。在具身智能体与环境的交互中,智能算法通过本体传感器感知环境,做出决策操控本体执行动作任务影响环境,还可通过“交互学习”和拟人化思维学习适应环境实现智能增长。
2025-02-26
如何让ai写一篇很好的文学理论 论文
以下是关于如何让 AI 写一篇好的文学理论论文的相关内容: 首先,过度追求模型的正面描述和对齐人类价值观可能会带来问题。比如在文学创作中,道德过度正确和大量正面描述实际上是一种“对齐税”,会让模型变得愚蠢。像生成的游戏中主人公全是幸福人生,这样的故事缺乏冲突,人物单薄,不好看。而且全乎正确的道德和完美的正面在现实世界中并不存在,纵观文学史,伟大的文学作品几乎没有全是正面描述的,因为人类的心灵与生活极为复杂,痛苦、绝望和悲伤也是生命体验的一部分,只有正面的故事很难获得共鸣。 其次,好的文字能引起人的生理共鸣与情绪。人们在感受到好文字时,往往有一种被击中、头皮发麻的感觉。共鸣是文学的基础,有共鸣才有读者,有读者才有文学。文学映照的是人类相同的渴望与恐惧,人类之间的共性大于差异。对于像 GPT 这样的大语言模型,其预训练数据量大且丰富,储存了人类几乎所有可能的生命经验,理应能够学会引发人类的共鸣与情绪。 最后,在实际操作中,对于处理文本特别是 PDF,Claude 2 表现出色。可以将整本书粘贴到 Claude 的前一版本中取得不错的结果,新模型更强大。但需要注意的是,这些系统仍会产生幻觉,若要确保准确性,需检查其结果。
2025-01-29