Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

设计一条大模型学习之路,并给出推荐资料

Answer

以下是为您设计的大模型学习之路及推荐资料:

学习之路

  1. 了解大模型的基本概念:通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比大模型的训练和使用过程,包括找学校(训练所需的大量计算和 GPU 等)、确定教材(大量的数据量)、找老师(算法讲述内容)、就业指导(微调)、搬砖(推导)。
  2. 学习大模型的构建过程:
    • 收集海量数据:如同教孩子成为博学多才的人需要让其阅读大量资料,对于大模型,要收集互联网上的文章、书籍、维基百科条目、社交媒体帖子等各种文本数据。
    • 预处理数据:像为孩子整理适合的资料,AI 研究人员要清理和组织收集到的数据,如删除垃圾信息、纠正拼写错误、分割文本。
    • 设计模型架构:为孩子设计学习计划一样,研究人员要设计大模型的“大脑”结构,如使用 Transformer 架构等特定的神经网络结构。
    • 训练模型:如同孩子开始阅读和学习,大模型开始“阅读”提供的数据,通过反复预测句子中的下一个词来逐渐学会理解和生成人类语言。

推荐资料

  1. 直播共学:
    • 可在飞书知识库中查看以下分享内容和教程:小七姐、刘宇龙、熊猫、MQ、财猫、李继刚、凯翔、AJ、南瓜博士、江树的分享。
    • 参与每晚群里的分享和讨论会,包括 3.4 直播聊天(讲讲大家最初入门学 prompt 的一些入门方法)、3.5 直播分享(小七姐提示词学习路径)、3.5 直播答疑(小七姐、宇龙、AJ 学习路径中的各类问题和 AGI 对应知识推荐)、3.6 直播分享(MQ:文科小白+普通宝妈的 AI 学习之路、熊猫提示词和思维模型)、3.7 直播分享(南瓜博士&财猫文理兼修话 PROMPT)、3.7 直播聊天解答作业等。
  2. 文章学习:

大模型工具请大家自行准备,推荐顺序为:1.chat 2.kimi.ai 3.智谱清言 4

Content generated by AI large model, please carefully verify (powered by aily)

References

直播共学

这个板块还有很多会做一下详细讲解:[1.2入门:Prompts(提示词)](https://waytoagi.feishu.cn/wiki/Q5mXww4rriujFFkFQOzc8uIsnah)[heading2]学习导师W[content]咱们队伍越来越强大了?咱们知识库的好朋友们都来支援了之前知识库prompt板块共建的小伙伴们小七姐,刘宇龙,熊猫,MQ,财猫,李继刚,凯翔,南瓜博士,江树都来了,大家排班这几天每天晚上群里发起分享和讨论会3.4直播聊天:聊天加答疑讲讲大家最初入门学prompt的一些入门方法3.5直播分享:小七姐提示词学习路径3.5直播答疑:小七姐、宇龙、AJ(学习路径中的各类问题和AGI对应知识推荐)3.6直播分享:MQ:文科小白+普通宝妈的AI学习之路3.6直播分享:熊猫提示词和思维模型3.7直播分享:南瓜博士&财猫文理兼修话PROMPT3.7直播聊天解答作业等:以上顺序和嘉宾还有话题有可能会有变化,目前参与的好朋友有小七姐,宇龙,熊猫,MQ,财猫,李继刚,凯翔,AJ,南瓜博士,江树,在知识库里都可以找到他们的分享内容和教程飞书群答疑:大家会看到就解答[heading2]课备[content]大模型工具请大家自行准备哈。根据自己条件准备,以下是推荐顺序:1.chat2.kimi.ai3.智谱清言4

大模型入门指南

通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)在LLM中,Token([2])被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token是原始文本数据与LLM可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary),比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成下面的词汇表:|Token|ID||-|-||The|345||cat|1256||sat|1726||…|…|

胎教级教程:万字长文带你理解 RAG 全流程

旁白当你发现大模型的效果并没有你预期想的那么好时,你打算放弃但是你也听到了另一种声音:如果大模型没有你想的那么好,可能是你没有了解他的能力边界。你不想就这么放弃,为了更好的理解大模型,你首先了解了他的创建过程[heading2]1.收集海量数据[content]想象一下,我们要教一个孩子成为一个博学多才的人。我们会怎么做?我们会让他阅读大量的书籍,观看各种纪录片,与不同背景的人交谈等。对于AI模型来说,这个过程就是收集海量的文本数据。例子:研究人员会收集互联网上的文章、书籍、维基百科条目、社交媒体帖子等各种文本数据。[heading2]2.预处理数据[content]在孩子开始学习之前,我们可能会先整理这些资料,确保内容适合他的年龄和学习能力。同样,AI研究人员也需要清理和组织收集到的数据。例子:删除垃圾信息,纠正拼写错误,将文本分割成易于处理的片段。[heading2]3.设计模型架构[content]就像我们要为孩子设计一个学习计划一样,研究人员需要设计AI模型的"大脑"结构。这通常是一个复杂的神经网络。这里我们就不展开了,我们只需要了解,为了让AI能够很好的学习知识,科学家们设计了一种特定的架构。例子:研究人员可能会使用Transformer架构,这是一种特别擅长处理序列数据(如文本)的神经网络结构。[heading2]4.训练模型[content]就像孩子开始阅读和学习一样,AI模型开始"阅读"我们提供的所有数据。这个过程被称为"训练"。例子:模型会反复阅读数据,尝试预测句子中的下一个词。比如给出"太阳从东方__",模型学会预测"升起"。通过不断重复这个过程,模型逐渐学会理解和生成人类语言。

Others are asking
我该如何学习AGI,请给我规划一条可行的学习之路
以下是为您规划的学习 AGI 的可行之路: 1. 应用方面: 深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用并用于解决实际问题或提升效率。 2. 分析方面: 大量阅读各类文章、视频以及行业报告,理解各知识之间的关系。 3. 记忆方面: 先从 AI 的历史、基本术语、重要人物、方法和原理等开始了解,查看入门课程。 具体的学习资源包括: 关于 Prompt 的了解:https://ywh1bkansf.feishu.cn/wiki/Q5mXww4rriujFFkFQOzc8uIsnah?table=tbldSgFt2xNUDNAz&view=vewo2g2ktO 适合的 AI 对话:https://ywh1bkansf.feishu.cn/wiki/QddLw0teKi7nUCkDRIecskn3nuc 绘画相关:https://ywh1bkansf.feishu.cn/wiki/Q5ddwxfkMiVUZBkQXN7cgXf4nOb 语音相关:https://ywh1bkansf.feishu.cn/wiki/ZXPiw2OuLi2YsxkkmaLcPTyInrc AI 历史:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbl1tOC3ZKbrcHVn&view=vewTtypUZc 基本术语:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tbltvr7KExCt7Jpw&view=vewjxk9tDu 重要人物:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblLtN12KuvP5reO&view=vewuvGBXhd 方法和原理:https://ywh1bkansf.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblolGx2mprs1EQz&view=vewx5ROYtl 入门课程:https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w
2025-03-28
MCP是什么 ?通往AGI之路中有相关的学习资料吗?
MCP(模型上下文协议)是由 Anthropic 于 2024 年 11 月推出的一项创新标准。它旨在实现大语言模型与第三方数据源的无缝连接,通过支持内容存储库、业务工具和开发环境等多种外部服务,让 AI 模型获取更丰富的上下文信息,从而生成更加精准、相关的智能回答。 Lark 认为,用一句话概括,MCP 是一种通用的方式,向各类大语言模型提供数据源和工具。官网解释:MCP 是一个开放协议,用于标准化应用程序向大语言模型提供上下文的方式,可以将其想象成 AI 应用程序的 USBC 接口。 此外,还有文章介绍了如何通过 MCP 连接 Claude 3.7 与 Blender,实现一句话生成 3D 场景的功能。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。
2025-03-25
网站“通往AGI之路”的建设意义是什么?
“通往 AGI 之路”网站具有以下建设意义: 1. 学习平台:是一个致力于人工智能学习的中文知识库和社区平台,为学习者提供系统全面的 AI 学习路径,涵盖从基础概念到实际应用的各个方面,帮助用户有效地获取 AI 知识,提高自身能力。 2. 资源丰富:由开发者、学者和 AI 爱好者共同参与建设,提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 3. 实践促进:定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 4. 品牌形象:品牌 VI 融合独特设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建充满活力和前瞻性的品牌形象。 5. 连接作用:不仅是一个知识库,更是连接学习者、实践者和创新者的社区,让大家在这里碰撞思想,相互鼓舞,一同成长。 6. 影响力大:在没有任何推广的情况下,一年时间已有超过 70 万用户和超千万次的访问量,是很多 AI 爱好者知识的源头。社群的口号是让更多的人因 AI 而强大,有很多学社和共学共建的活动。
2025-03-24
大模型学习之路
大模型的学习之路包括以下几个主要方面: 1. 大模型的定义:通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。 2. 大模型的训练和使用类比: 找学校:训练大模型需要大量计算,GPU更合适,只有购买得起大量GPU的才有资本训练。 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 找老师:用合适算法让大模型更好理解Token之间的关系。 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。 Token:Token被视为模型处理和生成的文本单位,可代表单个字符、单词等,在将输入进行分词时会数字化形成词汇表。 3. 大模型的底层原理:计算机科学家/工程师以大脑神经元细胞结构为灵感,利用概览模型在计算机上实现对人脑结构的模仿,但大模型内部是混沌系统,存在不确定的“不安感”,同时也学习了人类大脑的优点和特质,这些特质在实际应用中表现出“缺陷”和“不足”。 4. 大模型的构建过程: 收集海量数据:如让孩子阅读大量书籍等,对于AI模型就是收集互联网上的各种文本数据。 预处理数据:像为孩子整理资料,AI研究人员也需清理和组织收集的数据,如删除垃圾信息等。 设计模型架构:为孩子设计学习计划,研究人员需设计AI模型的“大脑”结构,如使用Transformer架构。 训练模型:如孩子开始学习,AI模型开始“阅读”数据,通过反复预测句子中的下一个词逐渐学会理解和生成人类语言。
2025-03-23
请详细讲述一下这个网站《通往AGI之路》的学习方法?
《通往 AGI 之路》的学习方法如下: 1. 系统学习:观看李弘毅老师的生成式 AI 导论、吴达的生成式 AI 入门视频等高质量学习内容,并整理成学习笔记,在整理过程中与大家交流互动。 2. 社区共创学习:对于觉得系统学习枯燥的同学,可以等待社区共创内容,通过共创做小项目来反向推动学习。 3. 了解相关原理:学习 A16Z 推荐的包括 GPT 相关知识、Transformer 模型运作原理、大语言模型词语接龙原理等基础知识。 4. 探索应用:例如了解 Stable Diffusion 运作原理与 GPT 训练现状。 5. 针对特定软件:对于 AE 软件,可在 B 站找丰富的入门课程自学,也可从包图网下载工程文件学习。通过拆解视频、留意路边广告特效、按层级逻辑思考画面运动来学习,还可参考模板。 6. 名词解释:理解包括 AGI、AIGC、agent、prompt 等 AI 相关名词,可通过与 AI 对话或李继刚老师的课程来理解。 7. 信息获取:关注赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,订阅获取最新信息并投稿。 8. 参与活动:参加如 AIPO、CONFIUI 生态大会等社区活动,每月还有切磋大会。 9. 阅读经典:阅读介绍 GPT 运作原理、Transformer 模型、扩散模型等的经典必读文章,以及软件 2.0 时代相关内容。 10. 初学者推荐:对于初学者,推荐看 Open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。同时,整理 open AI 的发展时间线和万字长文回顾等历史脉络类资料。
2025-03-23
通往agi之路是一个怎样的团队
“通往 AGI 之路”是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。 它具有以下特点: 1. 目标是助力每一个怀揣 AI 梦想的人在探索知识的道路上“无弯路,全速前进”。 2. 这里既是知识的消费者,也是知识的创作者。 3. 拥有 200 多个微信群和 140 多个高校群。 4. 举办了 AIPO 等相关活动,活动遵循先共学再以赛代练的学习路径,邀请了 10 位 AI 界大佬分享经验。 5. 有赛博禅心主理人大聪明等人员的参与和支持,赛博禅心公众号有 5000 个 AI 项目详解,可为活动提供灵感。 6. 中科院翟教授曾开场致辞。 7. 提供了 v two agi.com 网站供注册进入知识库。 同时,“通往 AGI 之路”还有众多友情链接,涉及麦橘、orange、Web3 天空之城、Ragnar 瑞哥那、海辛、三思、云中江树、陈财猫、阿文等在 AI 领域的不同角色,如产品经理、艺术家、工程师等。
2025-03-22
请给出知识库中关于dify的文章和教学视频
以下是关于 Dify 的相关内容: 如何接入企业微信: 创建聊天助手应用:在 Dify 平台创建基础编排聊天助手应用,获取 API 密钥和 API 服务器地址。 下载 Dify on WeChat 项目:下载并安装依赖。 填写配置文件:在项目根目录创建 config.json 文件,填写 API 密钥和服务器地址。 把基础编排聊天助手接入微信:快速启动测试,扫码登录,进行对话测试,可以选择源码部署或 Docker 部署。 把工作流编排聊天助手接入微信:创建知识库,导入知识库文件,创建工作流编排聊天助手应用,设置知识检索节点和 LLM 节点,发布更新并访问 API。 把 Agent 应用接入微信:创建 Agent 应用,设置对话模型和添加工具,生成 API 密钥,填写配置文件,启动程序并进行测试。 更多内容请访问原文:https://docs.dify.ai/v/zhhans/learnmore/usecases/difyonwechat 小七姐相关的提示词知识库文章索引: RAG 提示工程系列(3)|迈向工程化应用中关于 Dify 的介绍: Dify 是一个开源的大模型应用开发平台,它通过结合后端即服务和 LLMOps 的理念,为用户提供了一个直观的界面来快速构建和部署生产级别的生成式 AI 应用。 该平台具备强大的工作流构建工具,支持广泛的模型集成,提供了一个功能丰富的提示词 IDE,以及一个全面的 RAG Pipeline,用于文档处理和检索。 Dify 还允许用户定义 Agent 智能体,并通过 LLMOps 功能对应用程序的性能进行持续监控和优化。 Dify 提供云服务和本地部署选项,满足不同用户的需求,并且通过其开源特性,确保了对数据的完全控制和快速的产品迭代。 Dify 的设计理念注重简单性、克制和快速迭代,旨在帮助用户将 AI 应用的创意快速转化为现实,无论是创业团队构建 MVP、企业集成 LLM 以增强现有应用的能力,还是技术爱好者探索 LLM 的潜力,Dify 都提供了相应的支持和工具。 Dify 官方手册:https://docs.dify.ai/v/zhhans 一般地,如果是个人研究,推荐单独使用 Dify,如果是企业级落地项目推荐使用多种框架结合,效果更好。
2025-03-21
我想从Nanobrowser里植入DeepSeek的R1模型,来让它帮我做网页搜索之类的工作,我该怎么做,给出详细教程
以下是从 Nanobrowser 里植入 DeepSeek 的 R1 模型来进行网页搜索的详细教程: 1. 阿里云百炼平台相关: 模型广场:百炼平台的模型广场有各种模型,包括音频理解、视频理解等,通义的一些强模型也在其中。 无需部署:百炼平台无需部署,可直接使用 Deepseek R1 模型。 价格与免费额度:Deepseek R1 模型价格与各大平台差不多,有大量免费额度,如 100 万 token,不同版本的模型如 7B、14B、32B 等也送了 100 万 token,LLAVA 限时免费。 授权与实名认证:使用 Deepseek R1 模型需要解锁和授权,没有授权按钮的需要对阿里云进行实名认证,可通过支付宝扫码或在右上角头像处进行,共学群里有相关指引。 模型效果对比:在首页体验模型页面可对比不同模型的效果,如 V3 和 R1,R1 会先思考,速度较快。 多模态能力:多模态可以识别更多输入信息,如读文件、图片等,而 Deepseek R1 本身不是多模态模型。 连接 Chat Box:通过模型广场的 API 调用示例获取链接,截断后粘贴到 Chat Box 的设置中,添加自定义提供方,设置模型名称为 Deepseek R1,并获取 API key。 API key 重置:可删除旧的 API key 并重新创建,方便本地软件连接。 2. 工作流创建: 创建一个对话流,命名为 r1_with_net。 开始节点,直接使用默认的。 大模型分析关键词设置:模型选择豆包通用模型lite,输入直接使用开始节点的 USER_INPUT 作为大模型的输入,系统提示词为“你是关键词提炼专家”,用户提示词为“根据用户输入`{{input}}`提炼出用户问题的关键词用于相关内容的搜索”。 bingWebSearch搜索:插件选择 BingWebSearch,参数使用上一个节点大模型分析输出的关键词作为 query 的参数,结果中 data 下的 webPages 是网页搜索结果,将在下一个节点使用。 大模型R1 参考搜索结果回答:在输入区域开启“对话历史”,模型选择韦恩 AI 专用 DeepSeek(即火山方舟里配置的 DeepSeek R1 模型),输入包括搜索结果(选择搜索节点 data 下的 webPages)和开始节点的 USER_INPUT,开启对话历史,设置 10 轮,默认不开启对话历史,开启后默认是 3 轮,系统提示词不需要输入,用户提示词为空。 结束节点设置:输出变量选择大模型R1 参考搜索结果回答的输出,回答内容里直接输出:{{output}}。测试完成后,直接发布工作流。 3. 网页聊天相关: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL 为 https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 打开联网功能,支持联网搜索使用 R1。
2025-03-20
我想写一篇本科生论文,给出我需要的所有用于ai写论文用的指令
以下是利用 AI 写本科生论文的一些指令和步骤: 1. 确定论文主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成论文的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析(若涉及):如果论文涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写论文的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查论文的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保论文的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代您的专业判断和创造性思维。在使用 AI 进行论文写作时,应保持批判性思维,并确保研究的质量和学术诚信。
2025-03-20
一个小白,如何通过咱们这个网站来学习和应用AI,赋能工作,请给出详细的方案,
对于一个小白,通过本网站学习和应用 AI 赋能工作,可以参考以下详细方案: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 六、在网站中引入 AI 助手 1. 创建大模型问答应用:先通过百炼创建一个大模型应用,并获取调用大模型应用 API 的相关凭证。 2. 搭建示例网站:通过函数计算,来快速搭建一个网站,模拟您的企业官网或者其他站点。 3. 引入 AI 助手:接着通过修改几行代码,实现在网站中引入一个 AI 助手。 4. 增加私有知识:最后可以通过准备一些私有知识,让 AI 助手能回答原本无法准确回答的问题,帮助您更好的应对客户咨询。 七、推荐布鲁姆分类法学习路径 应用:深入 分析:大量阅读,理解各知识之间的关系。
2025-03-16
可以给出国内出名的大语言模型的信息吗,包括其模型名称,版本,发布时间,发布公司,模型参数,性能特点等信息,尽可能覆盖更多的大模型,使用表格输出,并按照发布时间排序
|模型名称|版本|发布时间|发布公司|模型参数|性能特点|适合应用| |||||||| |Baichuan213BChat|Baichuan2192K|10月31日|百川智能|未提及|在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名200亿参数量级国内模型第一,在计算和代码能力上有一定优化空间|场景相对广泛且可以私有化部署,重点推荐在小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景,可部署在教育、医疗、金融等垂直行业中应用,同时可部署在低算力终端处理基础智能任务| |文心一言|V4.0|10月17日|百度|未提及|在计算、逻辑推理、生成与创作、传统安全这4大基础能力上排名国内第一,在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三,各项能力表现均衡且绝大部分能力有很高的水平|能力栈较为广泛,可应用的场景较多,重点推荐在查询搜索知识应用、任务拆解规划Agent、文案写作以及代码编写及纠错等方面的应用,由于在逻辑推理方面的不俗表现,可以重点关注在科学研究、教育、工业方面的落地能力| |通义千问 2.0|2.0|10月31日|阿里云|千亿级参数|未提及|未提及|
2025-03-15
如何通过与AI的对话获取高质量的信息?有没有相关书籍或者文章推荐,请给出相关链接。
以下是关于如何通过与 AI 的对话获取高质量信息以及相关书籍和文章推荐的内容: 在与 AI 对话获取高质量信息方面: 作为普通用户,语言在大模型中不是关键,核心是向量空间中的游走脉络,输出时的语言翻译是次要的,且训练语料的中英文差异在于 embedding 环节。 通过合适的模型、prompt 和 test 入口表达,用大模型公式调试出好效果以替代垂类模型,但微调垂类模型可能使大模型泛化能力下降,需分场景看待。 写提示词未挖掘出大模型的天花板,还有提升空间。 相关书籍和文章推荐: 从数学、作家、代码、原理角度写大模型的四本书。 介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章。 关于 AI 知识库及学习路径的介绍中提到的经典必读文章,如软件 2.0 时代相关内容。 初学者入门推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 获取信息的渠道: 可以关注赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,订阅获取最新信息并投稿。 可通过“通往 AGI 之路”知识库获取相关内容,该知识库涵盖了 AI 多方面知识及社区共创项目,如人工智能简史、AI 会话简史等,还有 10 篇精选文章助于理解 AI。 您还可以通过参加社区共创项目,如 AIPU、CONFIUI 生态大会,每月的切磋大会等活动,以及新活动 AIPO,与他人交流获取更多信息。同时,鼓励整理学习笔记并分享交流,以促进对知识的吸收和理解。
2025-03-09
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
哪里可以搜到dify的相关学习资料
以下是一些可以搜到 Dify 相关学习资料的途径: 1. 您可以通过以下链接获取相关学习资料:https://docs.dify.ai/v/zhhans/gettingstarted/installselfhosted/dockercompose 。这些命令通常在宝塔面板的终端安装,若想了解命令的含义,可直接询问 AI 。 2. 微信文章: ,该文章介绍了如何在几分钟内使用 Dify 平台快速定制网站的 AI 智能客服,即使是非技术人员也能操作。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-10
AI在人力资源中的实践应用资料
以下是关于 AI 在人力资源中的实践应用资料: 在人力资源管理领域,AI 的应用覆盖了多个环节,显著提高了工作效率。 在招聘初期,AI 可用于职位描述生成、简历分析、面试题设计等方面。 在员工绩效评估中,AI 能够分析员工工作表现,识别绩效趋势和提升点,为管理层提供数据支持的绩效反馈。 在员工培训与发展方面,AI 也能发挥作用。 相关报告推荐: 《》预测,随着技术进步,AI 将进一步推动个性化人力资源管理,创造无人值守的 HR 平台,推动企业持续发展。 此外,在全行业中,基础办公提效如 ppt、excel、会议报告、策划会、文案包装、图文海报、客服机器人 bot 等,都可以从【单个任务 task>角色 role>角色间协同 collaboration】显著提高工作效率。
2025-03-31
我是一名0基础的AI使用者,如果我需要熟练的搭建自己coze来完成一些业务工作,我的学习路径是什么样的?可以为我推荐一个学习计划,包括学习的资料获取途径和资料推荐吗?
以下是为您推荐的从 0 基础学习搭建自己的 Coze 来完成业务工作的学习路径和学习计划: 学习路径: 1. 了解 Coze AI 应用的背景和现状,包括其发展历程、适用场景和当前的局限性。 2. 熟悉创建 AI 应用的操作界面,包括学习业务逻辑和用户界面的搭建。 3. 掌握前端和后端的基础知识,了解其在 Coze 应用中的作用。 4. 学习容器的操作和页面布局技巧。 学习计划: 1. 资料获取途径:可以通过飞书知识库获取相关学习资料。 2. 资料推荐: “90 分钟从 0 开始打造你的第一个 Coze 应用:证件照 2025 年 1 月 18 日副本”,其中包含智能纪要和智能章节,详细介绍了 Coze 应用的创建过程、界面讲解、前端与后端基础及界面组件布局、容器操作与页面布局等内容。 (筹划中)「Agent 共学」之“两天学会用 AI 建站”,其中的共学日程表可能会提供相关的学习安排和指导。 在学习过程中,建议您重点熟悉桌面网页版的用户界面,按照资料中的步骤逐步实践,遇到问题及时查阅资料或寻求帮助。祝您学习顺利!
2025-03-31
帮我提取五份关于基础AI或者大数据学习的资料,我给发电厂的领导学习
很抱歉,目前没有为您找到五份关于基础 AI 或者大数据学习的具体资料。但您可以通过以下途径获取相关资料: 1. 在线教育平台,如 Coursera、EdX 等,上面有许多关于 AI 和大数据的基础课程。 2. 相关的专业书籍,例如《人工智能:一种现代方法》《大数据时代》等。 3. 学术期刊网站,如 IEEE Xplore、ScienceDirect 等,能获取最新的研究成果和技术报告。 4. 知名科技公司的技术博客,如谷歌、微软等,它们会分享一些实用的技术见解和案例。 5. 相关的开源项目网站,如 GitHub,从中可以了解实际的项目代码和实现方法。
2025-03-28
四轮腿机器人资料
以下是关于四轮腿机器人的相关资料: 宇树科技在该领域的情况: 推动了 AI + 机器人技术的标准化、模块化、智能化,实现快速、低成本落地。 基于企业训练数据完善深度学习训练模型及预测代码,通过四足机器人完成救援场景任务执行。 其四足机器人产品能力出众,多场景头部客户落地验证。 发布了 Aliengo 四足机器人,采用全新设计的动力系统,更轻量集成,一体化机身设计。 其 CEO 王兴兴在硕士期间独立开发了低成本外转子无刷电机驱动的高性能四足机器人 Xdog,开创了全球低成本高性能四足机器人方案的技术先河,并于 2016 年创立宇树科技。 2021 年 6 月发布伴随仿生机器人 Go1,以超低价格和优秀的感知运动能力,成为人类科技史上首款真正走入大众生活的移动机器人。2022 年 2 月“泰哥”亮相,2022 年 4 月推出 PUMP 健身泵。2023 年 4 月发布仿生 4D 激光雷达 L1。未来还将推出 Go 1 升级版、行业版、人形机器人等产品。 具身智能方面: 具身智能是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”使用大模型通过网页端、手机 APP 与用户进行交互,具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流,强调智能体与物理环境之间的交互。通俗讲就是给人工智能装上“身体”,人形机器人是具身智能的代表产品。 具身智能的三要素包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),本体、智能、环境的高度耦合是高级智能的基础,不同环境下会有不同形态的硬件本体适应环境,比如室内平地适用轮式机器人,崎岖不平地面适用四足机器人。 具身智能的行动分为“感知 决策 行动 反馈”四个步骤,分别由四个模块完成,并形成一个闭环。
2025-03-25