Navigate to WaytoAGI Wiki →
Home/All Questions
什么是AI
AI 是一门令人兴奋的科学,它是某种模仿人类思维可以理解自然语言并输出自然语言的东西,其生态位是一种似人而非人的存在。 对于没有理工科背景的人来说,将 AI 当成一个黑箱,只需要知道它能理解自然语言并输出自然语言即可。 最初,计算机是按照明确的程序和算法进行数字运算。但对于像根据照片判断一个人的年龄这类任务,我们无法明确具体的步骤和解法,而这正是 AI 所感兴趣的。 现在的 AI(主要是生成式 AI 技术)可以接受和理解各种不同的输入和数据,并生成包括文字、声音、图像、视频、3D 模型等多种多样的内容。简单来说,可以把 AI 当人看。
2025-03-20
国内主流的大语言模型公司有哪几家
国内主流的大语言模型公司主要有以下几家: 1. 百度:其文心一言大语言模型可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。 2. 阿里巴巴:拥有通义大模型。 3. 北京智源人工智能研究院:推出了“悟道・天鹰”,是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。
2025-03-20
国内的大语言模型清单
以下是一些国内的大语言模型: 1. 文心一言:可用于文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等。 2. 讯飞星火:通用模型,处理自然语言。 3. “悟道・天鹰”(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 此外,如果想了解国内大模型的效果,可以参考第三方基准评测报告:
2025-03-20
列出国内的所有大模型
以下是国内的部分大模型: 北京企业机构: 百度:文心一言,https://wenxin.baidu.com 抖音:云雀大模型,https://www.doubao.com 智谱 AI:GLM 大模型,https://chatglm.cn 中科院:紫东太初大模型,https://xihe.mindspore.cn 百川智能:百川大模型,https://www.baichuanai.com/ 上海企业机构: 商汤:日日新大模型,https://www.sensetime.com/ MiniMax:ABAB 大模型,https://api.minimax.chat 上海人工智能实验室:书生通用大模型,https://internai.org.cn 其他地区: 阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中。 广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 此外,通义千问的 Qwen 系列在 LMSys 榜单中表现出色,其开源模型受欢迎,累计下载量突破 1600 万,国内外有海量开发者基于其开发模型和应用。大模型的竞争涉及芯片、云计算、闭源模型、开源模型、开源生态等,基础大模型决定产业智能化的天花板等,开源生态也至关重要。
2025-03-20
Prompt 提示词
以下是关于提示词(Prompt)的全面介绍: 一、如何编写提示词 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:明确格式、风格等要求。 5. 使用示例:提供期望结果的示例。 6. 保持简洁:避免过多信息导致模型困惑。 7. 使用关键词和标签:帮助模型理解任务主题和类型。 8. 测试和调整:根据生成结果检查并调整。 二、如何润色或优化提示词 1. 明确具体描述:使用更具体、细节的词语和短语。 2. 添加视觉参考:插入相关图片参考。 3. 注意语气和情感:用合适的形容词、语气词调整整体语境和情绪。 4. 优化关键词组合:尝试不同搭配和语序。 5. 增加约束条件:如分辨率、比例等限制。 6. 分步骤构建:将复杂需求拆解为子提示词。 7. 参考优秀案例:借鉴有效的范例和写作技巧。 8. 反复试验、迭代优化:多次尝试并根据效果反馈完善。 三、星流一站式 AI 设计工具中的提示词 1. 在 prompt 输入框中可输入提示词,使用图生图功能辅助创作。 提示词用于描绘画面。 输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 启用提示词优化后可扩展提示词,更生动描述画面内容。 2. 写好提示词的方法 预设词组:小白用户可点击提示词上方官方预设词组生图。 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,如一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮弹出负面提示词框,帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:在功能框增加提示词并调节权重,数值越大越优先,也可编辑已有提示词权重。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-20
coze
以下是关于 Coze 的相关信息: 重磅更新:Coze 可以接入抖音评论区,帮您自动回复用户的评论。若想快速上手,可参考视频。若还不了解 Coze 是什么,可参考文章。 安装 Coze Scraper: 通过应用商店安装: 1. 打开 Chrome 浏览器。 2. 点击在 Chrome 应用商店中打开 Coze Scrapper 扩展程序。 3. 单击添加至 Chrome。 4. 在弹出的页面,单击添加扩展程序。 本地安装: 1. 单击下载安装包,然后解压下载的文件。 2. 打开 Chrome 浏览器。 3. 在浏览器中输入 chrome://extensions 打开扩展程序页面,确认开发者模式处于打开状态。点击加载已解压的扩展程序,选择已解压的文件夹。 Coze 记账管家——数据库使用教程: COZE 是字节跳动旗下子公司推出的 AI Agent 构建工具,允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent,目前可以白嫖海量大模型免费使用,有丰富的插件生态。 记账管家是基于 COZE 平台的能力搭建的一个记账应用,可以直接和 coze 说您今天的收入或者支出情况,coze 会自动记账,并计算账户余额,每一笔记账记录都不会丢失。点击以下卡片体验记账管家。
2025-03-20
科学计算大模型的代表模型有哪些
科学计算大模型的代表模型主要有以下几种: 1. Encoderonly 模型:适用于自然语言理解任务,如分类和情感分析,最知名的代表是 BERT。 2. Encoderdecoder 模型:同时结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容,代表模型如谷歌的 T5。 3. Decoderonly 模型:更擅长自然语言生成任务,如故事写作和博客生成,众多熟知的 AI 助手基本采用此结构,包括 ChatGPT。 大模型具有以下特点: 1. 预训练数据量大:往往来自互联网,包括论文、代码、公开网页等,先进的大模型通常用 TB 级别的数据进行预训练。 2. 参数众多:如 OpenAI 在 2020 年发布的 GPT3 就已达到 170B 的参数。 在数字化处理中,为让计算机理解 Token 之间的联系,需将 Token 表示成稠密矩阵向量,即 embedding,常见算法有基于统计的 Word2Vec、GloVe,基于深度网络的 CNN、RNN/LSTM,基于神经网络的 BERT、Doc2Vec 等。以 Transform 为代表的大模型采用自注意力(Selfattention)机制学习不同 token 之间的依赖关系,生成高质量 embedding。 大模型的“大”主要指用于表达 token 之间关系的参数多,如 GPT3 拥有 1750 亿参数。当神经元数量达到百亿、千亿级别时,会出现群体智能,即智能涌现,这在自然界如蚂蚁群体中有典型体现,人脑也由约 1000 亿个神经元构成复杂神经网络。
2025-03-20
我想深入了解AI
以下是为您提供的深入了解 AI 的相关内容: 新手学习 AI 的步骤: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅:在「」中,您能找到为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,比如图像、音乐、视频等,您可根据兴趣选择特定模块深入学习,同时掌握提示词技巧。 4. 实践和尝试:理论学习后,实践是巩固知识的关键,您可以尝试使用各种产品做出作品,知识库也提供了很多实践后的作品和文章分享。 5. 体验 AI 产品:与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)互动,了解其工作原理和交互方式。 对于不会代码但想学习 AI 的您: 1. AI 背景知识:了解人工智能、机器学习、深度学习的定义及其之间的关系,简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础:熟悉统计学基础(如均值、中位数、方差等统计概念)、线性代数(如向量、矩阵等基本概念)、概率论(如条件概率、贝叶斯定理)。 3. 算法和模型:了解监督学习(如线性回归、决策树、支持向量机)、无监督学习(如聚类、降维)、强化学习的基本概念。 4. 评估和调优:了解如何评估模型性能(包括交叉验证、精确度、召回率等),学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础:理解神经网络的基本结构(包括前馈网络、卷积神经网络、循环神经网络),了解常用的激活函数(如 ReLU、Sigmoid、Tanh)。 入门经典必读: 作者为,原文地址:https://a16z.com/2023/05/25/aicanon/ ,译者为通往 AGI 之路。人工智能的研究发展迅速,对于初学者而言困难较大。因此,文中分享了一份用于深入了解现代 AI 的精选资源列表,称为“AI 典藏”,包括对 Transformer 和 Latent Diffusion 模型的介绍,技术学习资源,构建大型语言模型的实用指南,AI 市场的分析,以及里程碑式研究成果的参考列表。
2025-03-20
视觉大模型的代表模型有哪些
以下是一些视觉大模型的代表模型: 1. Flamingo:一系列视觉语言(VL)模型,能处理交错的视觉数据和文本,并生成自由格式的文本输出。 2. BLIP2:引入资源效率更高的框架,包括用于弥补模态差距的轻量级 QFormer,能利用冻结的 LLM 进行零样本图像到文本的生成。 3. LLaVA:率先将 IT 技术应用到 MM 领域,引入新型开源 MM 指令跟踪数据集及基准 LLaVABench 以解决数据稀缺问题。 4. MiniGPT4:提出简化方法,仅训练一个线性层即可将预训练的视觉编码器与 LLM 对齐,复制 GPT4 的功能。 5. mPLUGOwl:提出新颖的 MMLLMs 模块化训练框架,结合视觉上下文,包含 OwlEval 教学评估数据集。 6. XLLM:扩展到包括音频在内的各种模式,具有强大的可扩展性,利用 QFormer 的语言可迁移性应用于汉藏语境。 7. VideoChat:开创高效的以聊天为中心的 MMLLM 用于视频理解对话,为该领域的未来研究制定标准。 8. Sora:符合视觉模型的规模化定律,是第一个展示确认新兴能力的视觉模型,包括遵循指令、视觉提示工程和视频理解等功能,能够根据人类指令生成长达一分钟的视频。 9. CLIP:开创性的视觉语言模型,将变压器架构与视觉元素结合,能在多模态生成框架中充当图像编码器。 10. Stable Diffusion:多才多艺的文本到图像 AI 模型,采用变压器架构和潜在扩散技术生成各种风格的图像。
2025-03-20
介绍AI基本概念和目前发展阶段
AI 的基本概念: 人工智能(AI)是指让计算机模拟人类智能的技术。 主要分支包括机器学习、深度学习、自然语言处理等,它们之间存在密切联系。 目前发展阶段: 已取得显著进展,如聊天机器人具备基本对话能力,能用于客户服务和简单查询响应。 推理者如 ChatGPT 能解决复杂问题并提供详细分析和意见。 智能体虽能执行部分自动化业务,但仍需人类参与。 创新者如谷歌 DeepMind 的 AlphaFold 模型能协助人类完成新发明。 最高级别的组织型 AI 能自动执行组织的全部业务流程,但尚未完全实现。 对于新手学习 AI: 建议阅读「」熟悉术语和基础概念。 浏览入门文章了解历史、应用和发展趋势。 在「」中找到初学者课程,特别推荐李宏毅老师的课程。 通过在线教育平台按自己节奏学习并获取证书。 根据兴趣选择特定模块深入学习,掌握提示词技巧。 理论学习后进行实践,尝试使用各种产品并分享实践成果。 体验如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人。 如果希望继续精进 AI: 了解 AI 背景知识,包括基础理论、历史发展。 掌握数学基础,如统计学、线性代数、概率论。 熟悉算法和模型,如监督学习、无监督学习、强化学习。 学会评估和调优模型性能。 了解神经网络基础,包括网络结构和激活函数。
2025-03-20