Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

目前我们里AGI还有多远?

Answer

目前还没有看到阻止 AGI 出现的硬性限制,我们距离 AGI 只有几年的距离。和大脑相比,现在的模型虽使用了比人脑多得多的数据,但效果仍有差距,“自我对弈”可让模型精炼数据向大脑能力靠拢,其与人脑的“想象力”有相似之处。大模型的“想象力”“取悦能力”比“逻辑能力”更早成熟,多模态大爆发证明了 AGI 相对“窄 AI”的代际优越性,深度压缩是大模型的核心能力,端上智能越来越近,中美 AI 生态各自发展,2023 年技术差距没有缩小。但目前大多数的“AI 应用/AI 转型”还在走“数字化转型”的老路,AI 的力量应更多用于对未来业务的重新定义,而非仅优化现有业务流程。

Content generated by AI large model, please carefully verify (powered by aily)

References

AGI万字长文(上)| 2023回顾与反思

论文地址:https://arxiv.org/abs/2401.01335v1和大脑相比,现在的模型本身使用了比人脑接受得多得多数据,但效果和人脑还有差距。那么,最自然的观点就是模型并没有充分使用这些数据。我们可以认为,“自我对弈”就是一种让模型不断精炼数据,向大脑能力靠拢的方式。再做一个更大胆的猜想:“自我对弈”和人脑的“想象力”是有相似之处的——大脑也是通过“想象”自己创造出合成数据,用于自我学习。综合来讲,目前还没有看到阻止AGI出现的硬性限制,而且我们距离AGI只有几年的距离。之后,跑步进入硅基文明的碳基生物会活得怎么样呢?Image:"Crumble of Liberty"with Dall-E

AGI万字长文(上)| 2023回顾与反思

原创Lian et Zian普通人的AI自由2024-02-18 16:38链接:https://mp.weixin.qq.com/s/LVgcoT_aZwANscLpRqTg5w[heading2]太长不看版[content]2023年大众对AI的看法:这是啥->好像也没那么厉害->和我没太大关系目前还没有看到阻止AGI出现的硬性限制,且我们距离AGI只有几年距离大模型的“想象力”、“取悦能力”比“逻辑能力”更早成熟应用层没有独角兽;创业者最大的敌人是GPT官方技术加速迭代是常态,不能等到“技术稳定”再出手多模态大爆发:再次证明了AGI相对“窄AI”的代际优越性Agent/代理暂时还没出现,记忆仍是瓶颈;核心问题是还没有“人的模型”深度压缩是大模型的核心能力,端上智能越来越近中美AI生态各自发展,2023年技术差距没有缩小Image:"Explosion of AGI",with Dall-E[作者]Lian,MK

AGI 万字长文(下)| 2024,分叉与洪流

现在的AI不仅仅是流量密码,也是股价密码;于是,是个公司都会想方设法往AI上沾边。私下也有很多朋友问我:美妆/白酒/奢侈品如何联动AI?AI如何赋能农业/传统制造业?AI如何赋能HR/行政/采购/公关?……其实,大多数都有点难。因为AI也并不是万能的,以及我们和AGI还差的很远。像我去年12月份的文章[《AI原生公司|未来打工人》](http://mp.weixin.qq.com/s?__biz=MzkyMTY1MTM4Mw==&mid=2247483844&idx=1&sn=3adfc54f294c53fdf51105cdb4e23ec3&chksm=c181101cf6f6990af5116997115fdfcf95360bb55a14f05ea9aed00239c88dfb440d03055533&scene=21#wechat_redirect)写的,目前大多数的"AI应用/AI转型”还在走“数字化转型”的老路:把AI往现有流程上一套,还在讲“固化流程”、“节约成本”的故事。但在技术加速迭代的今天,这样做基本就等于“做出来就是过时的”:把企业的业务模式凝固在今天,同时又剥夺了企业主动进化的能力。现在这种情况下反映出来的,更多是人们对于AI的焦虑:所以才会希望AI拿来就能用,马上能起效果。但我们不能止于焦虑:AI的力量并不应该只用在现有业务流程的优化上,而更应该用在对于未来业务的重新定义之上。这才是“AI原生公司”应该的做法。就像在电力发明的时候,我们不应该从“如何让电力赋能马车”出发,而应该从“电力能创造和满足什么新的需求”出发。

Others are asking
什么是AGI
AGI 即人工通用智能,通常被定义为一种能够完成任何聪明人类所能完成的智力任务的人工智能,其能力不局限于特定领域。 例如,OpenAI 的相关计划中,Q2025(GPT8)将实现完全的 AGI,但因一些原因有所推迟。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。 在关于 AGI 实现后未来 20 年人类社会的变革的研究中,AGI 的出现被视为人类历史上具有转折意义的事件。 Sam Altman 认为,呈现人工通用智能特征的系统正浮现,人工通用智能通常指一种能够在许多领域内以人类水平应对日益复杂的问题的系统,它是人类进步脚手架上的另一个工具。
2025-04-18
什么是AGI
AGI 即人工通用智能,通常指能够完成任何聪明人类所能完成的智力任务的人工智能,其能力不局限于特定领域。例如,能够在许多领域内以人类水平应对日益复杂的问题。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步。AGI 的出现被视为人类历史上具有转折意义的事件,当 AGI 真正实现并可能迅速发展为超人工智能(ASI)时,人类社会将在随后的二十年里经历深刻变革,包括社会结构、价值观、权力格局、人类角色等多个方面。我们的使命应是确保 AGI 造福全人类,从某种意义上说,AGI 是人类进步脚手架上的另一个工具。
2025-04-15
waytoagi 简单介绍
“通往 AGI 之路”(WaytoAGI)是一个致力于人工智能学习的中文知识库和社区平台: 旨在为学习者提供系统全面的 AI 学习路径,涵盖从基础概念到实际应用的各个方面,帮助用户有效地获取 AI 知识,提高自身能力。 由开发者、学者和 AI 爱好者共同参与建设,提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 其品牌 VI 融合了独特的设计元素: 选择彩虹色作为主要的配色方案,代表多样性、包容性和创新。 标志性图案是一只鹿,与“路”谐音,象征着通往 AGI 未来的道路,寓意优雅与智慧。 选用简洁现代的非衬线字体,强调信息传达的清晰度和直接性。 此外,WaytoAGI 里有个离谱村: 是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易、更感兴趣。 参与者不分年龄层,一起脑洞和创意,都可以通过 AI 工具快速简单地创作出各种各样的作品。 离谱村是一个没有被定义的地方,每个人心中都有自己想象中的离谱村,是灵魂的避风港,激励着每一个生命体发挥其无限的想象力,创造属于自己的独特生活方式。 如果您对 AI 学习感兴趣,加入“通往 AGI 之路”社区将是一个不错的选择。在这里,您可以获取最新的 AI 知识,参与实践活动,与志同道合的学习者共同成长。
2025-04-14
我想将常用的AI入口手机放在一张网页上,该如何设置waytoAGI页面
以下是关于将常用的 AI 入口放在一张网页上设置 WaytoAGI 页面的方法: 1. 点开链接就能看:不用注册,不用花钱,直接点击。 2. 想看啥就看啥:比如您想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分。内容分得清清楚楚,想学啥都能找到。 3. 有问题还能问:如果看了还有不懂的,或者想跟别人交流,可以加入社群,大家一起讨论。 另外,关于使用 Cursor 制作您的第一个主页: 1. 在搞定一个非常简单的小游戏之后,可以做一个自己的个人介绍网站。可以先看看官网,比如 allinagi.com.cn、sboat.cn。假设要做一个《全 AI 自动驾驶的火星登陆飞船》项目,首先会有一个初步简单的项目介绍,比如 WaytoMars 是一个制造、运营全 AI 自动驾驶的火星登陆飞船公司品牌,有着领先全球的技术实力、人才优势,预计在 2030 年推出可承载上千人,五星豪华级的全 AI 自动驾驶的火星登陆飞船。有了项目介绍后,让 AI 帮助生成一个具有前端大师级审美、极富科幻感的网站首页。首先,新建一个 waytomars 文件夹并打开,在 AI 对话框中输入上述的话,一路等待 AI 制作以及加入您的修改意见即可。 2. 如何让别人看到您的作品预览:通过将项目文件夹整体上传,就可以生成一个临时浏览链接,在不需要域名和服务器的情况下让外部也能够看到您的作品。注意:如果发现 cursor 有所卡顿,注意是不是 AI 让您在终端区或者对话区确认重要操作,左下角将 ask every time 修改为 auto run 就可以全自动化了。 WaytoAGI 就是一个帮您快速入门 AI、学会用 AI 搞事情的“武器库”。不管您是完全不懂 AI 的小白,还是想用 AI 赚钱的普通人,它都能帮到您。AI 是未来的趋势,现在学一点都不晚,如果您想了解 AI、用 AI、甚至靠 AI 搞钱,WaytoAGI 就是您最该看的“AI 宝典”。
2025-04-14
WaytoAGI:找到了AI知识付费的免费源头,让更多人因AI而强大!
WayToAGI(通往AGI之路)是一个由热爱AI的专家和爱好者共同建设的开源AI知识库。它具有以下特点和优势: 1. 整合了各种AI资源,让大家能轻松学习AI知识,应用各类AI工具和实战案例。 2. 提供了一系列开箱即用的工具,如文生图、文生视频、文生语音等的详尽教程。 3. 时刻追踪AI领域最新进展并更新,每次访问都有新收获。 4. 涵盖丰富的内容,包括AI视频、AI绘画、AI音乐、AI艺术、AI即兴戏剧、AI Agent共学等。 5. 为用户提供全面系统的AI学习路径,辅助思考,让学习过程少走弯路。 6. 自 2023 年 4 月 26 日诞生,在无推广情况下,一年已有超 70 万用户和超千万次访问量。社群的口号是让更多的人因 AI 而强大,有很多学社和共学共建的活动。访问“waytoagi.com”即可找到社群。
2025-04-12
身份是小学语文老师,如何自学waytoAGI
以下是为您整理的相关内容: 1. 10 月 9 日小作业中提到:熟悉 waytoagi 知识库,并找到 Prompt 提示词框架文章,给出两个提示词框架和生成结果。框架一是“CRISPE 框架”,处理小学六年级同学丢钱引发的同桌纠纷,给出三种解决方式,包括调查真相、教育双方,全班寻找失物、避免误解,引导调解与反思。生成结果为详细的解决步骤。同时提到人工智能时代的三个基石是数据、算法、算力,数据和算法可在开源数据库等找到,算力可在云计算平台如 AWS、Google Cloud、Microsoft Azure 找到。 2. 6 月 11 日 AI 秒学团队中,有人分享了搭建聊天功能工作流的经历,提到在实践中不断迭代、调整和优化。一位纯社科背景的高校老师感谢 way to AGI 带文科生进入 agent 的“坑”,并提到小团队给予的帮助。 3. 问卷中,刘翔宇表示自己是国内一线互联网 AI 产品经理,愿意共同维护 WaytoAGI 开源社区,学习目标是了解 Comfy 基础理论等多方面,所在城市为北京。
2025-04-12
我们离AGI还有多远
目前还没有看到阻止 AGI 出现的硬性限制,我们距离 AGI 只有几年的距离。例如,一些研究认为,大模型的“想象力”、“取悦能力”比“逻辑能力”更早成熟,多模态大爆发再次证明了 AGI 相对“窄 AI”的代际优越性。同时,和大脑相比,现在的模型虽使用了比人脑多得多的数据,但效果仍有差距,不过“自我对弈”可能是让模型向大脑能力靠拢的方式。此外,展望 2025 年,首批 AI Agent 将开始融入劳动力市场,随着通用人工智能(AGI)的脚步日益临近,相关探索仍在继续。
2025-03-19
你离强人工智能还差多远,缺乏什么要素
目前实现强人工智能还面临一些挑战,缺乏以下要素: 1. 对世界力量的感知:例如加速度、重力等,当机器人摔跤或被推动时,还不能很好地应对。 2. 与物理世界的互动能力:包括知道别人推它时的情况,拿鸡蛋的重量感知,以及如何打鸡蛋等。 3. 更深入的理解能力:需要更深入地理解训练过程中发生的事情,洞悉事物本质和根本原因。 4. 大量的实验迭代:没有捷径,需要通过大量试错来不断改进。 5. 可靠性:需要让模型的输出更值得信任,以达到整个系统的成熟度要求。 6. 控制能力:能够指导和控制模型的行为,以解决更多问题。 此外,具身智能作为人工智能与物理世界交互的一种范式,强调智能体与物理环境之间的交互,其三要素包括本体(硬件载体)、智能(大模型、算法等)、环境,行动分为感知、决策、行动、反馈四个模块,并形成闭环。不同环境下需要不同形态的硬件本体适应,智能算法可通过本体传感器感知环境、做出决策并影响环境,还能通过交互学习和拟人化思维适应环境实现智能增长。
2024-12-10
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
完全免費的AI工具目前有哪些
目前完全免费的 AI 工具包括: 1. 麻省理工学院(MIT)为 8 18 岁孩子推出的 AI 课程 Day of AI,包含在 MIT 的 RAISE 项目中。不过该课程资源主要面向家长和老师群体,大孩子可自学,小孩子可能需要家长辅助。 2. 元子提到的一些能让普通人最低成本直接上手试的 AI 工具,包括聊天工具、绘画工具、视频工具、音乐工具等,但未具体指明具体的工具名称。
2025-04-13
gemini-2.5目前是什么水平
Gemini 2.5 是一款全能思考模型,具有以下特点和优势: 多领域达到 SOTA 水平,逻辑、代码、任务处理能力大幅提升。 支持 100 万 tokens 上下文,具备强大的阅读能力。 统一架构原生多模态支持,图文音码协同处理,并非外挂而是原生融合。 您可以通过以下链接获取更多详细信息:https://www.xiaohu.ai/c/xiaohuai/googlegemini25proexperimental
2025-04-13
AI行业目前的产业链是怎么样的
AI 行业的产业链大致可分为上游的基础设施层(数据与算力)、中游的技术层(模型与算法)、下游的应用层(应用与分发)。 上游基础设施层:布局投入确定性强,但涉及海量资金投入,入行资源门槛高,未来国内可能更多由“国家队”承担重任。普通人若无强资源,可考虑“合作生态”的切入机会。 中游技术层:处于技术爆炸阶段,迭代速度极快。规模不大的团队或个人需慎重考虑技术迭代风险,基础通用大模型非巨无霸公司不建议考虑,竞争激烈,最终赢家通吃。 下游应用层:是广阔蓝海,尽管从业者增加并涌现出一些产品,但针对行业/细分领域的成熟应用产品不多,“杀手级”应用稀少。普通个体和小团队强烈推荐重点布局,拥有超级机会和巨大发展空间。 此外,据 SensorTower 统计,2024 全年全球 AI 移动应用内付费收入预计为 30 亿美元,图像和视频类 AI 应用占据主导地位,对话机器人类别排名第二。从地区分布来看,北美和欧洲贡献了三分之二的市场份额。 美国红杉资本指出,AI 供应链从下到上分为六层,各层盈利能力存在显著差异。第一层的芯片代工厂和第二层的芯片设计商保持高利润水平;第三层的工业能源供应商受益良多;第四层云厂商处于重金投入阶段;第五层的 AI 模型开发商面临亏损;第六层的应用服务商充满潜力,但市场规模有限。大型云厂商是整个供应链的“链主”。行业格局方面,头部阵营基本稳定。
2025-04-13