Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

中美AI技术差距主要体现在哪些地方?以通信方面作为分析角度

Answer

中美在 AI 技术的通信方面存在以下差距:

  1. 技术专长:包括对 AI 技术如何用于提供产品和服务,以及技术标准的开发、使用和适用性等方面的理解。
  2. 跨监管制度的交互理解:在不同监管制度下 AI 使用案例如何相互作用方面的专业知识存在差异。
  3. 市场情报:对于 AI 技术如何颠覆现有商业模式,包括潜在机会和风险对监管目标的影响,了解程度不同。
  4. 组织能力:在有效适应 AI 应用的出现、在组织内吸收和分享知识、与提供保证技术的组织合作并制定技术标准,以及跨监管机构共享知识和合作监管等方面的能力有所不同。

需要注意的是,目前提供的内容中未明确提及中国在这些方面的具体情况,以上是基于所给资料中关于一般监管机构在 AI 相关方面能力差距的分析。

Content generated by AI large model, please carefully verify (powered by aily)

References

【法律法规】《促进创新的人工智能监管方法》.pdf

expertise.Ourresearch151has highlighted different levels of capability among regulators when itcomes to understanding AI and addressing its unique characteristics.Our engagement has alsoelicited a wide range of views on the capabilities regulators require to address AI risks and onthe best way for regulators to acquire these.103.We identified potential capability gaps among many,but not all,regulators,primarily in relationto:AI expertise.Particularly:oTechnical expertise in AItechnology.152For example,on how AI is being used to deliverproducts and services and on the development,use and applicability of technicalstandards.153oExpertise on how AI use cases interact across multiple regulatory regimes.oMarket intelligence on how AI technologies are being used to disrupt existing business models,both in terms of the potential opportunities and risks that can impact regulatory objectives.Organisational capacity.A regulator’s ability to:oEffectively adapt to the emergence of AI use cases and applications,and assimilate and sharethis knowledge throughout the organisation.oWork with organisations that provide assurance techniques(e.g.assurance service providers)and develop technical standards(i.e.standards development organisations),to identify relevanttools and embed them into the regulatory framework and best practice.oWork across regulators to share knowledge and cooperate in the regulation of AI use cases thatinteract across multiple regulatory regimes.Any attempt by a regulator to enforce a principle beyond its existing remit and powers may be legally challenged on thebasis of going beyond its legal authority.Including but not limited to Common Regulatory Capacity for AI,The Alan Turing Institute,2022.There is evidence that this is predominantly a recruitment problem.Regulators are trying to recruit but often cannot find theright candidates as they are competing for a limited supply of suitable candidates.Evidence showed that technical standards expertise varies across regulators.MHRA regularly uses and designatesstandards to clarify legal requirements,provide presumptive conformity and demonstrate the state of the art.Other regulators

拜登签署的AI行政命令_2023.10.30

[title]拜登签署的AI行政命令_2023.10.30As we advance this agenda at home,the Administration will work with allies and partners abroad on a strong international framework to govern the development and use of AI.The Administration has already consulted widely on AI governance frameworks over the past several months—engaging with Australia,Brazil,Canada,Chile,the European Union,France,Germany,India,Israel,Italy,Japan,Kenya,Mexico,the Netherlands,New Zealand,Nigeria,the Philippines,Singapore,South Korea,the UAE,and the UK.The actions taken today support and complement Japan’s leadership of the G-7 Hiroshima Process,the UK Summit on AI Safety,India’s leadership as Chair of the Global Partnership on AI,and ongoing discussions at the United Nations.The actions that President Biden directed today are vital steps forward in the U.S.’s approach on safe,secure,and trustworthy AI.More action will be required,and the Administration will continue to work with Congress to pursue bipartisan legislation to help America lead the way in responsible innovation.For more on the Biden-Harris Administration’s work to advance AI,and for opportunities to join the Federal AI workforce,visit[AI.gov](https://ai.gov/).

【法律法规】《促进创新的人工智能监管方法》.pdf

oReflected stakeholder feedback by expanding on concepts such as robustness and governance.We have also considered the results of public engagement research that highlighted anPlan for Digital Regulation,DSIT(formerly DCMS),2021.The Taskforce on Innovation,Growth and Regulatory Reform independent report,10 Downing Street,2021.The reportargues for UK regulation that is:proportionate,forward-looking,outcome-focussed,collaborative,experimental,andresponsive.Closing the gap:getting from principles to practices for innovation friendly regulation,Regulatory Horizons Council,2022.Pro-innovation Regulation of Technologies Review:Digital Technologies,HM Treasury,2023.Establishing a pro-innovation approach to regulating AI,Office for Artificial Intelligence,2022.A pro-innovation approach to AI regulationexpectation for principles such as transparency,fairness and accountability to be included withinan AI governanceframework.91oMerged the safety principle with security and robustness,given the significant overlap betweenthese concepts.oBetter reflected concepts of accountability and responsibility.oRefined each principle’s definition and rationale.Principle Safety,Security and RobustnessDefinitionandexplanationAI systems should function in a robust,secure and safe way throughout theAI life cycle,and risks should be continually identified,assessed andmanaged.Regulators may need to introduce measures for regulated entities to ensurethat AI systems are technically secure and function reliably as intendedthroughout their entire life cycle.Rationalefor theprincipleThe breadth of possible uses for AI and its capacity to autonomously developnew capabilities and functions mean that AI can have a significant impact onsafety and security.Safety-related risks are more apparent in certaindomains,such as health or critical infrastructure,but they can materialise inmany areas.Safety will be a core consideration for some regulators andmore marginal for others.However,it will be important for all regulators toassess the likelihood that AI could pose a risk to safety in their sector or

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
ai入门可以从哪些地方着手
以下是 AI 入门的着手点: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: 根据自己的兴趣选择特定的模块(比如图像、音乐、视频等)进行深入学习。 4. 对于不会代码的情况: 学习 Python 的属性和方法,包括如何为类定义属性和方法,以及如何通过对象来调用它们。 了解继承和多态,包括类之间的继承关系以及如何实现多态。 理解异常处理,包括异常的概念、异常处理的方式(如使用 try 和 except 语句)。 掌握文件操作,包括文件读写、文件与路径操作。 了解 AI 背景知识基础理论,包括人工智能、机器学习、深度学习的定义及其之间的关系。 回顾 AI 的发展历程和重要里程碑。 熟悉数学基础,包括统计学基础(如均值、中位数、方差等统计概念)、线性代数(如向量、矩阵等基本概念)、概率论(如条件概率、贝叶斯定理)。 熟悉算法和模型,包括监督学习(如线性回归、决策树、支持向量机)和无监督学习(如聚类、降维)。 5. 中学生学习 AI: 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 学习 AI 基础知识,包括基本概念、发展历程、主要技术以及在各领域的应用案例。 参与 AI 相关的实践项目,如参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响。
2024-08-20
通用人工智能技术取得显著突破,中美竞争加剧
以下是为您整理的相关内容: 2024 年 7 月 1 日: 微软 AI CEO Mustafa Suleyman 在阿斯彭思想节上表示,AI 的发展将持续对社会产生深远影响。他强调中美在技术竞争中应该寻求合作,而不仅仅是竞争。在谈到监管时,他认为监管并非邪恶,历史上技术都曾被成功监管。对于 AGI(通用人工智能),他认为应该认真对待与之相关的安全风险,并建立全球治理机制。 小伙伴整理了关于阿里 D20 的 PPT,内容主要是 AI 在设计、教育、出海方向上的内容。 举办了 AI 切磋大会,共 12 地小伙伴线下参与,一起 AI 出图、出视频、做音乐等,动手实践,享受创造的乐趣,目标是让每个人都能玩转 AI。 2024 年 11 月 6 日: 李开复在采访中表达了对 AGI(通用人工智能)霸权的担忧,指出如果美国形成 AGI 垄断,将对全球科技生态产生深远影响。他认为,中国在研发廉价模型和推理引擎方面具备优势,尽管技术上可能落后,但在应用和落地速度上可与美国竞争。他强调,追求 AGI 的同时,中国应寻找另一条生态护城河的发展路径,确保多样化应用和更广泛的市场参与。 作者艾木三号提到,Geoffrey Hinton 强调词嵌入是理解自然语言的关键,通过将文字符号转化为向量,模型能进行有效的信息编码和推理。类比能力使得模型能够发现不同事物间的共同结构,从而展现创造力。
2025-01-14
AI 辅助高中美术学生 进行创意图形的生成
以下是关于如何利用 AI 辅助高中美术学生进行创意图形生成的相关内容: 在不同的教学场景中,对 AI 的应用和态度有所不同。例如在艺术教学中,对于 AI 生成的图像可能有不同的需求。在历史课中,学生制作信息图表展示对宏观经济学原理的理解时,可能会接受 AI 生成的图像;而在美术课上,可能不太希望直接使用 AI 生成的图像。 在学习 AI 绘画方面,其在广告设计、游戏开发、影视制作、建筑设计等领域都有应用。比如在广告设计中可快速生成创意概念图,为策划提供灵感和初稿;在游戏开发中用于创建场景和角色形象,提高开发效率等。 对于小学课堂中的 AI 绘图课程设计,可先准备关键词并输入 Mid Journey 生成图片存下来展示,围绕 AI 绘图的好处展开,如创意增强,像“夜晚的未来城市风景,霓虹灯和飞行汽车”“超现实主义风景,漂浮的岛屿和瀑布云”等能创造独特且富有想象力的场景;效率提升,如“现代智能手机设计的快速草图”“新咖啡机概念的快速原型”能快速生成复杂多变的设计;降低技能门槛,像“简单卡通角色,微笑着,大眼睛”“基础的风景画,夕阳下的宁静湖泊”能帮助非专业者创作;探索新的艺术形式,如“数字抽象艺术,鲜明的色彩和几何形状”“算法生成的艺术作品,具有分形图案”能探索全新艺术形式的潜力。 综合以上,对于高中美术学生进行创意图形的生成,可借鉴上述思路和应用场景,注重培养学生的创意、效率和对新艺术形式的探索。
2024-09-25
中国大模型与世界差距
目前中国大模型与世界仍存在差距,但也有了显著进步。 在 2023 年度中文大模型基准测评中,国外的 GPT4 Turbo 总分 90.63 分遥遥领先,国内最好的模型文心一言 4.0(API)总分 79.02 分,与 GPT4 Turbo 有 11.61 分的差距,与 GPT4(网页)有 4.9 分的差距。国外模型平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右。 不过,过去 1 年国内大模型进步明显,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个,如百度的文心一言 4.0、阿里云的通义千问 2.0 等都有较好表现。在专业与技能方面,GPT4 Turbo 领先幅度较大,但国内的文心一言 4.0 表现不俗。总体来看,国内第一梯队大模型与国外最好模型在专业与知识能力上仍有较大距离,但差距正在不断缩小。 另外,国内开源模型在中文上表现优于国外开源模型。从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。
2025-02-27
请简单评价你和deepseek的差距
DeepSeek 与其他相关模型存在多方面的差异和特点: 1. 训练成本方面:DeepSeek 的训练成本远高于传闻,总计约 13 亿美元,且定价低于实际成本,导致高额亏损。 2. 竞争优势方面:以低成本开发顶级 AI 模型的 Mistral AI 被 DeepSeek 迅速赶超,DeepSeek 的“极简算力”模式可能削弱 Mistral 的竞争优势。 3. 发展模式方面:DeepSeek 有点像 2022 年之前的 OpenAI 和 DeepMind,具有非营利性学术研究机构的特点。它没有像很多中国 AI 公司那样注重产品运营、营销和推出各种开发者项目,目前似乎不打算做生意。 4. 技术突破方面:DeepSeek 发布的 V3 以低成本实现了高性能,成为其发展的里程碑。与 OpenAI 相比,DeepSeek 致力于用低成本资源实现高效,达到里程碑的时间更短,且训练与推理并重。
2025-02-08
中国AI工具与美国的差距
在 AI 工具方面,中国与美国存在一定差距。 从访问量最大的 AI 工具及流量行为来看,在分析的前 50 名人工智能工具的地理行为方面,中国排名第 47 位。美国稳居第一,在研究的 12 个月里,美国人工智能行业的访问量达到了 55 亿次,占总流量的 22.62%。尽管美国人口少于中国和印度,但美国拥有价值超过 1.8 万亿美元的全球领先科技市场。 不过,在 2024 年,国内涌现出类似可灵、即梦、智谱清影等一系列 AI 生成视频工具,其生成结果甚至远超国外。但需要注意的是,某些报告中对于中国的 AI 生成图、生成视频的工具未展开详细说明,不能仅据此就认为中国在该功能的 AI 工具上落后于国外。
2024-12-10
目前国产AI对比国外AI,存在哪些不足和差距,我要实事求是的回答
目前国产 AI 对比国外 AI 存在以下不足和差距: 1. 在通用语言模型方面,如 ChatGPT 和 GPT4 出现后,国内与国外拉开了约 2 年的技术差距。国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距,甚至还不如临时拼凑的 Mistral 团队的水平。 2. 国内部分企业可能存在骄傲自大的情况,也可能被之前 Google 主推的 T5 技术路线带偏,同时 AGI 影响巨大,可能存在国外相关机构与 OpenAI 有特殊沟通而国内未有的情况。 3. 2023 年上半年国内笃信靠资金和卡能实现突破,但下半年纷纷转向“垂直应用”“商业化”,不提 AGI,这种转向可能是短视和致命的。 4. 大厂虽具备冲击 AGI 的资源,但受内部短期考核压力影响,多数力量用于卷新产品圈地盘和向上汇报工作,实际效果未达预期,且背负较多其他业务和政治考量。 不过,在图像类 AI 产品方面,国内产品发展迅速,部分产品如通义万相在中文理解和处理方面表现出色,具有独特优势。在 AI 生成视频工具领域,国内涌现出一系列工具,其生成结果在某些方面甚至远超国外。
2024-11-03
国产AI与国外AI的实际差距
国产 AI 与国外 AI 存在一定的差距,但情况较为复杂,且在不同方面表现有所不同。 在 2023 年之前,国内 AI 行业曾自认为与美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。当时国内出现了从追求创造国产 AGI 到转向做“垂直应用”“商业化”的转变。国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 仍有差距。大厂在人才、GPU、数据和资金储备上有冲击 AGI 的能力,但实际效果尚不明确,且受内部短期考核压力等因素影响。 然而到了 2024 年,竞争达到白热化阶段。在文本到视频扩散模型方面,Google DeepMind 和 OpenAI 展示了强大的成果,但中国的相关情况在报告中未详细说明,不过国内也涌现出了一系列表现出色的 AI 生成视频工具,生成结果甚至远超国外。Llama 3.1 在某些任务中能与 GPT4 相抗衡,而中国的一些模型如由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得优异成绩,尤其在数学和编程方面表现出色,且在某些子任务上挑战了前沿水平。中国模型在计算效率、数据集建设等方面各有优势,能弥补 GPU 访问的限制等不足。
2024-11-03
中国与国外AI模型的差距
目前中国与国外的 AI 模型存在一定差距,但也有自身的优势和进步。 在一些方面,国外模型如 Llama 3.1 在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡,首次缩小了开放模型与专有前沿的差距。谷歌 DeepMind 与纽约大学团队的 AlphaGeometry 在奥林匹克级几何问题基准测试中表现出色。GPT 4 Turbo 在 SuperCLUE 测评中的总分遥遥领先,国外模型的平均成绩也相对较高。 然而,中国的 AI 模型也在不断发展。由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得优异成绩,尤其在数学和编程方面表现突出。国内的最强模型能与美国生产的第二强前沿模型竞争,在某些子任务上挑战了 SOTA。国内模型更注重计算效率,以弥补 GPU 访问的限制,并学会更有效地利用资源。例如 DeepSeek 在推理过程中通过多头隐式注意力减少内存需求,并且改进了 MoE 架构。零一万物更加关注数据集的建设。 在专项基准如语言与知识方面,GPT4 Turbo 依然领先,但国内大模型也表现相对较好,有 14 个模型的得分高于 GPT3.5,有 9 个模型的得分高于 GeminiPro。在中文语言与知识能力上,国内大模型已基本追赶上国外头部大模型,未来有可能率先形成超越。 总体而言,国内外差距依然存在,但国内大模型在过去一年有了长足的进步,平均水平差距在缩小。
2024-11-01