Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

帮我整理一下国外和国内现在AI的总体情况,给单位领导介绍AI使用

Answer

当前AI的全球与中国现状

全球AI发展概况

  1. 技术进步与应用

    • 生成式AI:生成式AI在过去几年里取得了重大进展,特别是在自然语言处理和图像生成方面。2023年,生成式AI吸引了252亿美元的投资,比前一年增长了近九倍。
    • 多模态AI:多模态AI能够处理文本、图像和音频等多种形式的数据,提升了虚拟助手和客户服务系统的能力。例如,虚拟助手不仅能回复文本信息,还能通过分析客户的语音和视频数据提供个性化服务。
  2. 行业应用

    • 医疗、金融与法律:这些领域通过小型AI模型的应用来实现本地化处理,保护数据隐私的同时提升效率。例如,AI在医疗中用于诊断和治疗建议,在金融中用于风险评估和自动化交易。
    • 企业智能化:通过API驱动的AI和微服务,企业能够更快速地开发复杂的AI应用,提高生产力。例如,零售企业通过AI实现个性化营销和库存管理,显著提升客户服务效率和销售策略。
  3. 法规与伦理

    • 欧洲AI法案:欧盟正在制定《人工智能法案》,这是全球首个全面的AI法律框架,旨在规范AI应用,保护用户隐私并防止滥用。例如,该法案禁止使用面部识别进行情绪监控和基于社交行为的评分。
    • 美国与中国的监管:美国发布了一系列行政命令和指南,要求联邦机构在使用AI时遵循安全和道德标准。中国则更加积极地推动AI法规,并要求生成式AI内容的真实性和准确性。

中国AI发展概况

  1. 技术领先与应用广泛

    • 中国在AI技术的研发和应用上一直处于世界前列。中国公司在语音识别、图像处理和自动驾驶等领域取得了显著成果。例如,百度的无人驾驶汽车和科大讯飞的语音助手都是全球领先的AI产品。
    • 政策支持:政府大力支持AI发展,发布了一系列政策和资金支持计划。例如,《新一代人工智能发展规划》提出了到2030年成为全球AI创新中心的目标。
  2. 产业布局

    • 智慧城市与公共服务:AI在中国的智慧城市建设中扮演重要角色,通过智能交通管理、环境监测和公共安全系统等提升城市管理效率。
    • 金融与零售:金融机构利用AI进行风险控制和反欺诈,零售企业通过智能推荐系统提升用户体验和销售业绩。
  3. 挑战与监管

    • 隐私与安全:随着AI应用的扩展,数据隐私和安全问题也日益突出。中国政府要求AI产品必须明确标示AI生成内容,并禁止利用AI进行价格歧视和虚假信息传播。
    • 伦理与公平:AI在应用过程中也面临伦理和公平性问题,特别是在就业替代和算法偏见方面。政府和企业正在积极探索解决方案,确保AI的公平使用。

总结

全球和中国在AI领域都取得了显著进展,AI技术已经广泛应用于各个行业,提高了生产效率和服务质量。然而,随着AI技术的迅速发展,数据隐私、安全和伦理问题也愈发重要。各国政府和企业需要共同努力,制定合理的政策和法规,确保AI技术在安全、可靠和公平的基础上持续发展。

Content generated by AI large model, please carefully verify (powered by aily)

References

拜登签署的AI行政命令_2023.10.30

As we advance this agenda at home,the Administration will work with allies and partners abroad on a strong international framework to govern the development and use of AI.The Administration has already consulted widely on AI governance frameworks over the past several months—engaging with Australia,Brazil,Canada,Chile,the European Union,France,Germany,India,Israel,Italy,Japan,Kenya,Mexico,the Netherlands,New Zealand,Nigeria,the Philippines,Singapore,South Korea,the UAE,and the UK.The actions taken today support and complement Japan’s leadership of the G-7 Hiroshima Process,the UK Summit on AI Safety,India’s leadership as Chair of the Global Partnership on AI,and ongoing discussions at the United Nations.The actions that President Biden directed today are vital steps forward in the U.S.’s approach on safe,secure,and trustworthy AI.More action will be required,and the Administration will continue to work with Congress to pursue bipartisan legislation to help America lead the way in responsible innovation.For more on the Biden-Harris Administration’s work to advance AI,and for opportunities to join the Federal AI workforce,visit[AI.gov](https://ai.gov/).

【法律法规】《促进创新的人工智能监管方法》.pdf

determines HM Government’s approach regarding AI-enabled military capabilities.We willensure appropriate coherence and alignment in the application of this policy through a contextspecific approach and thereby promote UK leadership in the employment of AI for defencepurposes.Ahead of introducing any statutory duty to have due regard to our principles,and inadvance of introducing other material iterations of the framework,we will consider whether

拜登签署的AI行政命令_2023.10.30

Catalyze AI research across the United States through a pilot of the National AI Research Resource—a tool that will provide AI researchers and students access to key AI resources and data—and expanded grants for AI research in vital areas like healthcare and climate change.Promote a fair,open,and competitive AI ecosystem by providing small developers and entrepreneurs access to technical assistance and resources,helping small businesses commercialize AI breakthroughs,and encouraging the Federal Trade Commission to exercise its authorities.Use existing authorities to expand the ability of highly skilled immigrants and nonimmigrants with expertise in critical areas to study,stay,and work in the United States by modernizing and streamlining visa criteria,interviews,and reviews.Advancing American Leadership AbroadAI’s challenges and opportunities are global.The Biden-Harris Administration will continue working with other nations to support safe,secure,and trustworthy deployment and use of AI worldwide.To that end,the President directs the following actions:Expand bilateral,multilateral,and multistakeholder engagements to collaborate on AI.The State Department,in collaboration,with the Commerce Department will lead an effort to establish robust international frameworks for harnessing AI’s benefits and managing its risks and ensuring safety.In addition,this week,Vice President Harris will speak at the UK Summit on AI Safety,hosted by Prime Minister Rishi Sunak.Accelerate development and implementation of vital AI standards with international partners and in standards organizations,ensuring that the technology is safe,secure,trustworthy,and interoperable.Promote the safe,responsible,and rights-affirming development and deployment of AI abroad to solve global challenges,such as advancing sustainable development and mitigating dangers to critical infrastructure.Ensuring Responsible and Effective Government Use of AI

Others are asking
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
ai写程序
以下是关于使用 AI 写程序的相关内容: 1. 对于技术纯小白: 从最基础的小任务开始,让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,以学会必备的调试技能。 若学习写 chrome 插件,可让 AI 按照最佳实践生成简单的示范项目,包含全面的典型文件和功能,并讲解每个文件的作用和程序运行的逻辑。若使用 o1mini,可在提示词最后添加生成创建脚本的要求,并请教如何运行脚本(Windows 机器则是 create.cmd)。 2. 明确项目需求: 通过与 AI 的对话逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,在后续开发时每次新起聊天将文档发给 AI 并告知在做的功能点。 3. 在独立游戏开发中的经验: 单独让 AI 写小功能没问题,但对于复杂的程序框架,可把不方便配表而又需要撰写的简单、模板化、多调用 API 且牵涉小部分特殊逻辑的代码交给 AI。 以 Buff 系统为例,可让 AI 仿照代码写一些 Buff。但目前 Cursor 生成复杂代码需要复杂的前期调教,ChatGPT 相对更方便。 教 AI 时要像哄小孩,及时肯定正确的,指出错误时要克制,不断完善其经验。 4. 相关资源和平台: AI 写小游戏平台:https://poe.com/ 图片网站:https://imgur.com/ 改 bug 的网站:https://v0.dev/chat 国内小游戏发布平台:https://open.4399.cn/console/ 需要注意的是,使用 AI 写程序时,对于技术小白来说,入门容易但深入较难,若没有技术背景可能提不出问题,从而影响 AI 发挥作用。
2025-04-19
国外免费的动作模仿AI
以下为您介绍国外免费的动作模仿 AI: 在 SD 中,ControlNet 是一个强大的插件,包含姿态约束类预处理器。可以使用扩展图片的方法将图片发送到图生图进行处理,还能使用 tile 模型细化。若无法找到满足需求的动作图片,可在【扩展】【加载扩展列表】中搜索【posex】插件,或拷贝插件文件夹至指定目录并重启软件。在 ControlNet 界面,可通过拖动鼠标左键旋转视角、中键缩放视角、右键拖动视角,玩坏了还能重置镜头和动作。 Viggle 是一个有免费额度的 AI 视频工具,其网址为 http://viggle.ai,discord 免费体验地址为 https://discord.com/invite/viggle 。它支持图片+动作视频转视频、图片+文字动作描述转视频、文字转视频,可完成视频换脸。其功能包括/mix、/animate、/ideate、/character、/stylize 等,官方提供了多种动作提示词可供参考,提示词地址为 https://viggle.ai/prompt 。
2025-03-31
现在我想通过一段描述生成一段视频,那么我现在用哪一个?工具是最好的呢。我想说的是现在因为在国内访问不了国外的网站,那么国内有没有哪些应用比较功能强大的是视频生成工具。
以下是一些在国内可用且功能强大的视频生成工具: 1. VIGGLE:可以直接通过文字描述让任何静态图动起来,能做各种动作,如跳舞等。其核心技术基于 JST1 模型,能理解真实世界的物理运动原理,生成的视频很真实,还能直接文字生成视频,进行各种角色混合和动作替换。核心功能包括可控制的视频生成、基于物理的动画、3D 角色和场景创建。 2. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 3. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。 4. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 5. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 6. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 此外,还有以下根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,用户提供文本描述即可生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,您可以根据自己的具体情况进行选择。需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-03-23
有哪些国外免费的大模型API可以使用
以下是一些国外免费的大模型 API 可供使用: 1. 谷歌的 Gemini 大模型(https://ai.google.dev/)(gemini 1.5),但使用可能需要给服务器挂梯子。 2. 海外版 Coze(https://www.coze.com/)的 GPT4 模型,能图片识别,使用可能需要给服务器挂梯子。 此外,还有以下相关信息: 1. 阿里的通义千问大模型接口(https://dashscope.console.aliyun.com/),创建 API key 即可使用。 2. 智谱 AI(ChatGLM)(https://open.bigmodel.cn/)、科大讯飞(SparkDesk)(https://xinghuo.xfyun.cn/sparkapi)也有免费接口,但国内的大模型大多限制一定免费额度的 Token。 对于 OpenRouter 新发布的功能 BYOK(Bring Your Own API Keys),它是个第三方 Key 集成功能,将 xAI、OpenAI、Mistral 等数十个平台的 Key 集中在一起,目前支持白“赚”的平台包括 AI Studio/Cohere/DeepSeek/Mistral/SambaNova/Together/xAI 等。 以 silicon 为例,其有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用,另赠送 14 元体验金,有效期未知,是个人认为 API 接口方便实惠的选择。注册和使用地址为:,邀请码:ESTKPm3J。注册登录后,单击左边栏的 API 密钥,单击新建 API 密钥,单击密钥即可完成 API 密钥的复制。
2025-03-19
我想整理现在国内和国外的大语言模型产品并需要你整理差异还有时间轴
以下是对国内外大语言模型产品的整理及差异: 国内大语言模型: 通用模型:如文心一言、讯飞星火等,能够处理自然语言。 垂直模型:专注于特定领域,如小语种交流、临床医学、AI 蛋白质结构预测等。 具有代表性的项目:“悟道・天鹰”(北京智源人工智能研究院)是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型;文心一言(百度)可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。 国外大语言模型: 具有代表性的项目:GPT4(OpenAI)是目前最先进的自然语言生成模型,可用于回答问题、撰写文章等;Gemini Ultra(Google)是多模态人工智能模型,采用神经网络架构,对标 GPT4,可用于回答问题、生成代码、处理文本等;Claude 3 Opus(Anthropic)是多模态模型,能处理超过 1 百万 token 的输入,具有实时聊天、数据处理、分析预测等功能,实现了接近完美的召回率。 时间轴方面: 国内:去年 7 月大模型百花齐放。 国外:相关模型也在不断发展和更新。 在工作原理上,大语言模型通常包括训练数据、算力、模型参数等要素。在训练数据一致的情况下,模型参数越大能力越强。Transformer 架构是大语言模型训练的常见架构,具备自我注意力机制能理解上下文和文本关联。同时,大模型可能存在幻觉,即因错误数据导致给出错误答案,优质数据集对其很重要。此外,Prompt 分为 system prompt、user prompt 和 assistant prompt,写好 Prompt 的法则包括清晰说明、指定角色、使用分隔符、提供样本等。还可以基于通用大模型进行 Fine tuning 微调,以适应特定领域的需求。
2025-03-07
请以轨道式、巡检机器人为关键词查找国外文献十五篇,要求这些文献真实可靠并且有一定的影响力,同时附上原文链接
很抱歉,目前没有查找到以轨道式、巡检机器人为关键词的国外文献十五篇及原文链接。建议您通过以下途径进行查找: 1. 学术数据库,如 Web of Science、Scopus 等。 2. 相关领域的专业学术期刊网站。 3. 大学图书馆的电子资源库。
2025-03-06
国内有多少种网盘?自费如何?哪款网盘性价比较高?国外呢?
目前国内网盘种类众多,常见的有百度网盘、阿里云盘、腾讯微云等。其自费方式和价格各有不同。百度网盘的收费套餐多样,根据存储空间和功能有所区别;阿里云盘也有相应的付费方案;腾讯微云同样提供多种付费选择。 关于哪款网盘性价比较高,这取决于您的具体需求。如果您对存储空间需求较大,阿里云盘可能是一个不错的选择;如果您更注重资源的丰富性和分享的便捷性,百度网盘可能更适合。 国外的网盘也有不少,如 Dropbox、Google Drive 等,但在国内使用可能存在网络限制等问题。
2025-02-25
整理会议纪要的prompt
以下是一些关于整理会议纪要的 prompt: 【?会议精要】整理生成高质量会议纪要,保证内容完整、准确且精炼。 会议记录员:将会议浓缩成简明摘要,包括讨论主题、重点内容、行动事项。 CEO 秘书会议纪要:专注于整理和生成高质量的会议纪要,确保会议目标和行动计划清晰明确。需严格遵守信息准确性,不对用户提供的信息做扩写,仅做信息整理,将一些明显的病句做微调。
2025-04-15
有没有aI工具可以把小红书收藏的内容帮我整理出来
以下是一些可以帮助您整理小红书收藏内容的 AI 工具: 1. Felo:这是一个浏览器插件,会自动调用您的小红书网页搜索获取笔记内容,然后引用小红书的笔记内容来回答您的问题。它输出的攻略详尽,使用结构化语言梳理路径,比直接看小红书博主的笔记更高效,因为能避免 emoji 和排版不清晰的干扰。 2. 点点 生活搜索助手:小红书自家推出的 AI 搜索产品,目前还在内测中。在微信小程序上搜索“点点 生活搜索助手”即可使用。它在回答问题时会插入相应图片,免去重新打开笔记看图片的麻烦。 3. 暂时未明确提及其他专门用于整理小红书收藏内容的工具,但您可以参考以下相关资源: 一些小红书优质科技内容案例,如: 关于字节火山 DeepSeek 系列 API 的获取及使用方法,您可以参考:
2025-03-30
如果我要把多篇会议纪要整理成一片行业调研报告,需要如何做
要将多篇会议纪要整理成一篇行业调研报告,您可以按照以下步骤进行: 1. 让 AI 阅读学习:提供一篇优秀的行业调研报告,让 AI 总结其中的方法论,输出一份“行业调研报告”的研究方法和操作框架。 2. 问 AI:询问文章在收集行业数据时所使用的一手数据和二手数据,并让其推荐一些靠谱的行业资料收集网站。 3. 要求 AI:表明您想参考以上内容写一份特定“XXX 行业调研报告”,让其作为“行业调研报告撰写专家”,为您推荐 10 个“XXX 行业”信息网站和 5 个“XXX 行业”研究微信公众号,并输出一份“XXX 行业调研报告”框架。 4. 要求 AI:针对上述“XXX 行业调研报告”框架,丰富每一章节内容,每章内容字数大于 200 字。 5. 经过以上 4 个步骤,AI 会为您生成一个“XXX 行业调研报告”的初稿。之后,您可以根据自身需求,让 AI 进一步完善每一个章节的内容,并结合自己的独特经验和知识,对文章内容进行润色和调整。 需要注意的是,要使调研报告有深度,可以通过以下两个途径: 1. 自身对行业比较了解,整理深度洞察和见解。 2. 一步一步深度咨询 AI,借助 AI 的海量知识,一边学习、一边研究、一边洞察总结。(通过借助 AI,可以加速我们的学习和研究能力) 操作示例可获取“kimi 对话原文”链接: 欢迎与 JessieZTalk 交流,在 AIGC 的路上共同进步!
2025-03-24
现在是2025年3月18日,我现在要整理一份AI行业的最新动态,在每天早上十点发布,请你整理今天的最新动态,10条左右
以下是 2025 年 3 月 18 日 AI 行业的最新动态: 1. 3 月 AI 发展持续升温。 2. 3 月潞晨科技发布 OpenSora。 3. 3 月 Suno 发布 V3 版本爆火。 4. OpenAI CPO Kevin Weil 访谈亮点:GPT5 近在眼前,将融合多个模型能力,快速推进,AI 代码自动化将在今年内达到 99%,强化推理能力和大规模预训练是关键方向,AI 不仅会写代码,还将让人人都能成为软件创造者。 5. 2025 年职场思考与建议:高管们面临“经验贬值”与“转型焦虑”,非 AI 公司的估值与融资变难,软件开发方式正被重构,“等风来”的代价越来越高,加入 AI 公司也并非万能,市场冷却下招聘更挑剔。 6. 你的孩子可能已经在用 AI“作弊”。 7. 过去一年,头部 AI 应用的品类变化不显著,创意工具仍占据最大比重。 8. 2024 年 9 月,OpenAI 发布新一代语言模型 o1,采用全新训练与推理方案,结合强化学习技术,显著增强推理能力,可能通过生成内部“思维链”模拟人类系统 2 思维方式。 9. 5 月伊莉雅离开 OpenAI,AI 竞争白热化。 10. 5 月伊利亚成立新公司,估值超五亿美金。
2025-03-18
用 ai 整理图片
以下是关于用 AI 整理图片的相关内容: 在图像生成与优化方面: 初步生成:使用 DALLE 3 和 Midjourney(MJ)进行初步图像生成。DALLE 3 凭借强大的文本识别能力快速生成符合意图的画面,MJ 则通过垫图功能(Sref 和iw 组合)确保图像风格一致。 图像优化:对于 DALLE 3 和 MJ 跑不出来的图,使用 Stable Diffusion(SD)进行图像的细节处理,尤其是局部重绘,例如调整人物的手部细节。通过 magnific.ai 工具对图像进行超分处理,提高画质。 在关键词方面: 主题描述:图片内容分为二维插画和三维立体两种表现形式。描述场景、物体或人物时,应清晰准确,对于场景中的人物最好独立描述。 设计风格:可通过找风格类关键词参考或垫图/喂图,让 AI 生成特定风格的图片。材质相关的关键词有很多门道,需要针对某一种风格单独进行“咒语测试”。 在老照片处理方面: 将照片放入后期处理,使用 GFPGAN 算法使人脸变清晰,但无法使头发、衣服等元素变清晰。 接着将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。
2025-03-16
上手coze的路径,整理一个教程的列表
以下是上手 Coze 的路径及相关教程列表: 1. 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么。流程安排:20:00@?AJ 主持开场,20:00 21:00 大聪明分享,21:00 21:30 关于 Coze 随便聊聊。 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze。流程安排:20:00 21:20 大圣分享。 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑。流程安排:20:00 21:00 艾木分享,21:00 21:30 线上答疑。 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书。流程安排:20:00 21:00 罗文分享。 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑。流程安排:20:00 21:00:itao 分享,21:00 21:30 线上答疑。 2. 基础教程: 3. 大圣的胎教级教程中的 Coze 概述: 字节的官方解释:Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。 个人认为:Coze 是字节针对 AI Agent 这一领域的初代产品,在 Coze 中将 AI Agent 称之为 Bot。 字节针对 Coze 这个产品部署了两个站点,分别是国内版和海外版。 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用的是字节自研的云雀大模型,国内网络即可以正常访问。 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(可以在这里白嫖 ChatGPT4,具体参考文档:),访问需要突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html AI Agent 的开发流程:Bot 的开发和调试页面布局主要分为提示词和人设的区块、Bot 的技能组件、插件、工作流、Bot 的记忆组件、知识库、变量、数据库、长记忆、文件盒子、一些先进的配置、触发器(例如定时发送早报)、开场白(用户和 Bot 初次对话时,Bot 的招呼话语)、自动建议(每当和 Bot 一轮对话完成后,Bot 给出的问题建议)、声音(和 Bot 对话时,Bot 读对话内容的音色)。
2025-03-16
请帮我总结AI AGENT的总体架构,帮助我更快学习相关的知识,尽快进行具体场景的商业落地
AI Agent 是一个融合了多学科精髓的综合实体,不仅有实体形态,还有丰富的概念形态,并具备许多人类特有的属性。其总体架构包括以下方面: 1. 大模型 LLM 扮演“大脑”。 2. 规划:包括子目标分解、反思与改进。子目标分解将大型任务分解为较小可管理的子目标以处理复杂任务;反思和改进可对过去的行动进行自我批评和反思,从错误中学习并改进未来步骤,提高最终结果质量。 3. 记忆。 此外,AI Agent 还具有以下特点和应用: 1. 能够自行规划任务执行的工作流路径,面向简单或线性流程的运行。 2. 可以实现多 Agent 协作,例如让大语言模型扮演不同角色,相互协作共同开发应用或复杂程序。
2024-11-04
chatpgt的总体介绍、核心技术
ChatGPT 总体介绍及核心技术如下: ChatGPT 有三个基本阶段。首先,获取与迄今为止的文本相对应的 token 序列,并找到表示它们的嵌入(即一组数字的数组)。然后在这个嵌入上进行操作,以“标准神经网络方式”,值“逐层流动”到网络的连续层中,以生成一个新的嵌入(即一个新的数字数组)。最后,从这个数组的最后一部分生成一个大约有 50,000 个值的数组,这些值将变成不同可能的下一个 token 的概率。 关键是,这个流程的每个部分都是由神经网络实现的,其权重由端到端的网络训练确定。除了整体架构外,一切都是从训练数据中“学习”的,而不是“显式设计”。 在设置体系结构方面有许多细节,首先是嵌入模块。transformers 的想法是对组成文本的 token 序列执行类似的操作,不仅定义了序列中可以存在连接的固定区域,而且引入了“注意力”的概念,以及更关注序列中的某些部分而不是其他部分的想法。ChatGPT 的总体目标是根据它所看到的训练内容(包括查看网络等数十亿页的文本),“合理地”继续文本。在任何给定的时刻,它都有一定数量的文本,目标是为下一个 token 添加一个适当的选择。
2024-09-26