Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最近很火的古人怼人视频怎么做的

Answer

制作最近很火的古人怼人视频,可按照以下步骤进行:

  1. 文案生成
    • 工具:DeepSeek
    • 操作:
      • 打开 DeepSeek 网站:https://chat.deepseek.com/
      • 输入提示词,示例:“让 XX 用现代口语化的表达、生气骂人的口吻吐槽 XXXX(例如:吐槽现代人),XXX 目的(例如:推广 XXX 吸引游客来旅游),输出 3 条 60 字左右的毒舌文案,每条里面都要有‘回答我!Look in my eyes!Tell me!why?baby!why?’”
      • 可以根据自己的内容自行调整文案和字数要求。
      • 点击生成,等待 DeepSeek 输出 3 条文案。
      • 从中挑选最满意的一条(或多条)保存备用。
  2. 准备人物形象图
    • 可以用现有的照片或者图片,也可以用工具生成。
    • 工具:即梦 AI
    • 操作:
      • 打开即梦 AI 网站:https://jimeng.jianying.com/ai-tool/image/generate
      • 输入提示词,即梦已经接入了 DeepSeek,可以直接用它来生成绘图提示词
      • 调整生成参数(如风格、细节等),点击生成。
      • 预览生成的人物图,不满意可调整提示词重新生成,直到满意为止。
      • 下载最终的人物形象图。

此外,还有以下扩展玩法和变现玩法: 扩展玩法:

  1. 文旅引流版:用地方历史名人“骂”现代游客,再顺便夸家乡美景。
  2. 名人认知刷新版:让古人吐槽他们被误解的形象。
  3. 系列化挑战:做一个“古人骂遍现代生活”系列,吸引粉丝追更。还能号召网友提建议,互动拉满!

变现玩法:

  1. 品牌合作与广告植入:让古人吐槽现代生活痛点,顺势植入品牌产品或服务,打造新颖幽默的广告形式。
  2. IP 开发与周边销售:基于古人形象开发文化衍生品,打造可销售的 IP 周边。
  3. 教育与文化传播:将吐槽视频融入历史文化知识,吸引学生和文化爱好者。
Content generated by AI large model, please carefully verify (powered by aily)

References

?回答我!全网爆火的AI古人骂人视频玩法|小白保姆级教程(附提示词和变现玩法)

好了,工具准备好了,我们开始动手吧!跟着这3个步骤,你就能做出一个“古人骂人”的爆笑视频。[heading4]第一步:文案生成[content]工具:DeepSeek操作:打开DeepSeek网站https://chat.deepseek.com/输入提示词提示词示例:“让XX用现代口语化的表达、生气骂人的口吻吐槽XXXX(例如:吐槽现代人),XXX目的(例如:推广XXX吸引游客来旅游),输出3条60字左右的毒舌文案,每条里面都要有‘回答我!Look in my eyes!Tell me!why?baby!why?’”tips:可以根据自己的内容自行调整文案和字数要求。点击生成,等待DeepSeek输出3条文案。从中挑选最满意的一条(或多条)保存备用。[heading4]第二步:准备人物形象图[content]这里可以用现有的照片或者图片,也可以用工具生成工具:即梦AI操作:打开即梦AI网站https://jimeng.jianying.com/ai-tool/image/generate输入提示词,即梦已经接入了DeepSeek,可以直接用它来生成绘图提示词调整生成参数(如风格、细节等),点击生成。预览生成的人物图,不满意可调整提示词重新生成,直到满意为止。下载最终的人物形象图。

?回答我!全网爆火的AI古人骂人视频玩法|小白保姆级教程(附提示词和变现玩法)?

好了,工具准备好了,我们开始动手吧!跟着这3个步骤,你就能做出一个“古人骂人”的爆笑视频。[heading4]第一步:文案生成[content]工具:DeepSeek操作:打开DeepSeek网站https://chat.deepseek.com/输入提示词提示词示例:“让XX用现代口语化的表达、生气骂人的口吻吐槽XXXX(例如:吐槽现代人),XXX目的(例如:推广XXX吸引游客来旅游),输出3条60字左右的毒舌文案,每条里面都要有‘回答我!Look in my eyes!Tell me!why?baby!why?’”tips:可以根据自己的内容自行调整文案和字数要求。点击生成,等待DeepSeek输出3条文案。从中挑选最满意的一条(或多条)保存备用。[heading4]第二步:准备人物形象图[content]这里可以用现有的照片或者图片,也可以用工具生成工具:即梦AI操作:打开即梦AI网站https://jimeng.jianying.com/ai-tool/image/generate输入提示词,即梦已经接入了DeepSeek,可以直接用它来生成绘图提示词调整生成参数(如风格、细节等),点击生成。预览生成的人物图,不满意可调整提示词重新生成,直到满意为止。下载最终的人物形象图。

?回答我!全网爆火的AI古人骂人视频玩法|小白保姆级教程(附提示词和变现玩法)

做完一个视频不过瘾?试试这些创意点子,玩出新花样:1.文旅引流版:用地方历史名人“骂”现代游客,再顺便夸家乡美景。比如:让苏轼“骂”杭州游客拍照太浮夸,顺便推销西湖:“尔等只知滤镜,殊不知西湖之美,天然去雕饰!”2.名人认知刷新版:让古人吐槽他们被误解的形象。比如:李白diss“老子只会喝酒”的刻板印象:“吾诗三百篇,尔等只知酒,真乃井底之蛙!”3.系列化挑战:做一个“古人骂遍现代生活”系列,比如第一集骂时尚,第二集骂外卖,第三集骂手机,吸引粉丝追更。还能号召网友提建议,互动拉满!变现玩法:1.品牌合作与广告植入核心玩法:让古人吐槽现代生活痛点,顺势植入品牌产品或服务,打造新颖幽默的广告形式。举例:孔子吐槽现代教育工具落后,推荐智能学习机;李白diss现代人不会喝酒,推销某酒品牌。1.IP开发与周边销售核心玩法:基于古人形象开发文化衍生品,打造可销售的IP周边。举例:推出“李时珍养生茶”包装、“屈原端午限定”粽子礼盒或文创产品。1.教育与文化传播核心玩法:将吐槽视频融入历史文化知识,吸引学生和文化爱好者。举例:制作“古人骂人背后的故事”系列,或推出“从吐槽看历史”付费课程。

Others are asking
最近很火的AI工具
以下是一些最近很火的 AI 工具: 1. Unity 推出的两款 AI 工具: Copliot 工具:可通过与 Muse Chat 聊天快速启动创建游戏项目,如一键生成塔防类游戏基础框架、让人物角色做动作,还能协助编码和创建 3D 材质、动画等内容。现可申请加入等待列表:https://create.unity.com/aibeta ,官方提示暑假会进一步开放。 Unity Sentis:是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案,能在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强游戏玩法和其他功能,目前还在封测阶段。 2. NotebookLM:2024 年热门 AI 产品,12 月更新了新功能“加入”,用户可成为播客节目一环。但该功能存在一些限制,如很早之前就在 Google 开发者大会上展示过,最近才有 BETA 版;对部分地区用户有强限制,注意检查网络设置;“加入”功能使用不稳定,需多点耐心;目前只支持英语发言,上传文本语言不受限;目前只支持网页版,没有移动端。使用地址: 3. Writerbuddy AI 分析了 3000 多种 AI 工具,选出访问量最大的 50 个工具,ChatGPT 独占 60%流量。 4. MotionGPT 是多模态运动语言模型,可通过文字聊天生成逼真人体运动,并发布了演示视频。 5. Radishes 是开源无版权音乐平台,支持 Windows、macOS、Linux 和 Web,功能包括音乐搜索、下载、每日歌单推荐等。
2025-02-20
列出最近很火的10个AI应用
以下是最近很火的 10 个 AI 应用: 1. AI 游戏道具推荐系统:使用数据分析、机器学习技术,已有产品如游戏内商城推荐功能,市场规模达数亿美元,能根据玩家需求推荐游戏道具。 2. AI 天气预报分时服务:运用数据分析、机器学习技术,如彩云天气分时预报,市场规模数亿美元,提供精准的分时天气预报。 3. AI 医疗病历分析平台:采用数据分析、自然语言处理技术,像医渡云病历分析系统,市场规模数十亿美元,可分析医疗病历辅助诊断。 4. AI 会议发言总结工具:借助自然语言处理、机器学习技术,例如讯飞听见会议总结功能,市场规模数亿美元,能自动总结会议发言内容。 5. AI 书法作品临摹辅助工具:通过图像识别、数据分析技术,有书法临摹软件,市场规模数亿美元,帮助书法爱好者进行临摹。 6. AI 摄影参数调整助手:利用图像识别、数据分析技术,一些摄影 APP 有参数调整功能,市场规模数亿美元,可根据场景自动调整摄影参数。 7. AI 音乐情感分析平台:使用机器学习、音频处理技术,如音乐情感分析软件,市场规模数亿美元,能分析音乐的情感表达。 8. AI 家居智能照明系统:基于物联网技术、机器学习技术,像小米智能照明系统,市场规模数十亿美元,实现家居照明的智能化控制。 9. AI 金融风险预警平台:运用数据分析、机器学习技术,如金融风险预警软件,市场规模数十亿美元,可提前预警金融风险。 10. AI 旅游路线优化平台:借助数据分析、自然语言处理技术,如马蜂窝路线优化功能,市场规模数亿美元,能根据用户需求优化旅游路线。
2025-02-17
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
需要做一个自动化出视频的工作流
以下是一个关于自动化出视频工作流的详细介绍: 优势: 全自动化处理,解放双手。 40 秒快速出片,效率提升。 成本低廉,每条仅需 0.0x 元。 输出质量稳定专业。 DeepseekR1 保证文案质量。 还能改进,例如可以加入配套 BGM,让视频更有感染力;增加更丰富的画面内容和转场效果;使用免费节点替代付费插件,进一步降低成本;优化模板样式,支持更多展示形式;增加自动化程度,支持批量处理。 工作流程: 1. 可以在扣子商店体验,建议自己搭建。 2. 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 3. 选择发布渠道,重点如飞书多维表格,填写上架信息(为了快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 4. 创建飞书多维表格,添加相关字段,配置选择“自动更新”,输入相关字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 5. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 6. 全自动视频合成使用多视频融合插件,一键导出成品。但需注意节点产生的视频是异步生成,可能无法马上展现,需耐心等待几秒。 如果您还有其他疑问或需要进一步的帮助,请随时联系。
2025-04-14
最近6个月的ai技术和趋势
在过去 6 个月中,AI 技术和趋势呈现出以下特点: 模型方面:DeepSeek 开源 R1 模型,将大模型行业推进到推理时代,引发了深刻影响。Scaling Law 再次“续命”,目标指向 AGI。 图像方面:整体朝着更快、更便宜的方向发展,AI 图像生成已成为常用生产力工具,资本市场看好相关赛道。 视频方面:底层架构无大变化,公司逐渐分化为面向 C 端的好玩快速的视频模板方向和面向 B 端的高质量高可控性的视频创作方向。 音频方面:跨越了真假难辨的临界点,成为继图像领域后被资本看好的赛道。 3D 方面:暂时停留在文字/图片生成 3D 模型阶段,世界模型刚起步。 应用方面:AI 编程领域快速迭代发展,从半自动向全自动迈进;Computer Agent 缓慢发展,OpenAI 的 Operator 工具效果不佳;DeepSearch 作为调研 Agent 存在模型幻觉等问题,实际使用需谨慎。 新闻方面:中美欧 2025 年将加大对 AI 基础建设和科学研究的投入,越来越多厂商接入 R1 并拥抱开源。
2025-03-31
最近流行的ai技术
AI 技术的发展历程和前沿技术点如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:例如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包括量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 学习路径: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 近期热门融资的 AI 产品,如 Genspark、Rockset、ButterfliesAI、MeetRecord 等,不仅展示了技术的先进性,也为各行各业提供了高效、智能的信息处理和决策支持工具。
2025-03-29
最近有什么AI比赛
以下是为您整理的近期 AI 比赛: 1. 【灵璧 AI】安徽文创 截止日期:0115 0315 奖金奖项:一等奖 2k1、二等奖 1k2、三等奖 8005 主题+作品类型:赛道一为数字艺术创作,利用 AIGC 技术创作数字绘画、数字雕塑等艺术作品;赛道二为互动体验设计,设计互动体验项目,如 AR/VR 体验、互动游戏等;赛道三为数字故事讲述,创作以虞姬及灵璧特色历史文化为主题的数字故事,如动画短片等。 关键要求:只能提交一份作品。以压缩包上传,材料包含创作作品的源文件、prompt 指令、制作过程的关键过程截图、录屏与说明等。 提交方式:邮箱 链接: 2. 创无界智未来·文旅应用赛 截止日期:0101 0330 奖金奖项:一等奖 10w1、二等奖 6w2、三等奖 3w3 主题+作品类型:四个赛道 关键要求:模糊 提交方式:官网 链接: 3. 【凌家滩】AI 创作大赛 截止日期:0101 0415 奖金奖项:一等奖 2w1、二等奖 8k2、三等奖 2k3、优秀奖 010 主题+作品类型:“文化遗产的数字化重现与未来表达”AI 图像/AIMV/AI 视频 关键要求:无 提交方式:无 链接: 4. 【云山杯】AIGC 大赛 截止日期:0116 0225 奖金奖项:四赛道分别为一等奖 2k1、二等奖 1k1、三等奖 3003、优秀奖 10020 主题+作品类型:图片、视频、文本、音频 关键要求:【AI 图片】1.设计一个代表“杯云山”的全新品牌标志,融合传统与现代元素。2.创作一套完整的品牌视觉形象,包括颜色、字体和图案设计。【AI 视频】1.制作一个简短视频,介绍“杯云山”品牌的历史、价值观和产品特色。2.制作一段云南茶文化的纪录片,展示其历史、传统和现代发展的融合。【AI 文本】1.撰写关于“杯云山”品牌从创立到发展的故事,突出品牌的传承与创新。2.编写一个以茶园为背景的微型剧本,展示茶叶从种植到品鉴的全过程。【AI 音乐】1.创作能够代表“杯云山”的纯音乐,体现茶园的宁静与创新的活力。2.将传统云南音乐元素与现代电子音乐相结合,创作段具有地域特色和创新感的音乐作品。 提交方式:无 链接: 5. 智绘未来【台州】AI 大赛 截止日期:0122 0309 奖金奖项:①一等奖 5k1、二等奖 2k3、三等奖 1k5、台州奖 1k1;②一等奖 5.5k1、二等奖 2.5k2、三等奖 1.5k3、台州奖 1k1 主题+作品类型:AI 绘画赛道、AI 视频赛道(60S 以上) 关键要求:分辨率 2K 以上,【加分项】展现台州自然风光、人文历史、城市印象等元素,对台州未来景象的想象,或对台数字馆的未来想象相关的台州元素(额外在总分值增加 10%的分数) 提交方式:AITOP100 平台,投稿后必须转发至小红书分享并带上话题智绘未来+关注官方账号@台州数字馆。 链接:
2025-03-27
最近新出的大模型有哪些
最近新出的大模型有: 1. 通义千问推出的 Qwen2.5Max 大型专家模型,通过 SFT 和 RLHF 策略后训练,性能与顶尖模型竞争,在多个基准测试中超越了 DeepSeek V3,引发了 AI 社区对大规模专家模型的高度关注。相关链接: Blog: Qwen Chat: (选择 Qwen2.5Max 模型) API: HF Demo: 2. 阿里云发布的 Qwen2.5VL 新一代视觉语言模型。
2025-03-27
吴恩达最近推出了哪些课程?
吴恩达最近推出的课程包括: 1. 与 OpenAI 合作推出的免费的 Prompt Engineering(提示工程师)课程。 主要内容是教书写 AI 提示词,并利用 GPT 开发一个 AI 聊天机器人。 原版网址:https://www.deeplearning.ai/shortcourses/chatgptpromptengineeringfordevelopers/ B 站版本:【合集·AI Course哔哩哔哩】https://b23.tv/ATc4lX0 、https://b23.tv/lKSnMbB 翻译版本: 推荐直接使用 Jupyter 版本学习,效率更高:https://github.com/datawhalechina/promptengineeringfordevelopers/ 视频下载地址:https://pan.quark.cn/s/77669b9a89d7 OpenAI 开源了教程:https://islinxu.github.io/promptengineeringnote/Introduction/index.html 纯文字版本 2. 2023 年 8 月 24 日上线的最新短课程: 《》,课程内容包括了解何时对 LLM 应用微调、准备数据以进行微调、根据自己的数据训练和评估 LLM。 《》,深入浅出地介绍了基于大语言模型的 AI Agents,从记忆检索到决策推理,再到行动顺序的选择,真实展现了 Agent 的智能化进程。
2025-03-27
最近的AI新闻
以下是近期的 AI 新闻汇总: 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 Blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。 3 月 26 日: 【AI 模型及应用】 OpenAI:推出 GPT4o 图像生成能力。 谷歌:发布 Gemini 2.5 Pro Experimental 模型。 Trea:已内置 DeepSeekV30324。 【AI 音乐】 昆仑万维:发布全球首款音乐推理大模型 Mureka O1。 【AI 视频】 混元 Portrait:音频视频驱动图片肖像形成动画。 PPVCtrl:新可控制视频生成模型。 【AI 3D】 Vibe Draw: 草图进行 3D 建模。 PhysTwin:通过视频创建交互式物理数字孪生。 GroomLight:用于重打光的人体头发外观建模的混合逆向渲染。
2025-03-26