Chat with Wiki - WayToAGI

以下是近期的 AI 资讯汇总： 4 月 1 日：【AI 模型及应用】OpenAI 将会开源一个推理模型，ChatGPT 即将推出推理强度控制选项，Gpt4o 生图能力面向免费用户；Gemini 2.5 Pro 免费使用，任何人都可以使用 Canvas 进行编码和创作。【AI 视频】Higgsfield 发布 50 多个电影级摄影机动作预设，提升动态镜头表现力；luma 为 Ray 2 引入摄像机运动概念，可基于预设镜头并组合编辑；Remakes 支持基于用户上传图像直接编辑，并融合 Remade 视频特效，简化创意流程；Meta 宣布推出 MoCha 系统，实现电影级说话角色合成效果。【AI 3D】HSMR 推出从单张图像重建人体 3D 骨骼和网格模型的系统；krea 引入 AI 3D 生成能力，扩展其创意工具的功能范围；PGC 推出基于物理的单一姿势高斯布料模拟技术，提升数字服装的真实感。【AI 音频】MiniMax Audio 发布全新 Speech02 语音模型，提升语音合成质量。 3 月 21 日：【AI 绘画】网传神秘 Halfmoon 文本转图像模型为 Reve 对比 Midjourney 效果；Topaz Labs 推出 Gigapixel v8.3.0，将任何图像放大 16 倍；FLORA 引入 gemini 2.0 自然语言编辑图像能力。【AI 视频】pika 超创内测“操控原视频中物体运动”能力；Krea 上线视频模型训练能力，可控制视频风格/动作/物体等。【AI 3D】SpatialLM 用于空间理解的大型语言模型。【AI 模型及应用】OpenAI 发布 2 个语音模型（文本转语音/语音转文本）+1 个演示网站；Claude 支持搜索功能。 3 月 14 日：【AI 模型及其他】谷歌 Gemini 应用能力升级，包含升级推理模型 gemini 2.0、Flash Thinking Experimental 等多个功能提升；OpenAI 4 项更新；Bolt 一键将 Figma 设计转换为可运行的 Web 应用；阿里推出 AI 旗舰应用“新夸克”；360 智脑团队开源推理模型 LightR114BDS，复现 Deepseek 的强化学习效果。【AI 视频】Pika 更新 Pikaffects，新增多款变身特效；Freepik 与 Fal 平台引入 Topaz AI 的提升“FPS 和视频分辨率”能力；Krea 上线 Veo 2 模型，支持图生视频功能，但生成成本较高。【AI 绘图】LBM 用于快速图像到图像转换的潜在桥匹配方法，支持可控图像重新照明、角色去除和图像修复。【AI 语音】Sesame 开源 TTS 语音模型 CSM1B。