目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 Janus-Pro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
直到全世界再也无法忽视那头鲸鱼,DeepSeek的模型给全世界一个震撼,AI艺术家也用他们的方式进行表达。希望也能得到你的回应特此征集,大家一起用鲸鱼来表达,无论视频还是图像,让更多人看到。投稿地址:#小程序://腾讯频道/iitsoMH4nxixR2e或:https://pd.qq.com/g/pd17321136?tab=1&keyword=%E9%80%9A%E5%BE%80AGI%E4%B9%8B%E8%B7%AF&subc=675823847DeepSeek介绍[DeepSeek深夜发布大一统模型Janus-Pro将图像理解和生成统一在一个模型中](https://waytoagi.feishu.cn/wiki/SneLwRmsYiUaI6kvxltcEBPPnhb)[详解:DeepSeek深度推理+联网搜索目前断档第一](https://waytoagi.feishu.cn/wiki/D9McwUWtQiFh9sksz4ccmn4Dneg)
?Xiaohu.AI日报「12月31日」✨✨✨✨✨✨✨✨1⃣️?Pixverse V3.5模型发布全球最快的AI视频生成模型,Turbo模式下可在10秒内生成视频,最快仅需5-6秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能。具备顶尖动漫生成能力,仅需提示词即可快速生成动画画面。?[https://x.com/imxiaohu/status/1874093362032398471](https://x.com/imxiaohu/status/1874093362032398471)2⃣️?通义千问视觉理解模型降价最高降幅达85%。Qwen-vl-max输入价格降至0.003,输出价格降至0.009。对比Doubao vision Pro,输入价格也同为0.003。?[https://x.com/imxiaohu/status/1874084227568066608](https://x.com/imxiaohu/status/1874084227568066608)
?Xiaohu.AI日报「12月31日」✨✨✨✨✨✨✨✨1⃣️?Pixverse V3.5模型发布全球最快的AI视频生成模型,Turbo模式下可在10秒内生成视频,最快仅需5-6秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能。具备顶尖动漫生成能力,仅需提示词即可快速生成动画画面。?[https://x.com/imxiaohu/status/1874093362032398471](https://x.com/imxiaohu/status/1874093362032398471)2⃣️?通义千问视觉理解模型降价最高降幅达85%。Qwen-vl-max输入价格降至0.003,输出价格降至0.009。对比Doubao vision Pro,输入价格也同为0.003。?[https://x.com/imxiaohu/status/1874084227568066608](https://x.com/imxiaohu/status/1874084227568066608)