Chat with Wiki - WayToAGI

以下是北大清华伯克利等知名高校的最新 AI 研究成果：国内方面：清华大学的自然语言处理实验室资助了 OpenBMB 项目，催生了 MiniCPM 项目，这是可以在设备上运行的小型<2.5B 参数模型，其 2.8B 视觉模型在某些指标上仅略低于 GPT4V。阿里巴巴最近发布了 Qwen2 系列，社区对其视觉能力印象深刻，能完成从具有挑战性的 OCR 任务到分析复杂的艺术作品等。国外方面： Stability AI 发布的 Stable Video Diffusion 是第一个能够从文本提示生成高质量、真实视频的模型之一，并且在定制化方面取得了显著的进步。今年 3 月，他们推出了 Stable Video 3D，该模型经过第三个对象数据集的微调，可以预测三维轨道。 OpenAI 的 Sora 能够生成长达一分钟的视频，同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁，类似于在变压器模型中使用的令牌，但用于视觉内容，以高效地从大量视频数据集中学习。此外，Sora 还使用了其原始大小和纵横比的视觉数据进行训练，从而消除了通常会降低质量的裁剪和缩放。 Google DeepMind 的 Veo 将文本和可选图像提示与嘈杂压缩视频输入相结合，通过编码器和潜在扩散模型处理它们，以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。此外，Geoffrey Hinton 让“深度学习”从边缘课题变成 Google 等网络巨头仰赖的核心技术。Hinton 和他的团队让 CIFAR 获得丰厚回报，深度学习也成为目前的主流。Hinton 冷静、谦逊与公平的态度为 NCAP 建立了良好的开放合作氛围，推进了世界的 AI 研究工作。关于未来研究方向的参考资料包括：人工智能技术与安全研究：DeepMind、OpenAI、MIT、Stanford、Berkeley 等机构的论文，“AI Index”（斯坦福大学发布）、OpenAI 技术博客、Google AI Blog 等技术报告，专家著作如 Nick Bostrom《Superintelligence》、Stuart Russell《Human Compatible》等。经济与社会变迁：IMF、世界银行、OECD、WEF（世界经济论坛）的未来就业与技术报告，未来学与社会预测如 Herman Kahn、Ray Kurzweil《The Singularity is Near》等，科技史与社会影响方面如 Joseph Schumpeter（创新与经济周期）、Carlota Perez（技术革命与金融资本），以及经济学者对产业革命的历史演化研究。政治与国际关系：联合国关于 AI 和数字治理的政策文件、欧盟 AI Act 的立法草案与相关研究，前沿智库与研究中心如 Future of Humanity Institute、Brookings、RAND Corporation 等，军事与国防方面如美国国防部和 NATO 对 AI 的战略规划，中国、欧盟、日本等国家的 AI 国家政策及军民融合案例。