Chat with Wiki - gemini本地部署

Answer

Gemini 相关信息如下：

Mistral Small 3 仅 24B 参数，但性能媲美 70B 级别模型，适合本地部署。
Gemini 2.0 Flash 正式上线，高级用户支持 100 万 token（1M）上下文窗口，可处理 1500 页文件，新增 Deep Research&Gems 等高级功能，提升任务深度理解能力，图像生成功能升级至 Imagen 3，优化细节与指令解析，Gemini 1.5 Flash&Pro 将继续提供数周支持，助用户平稳过渡。
AlphaCode 团队构建了基于 Gemini 的 AlphaCode 2，将 Gemini 的推理能力与搜索和工具使用相结合，在解决竞争性编程问题方面表现出色。同时，Gemini Nano 提升了效率，在设备上的任务中表现出色，如摘要、阅读理解、文本补全等，在推理、STEM、编码、多模态和多语言任务中展示出令人印象深刻的能力。在评估方面，涵盖了良好的研究 Benchmark 和人类偏好的评估，包括文本、代码、图像、音频和视频，包括英语性能和多语言能力。还讨论了部署方法，包括影响评估、制定模型策略、评估和减轻危害的过程。最后探讨了 Gemini 的更广泛影响、局限性和潜在应用。

Content generated by AI large model, please carefully verify (powered by aily)

References

估值达33亿美元，较去年增长3倍，总融资金额达2.81亿美元。投资方包括a16z、ICONIQ Growth、NEA等，资金将用于AI语音交互技术升级。CEO目标：让人与AI的对话自然如真人交流。?[X平台原文](https://x.com/imxiaohu/status/1885139948640354661)丨?[详细信息](https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-1-8-c-33)5⃣️?Mistral AI发布Mistral Small 3仅24B参数，性能媲美70B级别模型，适合本地部署。对比Llama 3.3 70B、Qwen 32B，是GPT-4o-mini的优秀开源替代品。MMLU基准测试81%，生成速度高达150 tokens/s，运行效率极高。?[X平台原文](https://x.com/imxiaohu/status/1885136176648266164)6⃣️⚡Gemini 2.0 Flash正式上线高级用户支持100万token（1M）上下文窗口，可处理1500页文件。新增Deep Research&Gems等高级功能，提升任务深度理解能力。图像生成功能升级至Imagen 3，优化细节与指令解析。Gemini 1.5 Flash&Pro将继续提供数周支持，助用户平稳过渡。?[X平台原文](https://x.com/imxiaohu/status/1885133436928868667)>>更多详细内容查看[XiaoHu.AI日报](https://waytoagi.feishu.cn/wiki/T2fUwmHBSiHU6Ukq9Imcu7n7nMh)

XiaoHu.AI日报

投资方包括a16z、ICONIQ Growth、NEA等。公司估值达33亿美元，较去年增长3倍。总融资金额达2.81亿美元，推动AI语音交互发展。CEO表示目标是让人与AI的对话像真人交流一样自然。?[https://x.com/imxiaohu/status/1885139948640354661](https://x.com/imxiaohu/status/1885139948640354661)?详细信息：?[https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-1-8-c-33](https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-1-8-c-33)5⃣️?Mistral AI发布Mistral Small 3仅24B参数，但性能媲美70B级别模型，适合本地部署。对比Llama 3.3 70B或Qwen 32B，是GPT-4o-mini等专有模型的优秀开源替代品。MMLU基准测试81%，生成速度可达150 tokens/s，运行效率极高。?[https://x.com/imxiaohu/status/1885136176648266164](https://x.com/imxiaohu/status/1885136176648266164)6⃣️⚡Gemini 2.0 Flash正式上线

Gemini report 中文翻译

大型语言模型的推理能力，显示出在构建能够解决更复杂的多步问题的通用agents方面的潜力。AlphaCode团队构建了AlphaCode 2（Leblond等人，2023年），这是一个新的基于Gemini的agent，它将Gemini的推理能力与搜索和工具使用相结合，在解决竞争性编程问题方面表现出色。AlphaCode 2在Codeforces竞技编程平台上排名前15％的参赛者中，相比于排名前50％的最新技术有了很大的改进（Li等人2022年）。同时，我们通过Gemini Nano提升了效率，这是一系列针对设备部署的小型模型。这些模型在设备上的任务中表现出色，如摘要、阅读理解、文本补全任务，并且相对于其大小，在推理、STEM、编码、多模态和多语言任务中展示出令人印象深刻的能力。在下面的部分中，我们首先提供模型架构、训练基础结构和训练数据集的概述。然后，我们提出了详细Gemini模型的评估，涵盖了良好的研究Benchmark和人类偏好的评估，包括文本，代码，图像，音频和视频，包括英语性能和多语言能力。我们还讨论了我们的部署方法，包括在部署决策之前进行影响评估、制定模型策略、评估和减轻危害的过程。最后，我们讨论了Gemini的更广泛影响，以及它的局限性和潜在应用，为人工智能研究和创新开辟了新时代的道路。