Chat with Wiki - 到底有多强大

Answer

以下是关于不同 AI 相关内容强大之处的介绍：

Sora：当不复制旧的，而是把新的、不可能的想法变成现实时，Sora 最为强大。它能帮助创意人员将想法变为现实，不仅擅长创造看起来真实的东西，创造完全超现实的东西的能力也令人兴奋。
LORA：在画风、人物、物品、动作姿态的固定方面表现强大，其文件承载的信息量远大于 Embedding，在还原真人物品时细节精度更高。使用时需注意搭配相应大模型和特定触发词。
Hypernetworks：主要针对画风训练，可像 LORA 一样加载使用。
Google 的 Gemini：是 Google DeepMind 团队开发的多模态模型，支持多种提示类型，能理解和处理几乎任何输入，结合不同类型信息并生成几乎任何输出，被称为 Google 迄今为止最强大、最全面的模型，是原生多模态大模型，从设计之初就支持多模态，能处理多种形式的数据。

Content generated by AI large model, please carefully verify (powered by aily)

References

报道：赛博禅心：《Sora凌晨发布：与艺术家一起，解锁奇幻纪元》https://mp.weixin.qq.com/s/EQazvDKT2OCKdy9i_VM46g自从上个月我们向世界[介绍Sora](https://openai.com/sora)以来，我们一直在与视觉艺术家、设计师、创意总监和电影制片人合作，了解Sora如何帮助他们的创作过程。Sora is at its most powerful when you’re not replicating the old but bringing to life new and impossible ideas we would have otherwise never had the opportunity to see.Sora是最强大的，当你不复制旧的，而是把新的、不可能的想法变成现实，否则我们将永远没有机会看到。-Paul Trillo,Director保罗·特里洛，导演虽然我们对Sora有许多改进要做，但我们已经看到了这个模型如何帮助创意人员将想法变为现实。As great as Sora is at generating things that appear real-what excites us is its ability to make things that are totally surreal.尽管Sora擅长创造看起来真实的东西——但让我们兴奋的是它创造完全超现实的东西的能力。-shy kids害羞的孩子以下是艺术家作品的几个例子，以及他们对如何将Sora融入他们的工作流程和业务的早期想法。感谢@魏申提供下载好的视频[heading2]「强烈推荐看完」shy kids–“Air Head”

【SD】软件原理傻瓜级理解

总结一下，LORA的强大，无论是画风，还是人物、物品，或者是动作姿态，都是可以固定下来，它所做的就是提炼图片特征。LORA和Embedding的区别一是在于体量上，Embedding的文件只有几十kb，而LORA的文件通常有几十上百兆，所以LORA的文件所承载的信息量是要远大于Embedding，尤其是在还原真人物品时，LORA的细节精度是Embedding无法比拟的。下载的LORA放在根目录的这个文件夹下【……\models\Lora】，使用的时候点击这个红色的小书，找到LORA的选项卡，任意点击一个想要的LORA就可以加载进去了。使用LORA的时候要注意看作者使用的大模型，一般情况下只有配套使用才能达到LORA最好的效果，当然也不排除有一些LORA和其他的大模型会产生一些奇妙的碰撞。除了加载lora以外，还需要加入一些特定的触发词，才能保证lora的正常使用。比如这个盲盒的lora，作者提示需要加入full body,chibi这些提示词才行。Hypernetworks主要是针对画风训练的一种模型，可以像lora一样加载进来。比如这种卡通Q版头像蒸汽波风格油画风格下载的文件放在根目录的这个文件夹下【…\models\hypernetworks】，使用的时候点击这个红色的小书，找到Hypernetworks的选项卡，任意点击一个想要的Hypernetworks就可以加载进去了。当我们下载了很多的模型、Embedding、Hypernetworks和LORA之后，我们会发现这些文件的后缀名几乎是一样，包括.pt/.safetensors/.ckpt等等，所以这些文件是无法通过后缀名进行区分的，那我们怎么判断这个文件到底是什么？该放到什么文件夹里呢？这里我们可以去到秋叶大佬整理的这个网站里面https://spell.novelai.dev/，把文件拖进去就可以看到是什么类型的文件。

问：Google 的多模态大模型叫什么？

Google的人工智能多模态大模型叫Gemini。具体介绍如下：-Gemini是Google DeepMind团队开发的多模态模型，不仅支持文本、图片等提示，还支持视频、音频和代码提示。-Gemini能够理解和处理几乎任何输入，结合不同类型的信息，并生成几乎任何输出。-Gemini被称为Google迄今为止最强大、最全面的模型。-Gemini被描述为一种"原生多模态大模型"，从设计之初就支持多模态，能够处理语言、视觉、听觉等不同形式的数据。内容由AI大模型生成，请仔细甄别