Chat with Wiki - 知名的AI模型广场有哪些

Answer

以下是一些知名的 AI 模型广场：

Liblibai 模型广场：
- 首页展示了其他用户炼成的模型，收藏和运行数较多的模型在首页前排。
- 包含 Checkpoint（生图必需的基础模型）、lora（低阶自适应模型）、VAE（编码器）、CLIP 跳过层、Prompt 提示词、负向提示词 Negative Prompt 等多种模型和元素。
- 采样方法决定了让 AI 用何种算法生图。
阿里云百炼模型广场：
- 涵盖文本生成、视觉理解、音频理解、语音合成、语音识别、图像生成和 Embedding 等多种技术的丰富 AI 模型。
- 语音识别模型可将音视频中的人类声音转换为文本，适用于会议记录、客户服务、媒体制作、市场研究及多样化的实时交互场景，如会议、课堂录音记录、客服电话分析、字幕生成、市场研究与数据分析等。切换到实时语音模型后，可用于会议、直播、客服、游戏、社交聊天、人机交互等场景。

Content generated by AI large model, please carefully verify (powered by aily)

References

1.首页-模型广场：发布了其他大手子炼成的模型。如你所见，收藏和运行数（被其他用户来生图的次数）较多的模型都在首页前排，点击后可以看模型的详细信息，将模型加入模型库可用于今后生图时的快速调用。模型详情信息的下方，是用这个模型生成的图片，俗称返图区。1.Checkpoint：生图必需的基础模型，任何生图操作必须要选定一个checkpoint模型才能开始操作。注意，checkpoint区别于lora，这两个东西在模型广场都是混着展示的。checkpoint必选，lora可选可不选，任何主题的作图需求，都可以试着在模型广场上搜索或者浏览，然后收集到模型库中用于生图。1.lora：低阶自适应模型，你可以理解为checkpoint的小插件，生图的时候lora可有可无。但是lora的价值还是很明显的，基本上你看到一些精细的控制，如面部、材质、物品等等细节都常见于用相应的lora进行控制。这个也是可以加入模型库的。1.VAE：是个编码器，功能类似于我们熟悉的滤镜，调整生图的饱和度。无脑选择右侧截图中840000这个即可。1.CLIP跳过层：可以用于在生成图片之后控制、调整构图变化，一般设成2就行了，早期不用花太多精力在这里。1.Prompt提示词：想要AI生成的内容（不绝对有效，需要从入门阶段就费功夫学习，哪怕从照抄别人开始）。2.负向提示词Negative Prompt：想要AI避免产生的内容（不绝对有效，也需要费功夫学，哪怕从照抄别人开始）。1.采样方法：使用何种采样器，通俗说就是让AI用什么算法生图。

DAY1 - 必须了解的企业级AI应用开发知识点

⚠️：下面仅仅枚举了很小的一部分，请务必自己去探索一下，真的太多了。。。阿里云百炼模型广场提供了丰富的AI模型，涵盖了文本生成、视觉理解、音频理解、语音合成、语音识别、图像生成和Embedding等多种技术。这些模型可以帮助用户在各个领域实现智能化应用，无论是生成文本、理解图像音频，还是进行语音识别与合成，都能提供高效、精准的解决方案。

DAY1 - 必须了解的企业级AI应用开发知识点

语音识别（Automatic Speech Recognition，ASR）可以将音视频中包含的人类声音转换为文本。适用于会议记录、客户服务、媒体制作、市场研究及多样化的实时交互场景，能显著提升工作效率、服务质量与人机交互体验。我们将上面的内容再放进语音识别模型里面，使用场景举例：会议、课堂录音记录：将录音文件转成文字，方便后期快速进行信息检索、分析和整理重点内容。客服电话分析：自动记录并分析客户电话，快速理解客户需求，自动分类服务请求，甚至识别客户情绪，从而提升服务质量与效率。字幕生成：帮助媒体制作与后期编辑人员识别音视频材料并生成对应的字幕，加速后期制作的流程。市场研究与数据分析：将市场调研中收集到的消费者访谈、焦点小组讨论等录音数据，通过识别模型进行分析，提取消费者意见、偏好等信息，为企业决策提供支持。我们切换到实时语音模型之后，可以直接开始录音去体验模型：可以看到下面的内容，我实时分享说话的时候，就看见了实时转化的结果，我们可以使用的场景有：会议：为会议、演讲、培训、庭审等提供实时记录。直播：为直播带货、赛事直播等提供实时字幕。客服：实时记录通话内容，协助提升服务品质。游戏：让玩家无需停下手头操作即可语音输入或阅读聊天内容。社交聊天：使用社交App或输入法时，语音自动转文本。人机交互：转换语音对话为文字，优化人机交互体验。