目前在查找期刊文献方面,不同的大模型各有特点。大模型的特点包括:
但对于哪个大模型找期刊文献最好用,没有明确的定论。不过,您可以关注一些常见的大模型,如 GPT 系列等,并根据实际需求和使用体验来判断。
encoder-only:这些模型通常适用于可以自然语言理解任务,例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的,在transformer中,包括Encoder,Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢?第一,大模型的预训练数据非常大,这些数据往往来自于互联网上,包括论文,代码,以及可进行爬取的公开网页等等,一般来说,现在最先进的大模型一般都是用TB级别的数据进行预训练。第二,参数非常多,Open在2020年发布的GPT-3就已经达到170B的参数在GPT3中,模型可以根据用户输入的任务描述,或给出详细的例子,完成任务但这与我们熟知的ChatGPT仍然有着很大的差距,使用ChatGPT只需要像和人类一样对话,就可以完成任务。除了形式上的不同之外,还有一个更加重要的差距,那就是安全性上的差别。
模型能够有效地控制生成的画风和内容。常用的模型网站有:[Civitai|Stable Diffusion models,embeddings,hypernetworks and more](https://link.zhihu.com/?target=https%3A//civitai.com/)>[Models-Hugging Face](https://link.zhihu.com/?target=https%3A//huggingface.co/models)>[SD-WebUI资源站](https://link.zhihu.com/?target=https%3A//www.123114514.xyz/models/ckpt)>[元素法典AI模型收集站-AI绘图指南wiki(aiguidebook.top)](https://link.zhihu.com/?target=https%3A//aiguidebook.top/index.php/model/)>[AI绘画模型博物馆(subrecovery.top)](https://link.zhihu.com/?target=https%3A//aimodel.subrecovery.top/)[heading3]模型安装[content]下载模型后需要将之放置在指定的目录下,请注意,不同类型的模型应该拖放到不同的目录下。模型的类型可以通过[Stable Diffusion法术解析](https://link.zhihu.com/?target=https%3A//spell.novelai.dev/)检测。大模型(Ckpt):放入models\Stable-diffusionVAE模型:一些大模型需要配合vae使用,对应的vae同样放置在models\Stable-diffusion或models\VAE目录,然后在webui的设置栏目选择。Lora/LoHA/LoCon模型:放入extensions\sd-webui-additional-networks\models\lora,也可以在models/Lora目录Embedding模型:放入embeddings目录
歸藏的AIGC周刊《[AIGC Weekly#82](https://waytoagi.feishu.cn/wiki/F6P7wiF3wiljbektL6ScgRhQnOd)》,重点介绍了Meta发布的Llama3.1 405B模型,具备128K token上下文窗口及对8种语言的改进,能与领先闭源模型竞争。评估显示其在指令遵循、代码和数学能力上表现优异。同时,还提到AI音乐工具Udio的大规模更新,以及OpenAI推出的SearchGPT搜索功能。文章探讨了人工智能领域的最新动态和研究进展,强调开源AI的重要性。《[一泽Eze:样例驱动的渐进式引导法——利用AI高效设计提示词,生成预期内容](https://waytoagi.feishu.cn/wiki/MJQTwW7y9iDSfrkcFUmc0iCmnlf?fromScene=spaceOverview)》本文介绍了一种样例驱动的渐进式引导法,通过构建初始样例、评估样例、提炼模板与AI对话,最终生成结构化提示词。该方法强调多轮反馈,确保AI理解需求,逐步调整模板,以达到预期效果。作者建议在AI充分理解后,再生成结构化提示词,以提高效率和准确性。最终目标是设计出符合实际需求的有效提示词,提升AI的应用效果。