Chat with Wiki - 可以翻译藏文的大模型

Answer

以下为您提供关于大模型的相关信息：

大模型的应用：有一个关于 PPT 翻译的案例，为了提高翻译效率编写了自动翻译脚本。脚本在 Python 环境下运行，前期准备需要根据自身 API 资源提前设置，推荐讯飞大模型，新账户免费送 200 万 tokens，有效期 3 个月。具体操作包括在 https://xinghuo.xfyun.cn/ 首页选择 API 接入，进入控制台创建新项目，按提示领取 200 万 tokens 的礼包，获取对应的 id、apikey、api secret 和接入路径。还需导入依赖，运行 CMD 输入 pip install python-pptx 安装相关组件。

大模型的分类与特点：

encoder-only 模型：通常适用于自然语言理解任务，如分类和情感分析，代表模型是 BERT。
encoder-decoder 模型：结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容，用于翻译和摘要等，代表是谷歌的 T5。
decoder-only 模型：更擅长自然语言生成任务，如故事写作和博客生成，众多 AI 助手采用此结构。

大模型的特点包括预训练数据量大（来自互联网，包括论文、代码、公开网页等，通常用 TB 级数据预训练）、参数多（如 Open 在 2020 年发布的 GPT-3 已达 170B 参数）。

大模型在翻译中的提示工程：在翻译中，提示的文体规范很重要，涵盖语气、语言风格、长度等元素。设定明确的语气能引导大语言模型生成符合情感或专业背景的回答。明确输出的语言和复杂性对于不同专业知识水平的目标受众很关键。

Content generated by AI large model, please carefully verify (powered by aily)

References

[应用开发] PPT翻译脚本

这个故事起源于，我有一个客户，有一天global的老大来开会，喊了微博的销售，会后老外想要一个案例分析，微博也答应了。但是TMD过了一个礼拜，他们给了个中文的案例，说没人翻译...就只好让同事用gpt去翻，但是发现这个PPT碎的令人发指，小朋友翻译翻的绝望了，就想办法写了个自动翻译的脚本。目前测下来整体还可以，虽然性能还不够好（比如有些翻译不是很全，有些本土化的梗无法理解），但整体的效率已经提升很多了。（版本还会有些小更新，改了个名字好找一点~）脚本在Python环境下运行，整体逻辑不复杂，分成几个步骤（如果有大佬有兴趣拆成xml来搞，欢迎交流）[heading2]前期准备[content]因为翻译需要外接API，这里根据自己的API资源提前设置下，推荐讯飞大模型，新账户免费送200万tokens，有效期3个月，很良心~https://xinghuo.xfyun.cn/首页进去选择API接入，然后点服务管理进入控制台创建一个新项目，比如“PPT翻译”，这样你的API只会被这个项目ID调用，避免泄露点进去，找到左边机器翻译的模型按提示来，领一个200万tokens的礼包然后就可以在主控台看到对应的id，apikey，api secret和接入路径了[heading2][heading2]导入依赖[content]大部分都是常用的，只有一个ppt可能需要装运行CMD输入pip install python-pptx，如果还缺的可以按提示安装[heading2]初始化API相关信息和文件路径[content]接着先设置对应的api信息，其他模型可以对应做替换

从 0 到 1 了解大模型安全，看这篇就够了

encoder-only:这些模型通常适用于可以自然语言理解任务，例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的，在transformer中，包括Encoder，Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢？第一，大模型的预训练数据非常大，这些数据往往来自于互联网上，包括论文，代码，以及可进行爬取的公开网页等等，一般来说，现在最先进的大模型一般都是用TB级别的数据进行预训练。第二，参数非常多，Open在2020年发布的GPT-3就已经达到170B的参数在GPT3中，模型可以根据用户输入的任务描述，或给出详细的例子，完成任务但这与我们熟知的ChatGPT仍然有着很大的差距，使用ChatGPT只需要像和人类一样对话，就可以完成任务。除了形式上的不同之外，还有一个更加重要的差距，那就是安全性上的差别。

歸藏翻译：简单易懂，强烈推荐-Codesignal提示工程教程 #1

想象一下，文体规范就像是向一位技艺高超的厨师下达指令一样。正如您会指定牛排的烹饪程度一样，您也可以指导大语言模型产生您所期望的文本“风味”。文体可以涵盖各种元素，包括语气（正式、非正式）、语言风格（简洁、专业）以及长度（简短、详细）等。例如，当我们这样指定：回复：“在每一个挑战中，我们都能找到共同变强的机会。让我们勇敢地迎接旅程，团结一致，迈向充满成功的未来。记住，团队的力量源于每个成员，每个成员的力量则源于团队。”如果您从提示中移除“长度：短”的限制，结果将明显不同：“独自一人我们能做的很少；团结一心我们能做的很多。让我们共同发挥集体的力量、梦想和抱负。每一个我们面临的挑战，都是一同变得更强的机会。记住，成功不仅仅在于达到顶峰，更在于我们共同经历的旅程和我们建立的深厚情谊。让我们携手前行，共同追求我们的愿景。因为当我们团结一致时，没有什么是不可能的。”[heading2]提示中的语气作用[content]在设计提示时设定明确的语气，可以引导大语言模型生成与您的情感或专业背景一致的回答。示例：在这个示例中，通过指定语气，提示了大语言模型平衡专业信息的传递与通俗易懂，确保内容对听众来说不会显得过于技术性。[heading2]语言和复杂性[content]尤其当您的目标受众在专业知识水平上有很大差异时，明确指定所需输出的语言和复杂性非常关键。这可能意味着根据目标读者的不同，选择使用简单或专业的语言风格。示例：这个提示引导大语言模型使用通俗的语言，使那些没有技术背景的人也能理解复杂的技术概念。