Chat with Wiki - 批量语言转文字

Answer

以下是关于批量语言转文字的相关信息：

支持的语言：南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚文、保加利亚文、加泰罗尼亚文、中文、克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英语、加利西亞語、德國語、希臘語、希伯來語、印地語、匈牙利語、冰岛语、印度尼西亚语、意大利语、日本语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语、毛里求斯语、尼泊尔语、挪威语、波斯语、波苏尼语、塔加洛语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语。
更长输入：默认情况下，Whisper API 仅支持小于 25MB 的文件。若音频文件大于此，需将其分成每个小于 25MB 的块或使用压缩后格式。为达最佳性能，避免在句子中间断开声音以防丢失上下文字信息。可使用 PyDub 开源 Python 软件包来拆分声频文件，但 OpenAI 对其可用性或安全性不作保证。
提示：可使用提示提高 Whisper API 生成的转录质量。模型会尝试匹配提示风格，如提示使用大写和标点符号，生成结果更可能使用它们。当前提示系统较其他语言模型受限，仅提供有限控制。示例如下：
- 对于模型常错识的特定单词或缩略语，提示很有帮助，如改善 DALL·E 和 GPT-3 等单词的转录。
- 为保留分段文件上下文，可用先前片段的转录引导模型，模型仅考虑最后 224 个标记并忽略之前内容。
- 转录可能会跳过标点符号，可用包含标点符号的简单提示避免。
- 模型可能省略常见填充词汇，若想保留，可用包含它们的指示。
- 某些语言有不同书写方式，如简体或繁体中文，默认模型处理可能不按所需风格，添加指示可改进。

Content generated by AI large model, please carefully verify (powered by aily)

References

南非荷兰语,阿拉伯语,亚美尼亚语,阿塞拜疆语,白俄罗斯语,波斯尼亚文,保加利亚文,加泰罗尼亚文,中文,克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英語,加利西亞語,德國語,希臘語,希伯來語,印地語,匈牙利語,冰島icelandic読音:[ˈaɪsləndɪk],印度尼西雅Indonesian読音:[indoneˈsia],意大利Italian読音:[iːtæljən],日本Japanese読音:[dʒæpəniːz],卡纳达Kannada読音:[kʌn'na:dʌ],哈萨克Kazakh読音:[kɑzɑx],韩国Korean读作:[hanguk],拉脫維Latvian读作:[lætvijan],立陶宛Lithuanian读作:[liθu'einjən],马其顿Macedonian读作:[mækidouniən],马来Malay读作:['meilei],馬拉地Marathi讀作:[ma'rathi],毛里求斯Maori讀作:[mauri],尼泊尔Nepali讀作:[ne'pa:l],挪威Norwegian讀作:['no:wijiən],波斯Persian讀做[persi'an],波蘇尼Serbian讀做sǎrbijǝTagalog讀做tӕgӕ'lɔg,坦米爾Tamil讀做'tæmil,泰Thai讀做[tai],土耳其Turkish讀健[turki'sh],烏Crainian(乌克兰)Ukrainian讀健[jukreinjǝn],烏Urdu(乌尔都)Urdu讓你[u:

语音转文本（Speech to text）

默认情况下Whisper API仅支持小于25 MB的文件。如果您有一个比这更长的音频文件，则需要将其分成每个小于25 MB的块或使用压缩后格式。为了获得最佳性能，请避免在句子中间断开声音以避免丢失一些上下文字信息。处理此问题的一种方法是使用PyDub开源Python软件包来拆分声频文件。OpenAI对于像PyDub这样的第三方软件的可用性或安全性不作任何保证。[heading2]提示[content]您可以使用提示来提高Whisper API生成的转录质量。模型将尝试匹配提示的风格，因此如果提示也使用大写和标点符号，则更有可能使用它们。但是，当前的提示系统比我们其他语言模型要受限得多，并且仅提供对生成音频的有限控制。以下是一些示例，说明如何在不同情况下使用提示：1.对于模型经常错误识别音频中特定单词或缩略语非常有帮助。例如，以下提示改善了DALL·E和GPT-3这些单词（以前被写成“GDP 3”和“DALI”）的转录。2.为了保留分段文件的上下文，请使用先前片段的转录来引导模型。这将使转录更准确，因为模型将利用先前音频中相关信息。该模型只会考虑最后224个标记并忽略之前任何内容。3.有时候，在转录中可能会跳过标点符号。您可以通过使用包含标点符号简单提示来避免这种情况：4.该模型还可能在音频中省略常见填充词汇。如果您想在您的转录中保留填充词汇，则可以使用包含它们的指示：5.某些语言可以用不同方式书写，例如简体或繁体中文。默认情况下，该模型可能无法始终按照所需书写风格进行处理。通过在首选书写风格上添加指示即可改进此问题.