Chat with Wiki - 方言识别

Answer

以下是关于方言识别的相关信息：

在 AI 术语库中，与语音相关的术语有“Speech Recognition（语音识别）”。

语音转文本（Speech to text）支持的语言包括：南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚文、保加利亚文、加泰罗尼亚文、中文、克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英语、加利西亞語、德國語、希臘語、希伯來語、印地語、匈牙利語、冰岛语、印度尼西亚语、意大利语、日本语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语、毛里求斯语、尼泊尔语、挪威语、波斯语、波苏尼语、塔加洛语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语。

在模型方面，Whisper 是一种通用的语音识别模型，在不同音频的大型数据集上进行训练，是多任务模型，可执行多语言语音识别、语音翻译和语言识别。目前可通过 API（模型名 whisper-1）使用 Whisper v2-large 模型。Whisper 的开源版本和通过 API 提供的版本目前无区别，但 API 提供了优化的推理过程，运行速度更快。更多技术细节可阅读论文（https://arxiv.org/abs/2212.04356）。

嵌入（Embedding）是文本的数字表示，可用于衡量两段文本之间的相关性。第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 种第一代嵌入模型，可用于搜索、聚类、推荐、异常检测和分类任务。更多信息可在公告博客文章（https://openai.com/blog/new-and-improved-embedding-model）中阅读。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI术语库-人工标注版

|术语ID|原文|译文|领域|易混淆|缩写|不需要提醒||-|-|-|-|-|-|-||ROW()-1|Spectral Clustering|谱聚类|AI|1||||ROW()-1|Spectral Radius|谱半径|AI|1||||ROW()-1|Speech Recognition|语音识别|AI|1||||ROW()-1|Sphering|Sphering|AI|1||||ROW()-1|Spike And Slab|尖峰和平板|AI|||||ROW()-1|Spike And Slab RBM|尖峰和平板RBM|AI|||||ROW()-1|Spiking Neural Nets|脉冲神经网络|AI|1||||ROW()-1|Splitting Point|切分点|AI|1||||ROW()-1|Splitting Variable|切分变量|AI|1||||ROW()-1|Spurious Modes|虚假模态（Spurious Modes）|AI|1||||ROW()-1|Square|方阵|AI|1||||ROW()-1|Square Loss|平方损失|AI|1|||

语音转文本（Speech to text）

南非荷兰语,阿拉伯语,亚美尼亚语,阿塞拜疆语,白俄罗斯语,波斯尼亚文,保加利亚文,加泰罗尼亚文,中文,克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英語,加利西亞語,德國語,希臘語,希伯來語,印地語,匈牙利語,冰島icelandic読音:[ˈaɪsləndɪk],印度尼西雅Indonesian読音:[indoneˈsia],意大利Italian読音:[iːtæljən],日本Japanese読音:[dʒæpəniːz],卡纳达Kannada読音:[kʌn'na:dʌ],哈萨克Kazakh読音:[kɑzɑx],韩国Korean读作:[hanguk],拉脫維Latvian读作:[lætvijan],立陶宛Lithuanian读作:[liθu'einjən],马其顿Macedonian读作:[mækidouniən],马来Malay读作:['meilei],馬拉地Marathi讀作:[ma'rathi],毛里求斯Maori讀作:[mauri],尼泊尔Nepali讀作:[ne'pa:l],挪威Norwegian讀作:['no:wijiən],波斯Persian讀做[persi'an],波蘇尼Serbian讀做sǎrbijǝTagalog讀做tӕgӕ'lɔg,坦米爾Tamil讀做'tæmil,泰Thai讀做[tai],土耳其Turkish讀健[turki'sh],烏Crainian(乌克兰)Ukrainian讀健[jukreinjǝn],烏Urdu(乌尔都)Urdu讓你[u:

模型（Models）

Whisper是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。目前可通过我们的API（模型名whisper-1）使用Whisper v2-large模型。目前，[Whisper的开源版本](https://github.com/openai/whisper)和通过我们的API提供的版本之间没有区别。但是，通过我们的API，我们提供了一个优化的推理过程，这使得通过我们的API运行Whisper比通过其他方式运行要快得多。有关Whisper的更多技术细节，您可以[阅读论文](https://arxiv.org/abs/2212.04356)。[heading2]嵌入（Embedding）[content]嵌入（Embedding）是文本的数字表示，可用于衡量两段文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002旨在以一小部分成本取代之前的16种第一代嵌入（Embedding）模型。嵌入（Embedding）可用于搜索、聚类、推荐、异常检测和分类任务。您可以在[公告博客文章](https://openai.com/blog/new-and-improved-embedding-model)中阅读有关我们最新嵌入模型的更多信息。