以下是一些常见的嵌入式模型:
1. OpenAI 提供了第二代嵌入模型 textembeddingada002,它具有更好、更便宜、更易于使用的特点。使用 cl100k_base 分词器,最大输入 token 为 8191,输出为 1536。
2. OpenAI 还提供了 16 个第一代模型(以 001 结尾),均使用 GPT3 分词器,最大输入为 2046 个分词。第一代嵌入模型包括针对不同任务调整的五个系列,如相似性嵌入(如 textsimilaritybabbage001、textsimilaritycurie001、textsimilaritydavinci001)、文本搜索嵌入(如 textsearchadaquery001 等)、代码搜索嵌入(如 codesearchadatext001 等)。
3. 此外,还有 Whisper 这种通用的语音识别模型,它是多任务模型,可执行多语言语音识别以及语音翻译和语言识别,目前可通过 OpenAI 的 API(模型名 whisper1)使用 Whisper v2large 模型。
2025-04-09