模型
旗舰型号
模型概述
OpenAI API 由具有不同功能和价位的各种模型提供支持。您还可以通过微调来针对您的特定用例对我们的模型进行自定义。
MODEL | 描述 |
---|---|
GPT-4o | 我们的高智能旗舰模型,适用于复杂的多步骤任务 |
GPT-4o mini | 我们经济实惠的智能小型型号,适用于快速、轻便的任务 |
o1-preview 和 o1-mini | 使用强化学习训练的语言模型来执行复杂的推理。 |
GPT-4 Turbo 和 GPT-4 | 上一组高智能模型 |
GPT-3.5 Turbo | 适用于简单任务的快速、廉价模型 |
DALL·E | 可以在给定自然语言提示的情况下生成和编辑图像的模型 |
TTS | 一组可以将文本转换为自然语音音频的模型 |
Whisper | 可以将音频转换为文本的模型 |
Embeddings | 一组可以将文本转换为数字形式的模型 |
评审 | 可以检测文本是否敏感或不安全的微调模型 |
已废弃 | 已弃用的模型的完整列表以及建议的替代模型 |
对于 GPT 系列模型,上下文窗口是指单个请求中可以使用的最大令牌数,包括输入和输出令牌。
持续的模型升级
gpt-4o
、 、 并指向各自的最新模型版本。您可以通过在发送请求后查看响应对象来验证这一点。响应将包括使用的特定模型版本(例如 )。模型版本不断指向 ChatGPT 中使用的 GPT-4o 版本,并在有重大变化时频繁更新。除 外,我们提供固定模型版本,开发人员可以在引入更新模型后至少继续使用这些版本三个月。gpt-4o-mini
gpt-4-turbo
gpt-4
gpt-3.5-turbo
gpt-3.5-turbo-1106
chatgpt-4o-latest
chatgpt-4o-latest
在我们的弃用页面上了解有关模型弃用的更多信息。
GPT-4o
GPT-4o(“o”代表“omni”)是我们最先进的 GPT 模型。它是多模态的(接受文本或图像输入并输出文本),它具有与 GPT-4 Turbo 相同的高智能,但效率要高得多——它生成文本的速度提高了 2 倍,成本降低了 50%。此外,GPT-4o 在我们的任何模型中在非英语语言中具有最好的视野和性能。GPT-4o 在 OpenAI API 中可供付费客户使用。在我们的文本生成指南中了解如何使用 GPT-4o。
MODEL | Context window | Max output tokens | Knowledge cutoff |
---|---|---|---|
GPT-4O 我们的高智能旗舰模型,适用于复杂的多步骤任务。GPT-4o 比 GPT-4 Turbo 更便宜、更快。当前指向 。 gpt-4o-2024-08-06 | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
GPT-4O-2024-11-20 2024 年 11 月 20 日的最新快照。 gpt-4o | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
GPT-4O-2024-08-06 第一个支持结构化输出的快照。 当前指向此版本。 gpt-4o | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
GPT-4O-2024-05-13 2024 年 5 月 13 日的原始快照。 gpt-4o | 128,000 个代币 | 4,096 个代币 | 2023 年 10 月 |
chatgpt-4o-最新 模型版本不断指向 ChatGPT 中使用的 GPT-4o 版本,并在有重大变化时频繁更新。 chatgpt-4o-latest | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
GPT-4o mini
GPT-4o mini(“o”代表“omni”)是我们小型型号类别中最先进的型号,也是我们迄今为止最便宜的型号。
它是多模态的(接受文本或图像输入并输出文本),具有更高的智能,但同样快。
它旨在用于较小的任务,包括视觉任务。gpt-3.5-turbo
我们建议您选择您以前使用的地方,因为这种模型功能更强大且更便宜。gpt-4o-mini
gpt-3.5-turbo
MODEL | Context window | Max output tokens | Knowledge cutoff |
---|---|---|---|
GPT-4O-迷你 我们经济实惠的智能小型型号,适用于快速、轻便的任务。GPT-4o mini 比 GPT-3.5 Turbo 更便宜、功能更强大。当前指向 。 gpt-4o-mini-2024-07-18 | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
GPT-4O-迷你-2024-07-18gpt-4o-mini 当前指向此版本。 | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
GPT-4o 实时 + 音频
这是 GPT-4o Realtime 和 Audio 模型的预览版。这些模型能够通过 WebSocket 接口响应音频和文本输入。如需了解更多信息,请参阅 Realtime API 指南。以下模型可用于 Chat Completions 以生成音频响应。gpt-4o-realtime-*
gpt-4o-audio-*
MODEL | Context window | Max output tokens | Knowledge cutoff |
---|---|---|---|
gpt-4o-实时预览 Realtime API 预览版 | 128,000 个代币 | 4,096 个代币 | 2023 年 10 月 |
GPT-4O-实时预览-2024-10-01 Realtime API 模型的当前快照。 | 128,000 个代币 | 4,096 个代币 | 2023 年 10 月 |
gpt-4o-音频预览 预览聊天补全中音频输入的版本。 | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
GPT-4o-音频预览-2024-10-01 Audio API 模型的当前快照。 | 128,000 个代币 | 16,384 个代币 | 2023 年 10 月 |
o1-preview 和 o1-mini
o1 系列大型语言模型采用强化训练
学习进行复杂推理。o1 模型在回答之前会三思而后行,
在响应用户之前产生一个漫长的内部思维链。
在我们的推理指南中了解 o1 模型的功能和限制。
目前有两种型号可供选择:
- o1-preview:旨在解决跨领域的难题的推理模型。
- o1-mini:更快、更便宜的推理模型,特别擅长编码、数学和科学。
MODEL | Context window | Max output tokens | Knowledge cutoff |
---|---|---|---|
o1-preview 指向 o1 模型的最新快照: o1-preview-2024-09-12 | 128,000 个代币 | 32,768 个代币 | 2023 年 10 月 |
o1-preview-2024-09-12 最新的 o1 模型快照 | 128,000 个代币 | 32,768 个代币 | 2023 年 10 月 |
O1-迷你 指向最新的 o1-mini 快照: o1-mini-2024-09-12 | 128,000 个代币 | 65,536 个代币 | 2023 年 10 月 |
o1-迷你-2024-09-12 最新的 o1-mini 模型快照 | 128,000 个代币 | 65,536 个代币 | 2023 年 10 月 |
GPT-4 Turbo 和 GPT-4
GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。GPT-4 在 OpenAI API 中可供付费客户使用。与 一样,GPT-4 针对聊天进行了优化,但适用于使用 Chat Completions API 的传统完成任务。在我们的文本生成指南中了解如何使用 GPT-4。gpt-3.5-turbo
MODEL | Context window | Max output tokens | Knowledge cutoff |
---|---|---|---|
gpt-4-turbo 具有视觉功能的最新 GPT-4 Turbo 模型。Vision 请求现在可以使用 JSON 模式和函数调用。当前指向 。 gpt-4-turbo-2024-04-09 | 128,000 个代币 | 4,096 个代币 | 2023 年 12 月 |
gpt-4-turbo-2024-04-09 GPT-4 Turbo with Vision 模型。Vision 请求现在可以使用 JSON 模式和函数调用。 当前指向此版本。 gpt-4-turbo | 128,000 个代币 | 4,096 个代币 | 2023 年 12 月 |
gpt-4-turbo-preview GPT-4 Turbo 预览模型。当前指向 。 gpt-4-0125-preview | 128,000 个代币 | 4,096 个代币 | 2023 年 12 月 |
GPT-4-0125-preview GPT-4 Turbo 预览模型旨在减少模型未完成任务的“懒惰”情况。了解更多。 | 128,000 个代币 | 4,096 个代币 | 2023 年 12 月 |
GPT-4-1106-preview GPT-4 Turbo 预览模型具有改进的指令跟随、JSON 模式、可重现输出、并行函数调用等功能。这是一个预览模型。了解更多。 | 128,000 个代币 | 4,096 个代币 | 2023 年 4 月 |
GPT-4 当前指向 。请参阅持续模型升级。 gpt-4-0613 | 8,192 个代币 | 8,192 个代币 | 2021 年 9 月 |
GPT-4-0613 2023 年 6 月 13 日的快照,改进了函数调用支持。 gpt-4 | 8,192 个代币 | 8,192 个代币 | 2021 年 9 月 |
GPT-4-0314 Legacy 2023 年 3 月 14 日的快照。 gpt-4 | 8,192 个代币 | 8,192 个代币 | 2021 年 9 月 |
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都要强大得多。
多语言功能
GPT-4 的性能优于以前的大型语言模型和截至 2023 年的大多数最先进的系统(通常具有特定于基准的训练或手动工程)。在 MMLU 基准测试(涵盖 57 个主题的英语多项选择题套件)上,GPT-4 不仅在英语中以相当大的优势优于现有模型,而且在其他语言中也表现出强劲的性能。
GPT-3.5 Turbo
GPT-3.5 Turbo 模型可以理解和生成自然语言或代码,并已针对使用 Chat Completions API 的聊天进行了优化,但也适用于非聊天任务。
MODEL | Context window | Max output tokens | Knowledge cutoff |
---|---|---|---|
GPT-3.5-turbo-0125 最新的 GPT-3.5 Turbo 模型在响应请求的格式时具有更高的准确性,并修复了导致非英语函数调用出现文本编码问题的错误。了解更多。 | 16,385 个代币 | 4,096 个代币 | 2021 年 9 月 |
GPT-3.5-turbo增压器 当前指向 。 gpt-3.5-turbo-0125 | 16,385 个代币 | 4,096 个代币 | 2021 年 9 月 |
GPT-3.5-turbo-1106 GPT-3.5 Turbo 模型,具有改进的指令跟随、JSON 模式、可重现的输出、并行函数调用等。了解更多。 | 16,385 个代币 | 4,096 个代币 | 2021 年 9 月 |
gpt-3.5-turbo-instruct 与 GPT-3 时代模型类似的功能。与旧版 Completions 端点兼容,与 Chat Completions 不兼容。 | 4,096 个代币 | 4,096 个代币 | 2021 年 9 月 |
DALL·E
DALL·E 是一个 AI 系统,可以根据自然语言的描述创建逼真的图像和艺术。DALL·E 3 当前支持在提示时创建具有特定大小的新图像的功能。DALL·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。
DALL·E 3 通过我们的图像 API 以及 DALL·E 2.您可以试用 DALL·E 3 通过 ChatGPT Plus。
MODEL | 描述 |
---|---|
dall-e-3 | 最新的 DALL·E 型号于 2023 年 11 月发布。了解更多。 |
dall-e-2 | 上一代 DALL·E 型号于 2022 年 11 月发布。The 2nd iteration of DALL·E 具有更逼真、更准确且分辨率比原始模型高 4 倍的图像。 |
TTS
TTS 是一种 AI 模型,可将文本转换为听起来自然的口语文本。我们提供两种不同的模型变体,针对实时文本转语音用例进行了优化,并针对质量进行了优化。这些模型可以与音频 API 中的 Speech 终端节点一起使用。tts-1
tts-1-hd
MODEL | 描述 |
---|---|
tts-1 | 最新的文本转语音模型,针对速度进行了优化。 |
tts-1-hd | 最新的文本转语音模型,针对质量进行了优化。 |
Whisper
Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 使用模型名称获得。whisper-1
目前,Whisper 的开源版本和通过我们的 API 提供的版本之间没有区别。但是,通过我们的 API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读论文。
Embeddings
嵌入是文本的数字表示形式,可用于度量两段文本之间的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。
MODEL | 输出维度 |
---|---|
text-embedding-3-large 最适合英语和非英语任务的嵌入模型 | 3,072 |
text-embedding-3-small 与第 2 代 ADA 嵌入模型相比,性能更高 | 1,536 |
text-embedding-ada-002 功能最强大的第 2 代嵌入模型,取代了 16 个第一代模型 | 1,536 |
评审
审核模型旨在检查内容是否符合 OpenAI 的使用策略。这些模型提供了分类功能,用于查找仇恨、自残、性内容、暴力等类别中的内容。在我们的审核指南中了解有关审核文本和图像的更多信息。
MODEL | 最大令牌数 |
---|---|
omni-moderation-latest 当前指向 。 omni-moderation-2024-09-26 | 32,768 |
omni-moderation-2024-09-26 我们新的多模态审核模型的最新固定版本,能够分析文本和图像。 | 32,768 |
text-moderation-latest 当前指向 。 text-moderation-007 | 32,768 |
text-moderation-stable 当前指向 。 text-moderation-007 | 32,768 |
text-moderation-007 上一代纯文本审核。我们预计 models 将是未来最好的默认模型。 omni-moderation-* | 32,768 |
GPT 基础
GPT 基础模型可以理解和生成自然语言或代码,但不使用指令跟随进行训练。这些模型是为了替代我们原来的 GPT-3 基本模型,并使用传统的 Completions API。大多数客户应使用 GPT-3.5 或 GPT-4。
MODEL | 最大令牌数 | Knowledge cutoff |
---|---|---|
babbage-002 替代 GPT-3 和基本模型。 ada babbage | 16,384 个代币 | 2021 年 9 月 |
davinci-002 替代 GPT-3 和基本模型。 curie davinci | 16,384 个代币 | 2021 年 9 月 |
我们如何使用您的数据
您的数据就是您的数据。
自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型(除非您明确选择与我们共享数据,例如在 Playground 中提供反馈)。选择加入的一个好处是,随着时间的推移,模型可能会在您的使用案例中变得更好。
为了帮助识别滥用行为,API 数据可能会保留长达 30 天,之后将被删除(除非法律另有要求)。对于使用敏感应用程序的受信任客户,可能可以使用零数据保留。在零数据保留的情况下,请求和响应正文不会持久化到任何日志记录机制中,而仅存在于内存中以便为请求提供服务。
请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPT 或 DALL·E 实验室。
按终端节点划分的默认使用策略
Endpoint | 用于训练的数据 | 默认保留期 | 符合零保留条件 |
---|---|---|---|
/v1/chat/completions * | 不 | 30 天 | 是的,但 (a) 图像输入、(b) 为结构化输出提供的架构或 (c) 音频输出除外。* |
/v1/assistants | 不 | 30 天 ** | 不 |
/v1/threads | 不 | 30 天 ** | 不 |
/v1/threads/messages | 不 | 30 天 ** | 不 |
/v1/threads/runs | 不 | 30 天 ** | 不 |
/v1/vector_stores | 不 | 30 天 ** | 不 |
/v1/threads/runs/steps | 不 | 30 天 ** | 不 |
/v1/images/generations | 不 | 30 天 | 不 |
/v1/images/edits | 不 | 30 天 | 不 |
/v1/images/variations | 不 | 30 天 | 不 |
/v1/embeddings | 不 | 30 天 | 是的 |
/v1/audio/transcriptions | 不 | 零数据保留 | - |
/v1/audio/translations | 不 | 零数据保留 | - |
/v1/audio/speech | 不 | 30 天 | 是的 |
/v1/files | 不 | 直到客户删除 | 不 |
/v1/fine_tuning/jobs | 不 | 直到客户删除 | 不 |
/v1/batches | 不 | 直到客户删除 | 不 |
/v1/moderations | 不 | 零数据保留 | - |
/v1/completions | 不 | 30 天 | 是的 |
/v1/realtime (测试版) | 不 | 30 天 | 是的 |
* 聊天完成次数:
- 通过 、 、 或 models (或之前) 进行的图像输入不符合零保留条件。
gpt-4o
gpt-4o-mini
chatgpt-4o-latest
gpt-4-turbo
gpt-4-vision-preview
- 音频输出将存储 1 小时以启用多轮对话,目前不符合零保留条件。
- 启用 Structured Outputs 后,提供的架构(作为 或 在函数定义中)不符合零保留条件,尽管完成本身是。
response_format
- 通过 API 中的选项使用存储的补全时,这些补全将存储 30 天。补全在 API 响应后以未过滤的形式存储,因此请避免存储包含敏感数据的补全。
store: true
** 助手 API:
- 与 Assistants API 相关的对象将在您通过 API 或控制面板删除 30 天后从我们的服务器中删除。未通过 API 或控制面板删除的对象将无限期保留。
评估:
- 评估数据:当您创建评估时,与该评估相关的数据将在您通过控制面板删除 30 天后从我们的服务器中删除。未通过控制面板删除的评估数据将无限期保留。
有关详细信息,请参阅我们的 API 数据使用政策。要了解有关零留存的更多信息,请联系我们的销售团队。
模型终端节点兼容性
Endpoint | 最新型号 |
---|---|
/v1/assistants 中 | 所有 GPT-4o(除外)、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型。该工具需要 (和后续的日期模型授权) 或 (和后续版本)。chatgpt-4o-latest retrieval gpt-4-turbo-preview gpt-3.5-turbo-1106 |
/v1/audio/transcriptions (英语) | whisper-1 |
/v1/audio/translations 中 | whisper-1 |
/v1/audio/speech | tts-1 ,tts-1-hd |
/v1/chat/completions | 所有 GPT-4o(实时预览除外)、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型及其过时版本。 动态模型。、、 、 和 的微调版本。chatgpt-4o-latest gpt-4o gpt-4o-mini gpt-4 gpt-3.5-turbo |
/v1/completions(旧版) | gpt-3.5-turbo-instruct , ,babbage-002 davinci-002 |
/v1/embeddings | text-embedding-3-small , ,text-embedding-3-large text-embedding-ada-002 |
/v1/fine_tuning/jobs 中 | gpt-4o , , ,gpt-4o-mini gpt-4 gpt-3.5-turbo |
/v1/moderations (英语) | text-moderation-stable ,text-moderation-latest |
/v1/images/generations 中 | dall-e-2 ,dall-e-3 |
/v1/realtime(测试版) | gpt-4o-realtime-preview ,gpt-4o-realtime-preview-2024-10-01 |
此列表不包括我们所有已弃用的模型。