模型

MODEL	描述
GPT-4o	我们的高智能旗舰模型，适用于复杂的多步骤任务
GPT-4o mini	我们经济实惠的智能小型型号，适用于快速、轻便的任务
o1-preview 和 o1-mini	使用强化学习训练的语言模型来执行复杂的推理。
GPT-4 Turbo 和 GPT-4	上一组高智能模型
GPT-3.5 Turbo	适用于简单任务的快速、廉价模型
DALL·E	可以在给定自然语言提示的情况下生成和编辑图像的模型
TTS	一组可以将文本转换为自然语音音频的模型
Whisper	可以将音频转换为文本的模型
Embeddings	一组可以将文本转换为数字形式的模型
评审	可以检测文本是否敏感或不安全的微调模型
已废弃	已弃用的模型的完整列表以及建议的替代模型

对于 GPT 系列模型，上下文窗口是指单个请求中可以使用的最大令牌数，包括输入和输出令牌。

我们还发布了开源模型，包括 Point-E、Whisper、Jukebox 和 CLIP。

持续的模型升级

gpt-4o、、并指向各自的最新模型版本。您可以通过在发送请求后查看响应对象来验证这一点。响应将包括使用的特定模型版本（例如）。模型版本不断指向 ChatGPT 中使用的 GPT-4o 版本，并在有重大变化时频繁更新。除外，我们提供固定模型版本，开发人员可以在引入更新模型后至少继续使用这些版本三个月。gpt-4o-minigpt-4-turbogpt-4gpt-3.5-turbogpt-3.5-turbo-1106chatgpt-4o-latestchatgpt-4o-latest

在我们的弃用页面上了解有关模型弃用的更多信息。

GPT-4o

GPT-4o（“o”代表“omni”）是我们最先进的 GPT 模型。它是多模态的（接受文本或图像输入并输出文本），它具有与 GPT-4 Turbo 相同的高智能，但效率要高得多——它生成文本的速度提高了 2 倍，成本降低了 50%。此外，GPT-4o 在我们的任何模型中在非英语语言中具有最好的视野和性能。GPT-4o 在 OpenAI API 中可供付费客户使用。在我们的文本生成指南中了解如何使用 GPT-4o。

MODEL	Context window	Max output tokens	Knowledge cutoff
GPT-4O 我们的高智能旗舰模型，适用于复杂的多步骤任务。GPT-4o 比 GPT-4 Turbo 更便宜、更快。当前指向。`gpt-4o-2024-08-06`	128,000 个代币	16,384 个代币	2023 年 10 月
GPT-4O-2024-11-20 2024 年 11 月 20 日的最新快照。`gpt-4o`	128,000 个代币	16,384 个代币	2023 年 10 月
GPT-4O-2024-08-06 第一个支持结构化输出的快照。当前指向此版本。`gpt-4o`	128,000 个代币	16,384 个代币	2023 年 10 月
GPT-4O-2024-05-13 2024 年 5 月 13 日的原始快照。`gpt-4o`	128,000 个代币	4,096 个代币	2023 年 10 月
chatgpt-4o-最新模型版本不断指向 ChatGPT 中使用的 GPT-4o 版本，并在有重大变化时频繁更新。`chatgpt-4o-latest`	128,000 个代币	16,384 个代币	2023 年 10 月

GPT-4o mini

GPT-4o mini（“o”代表“omni”）是我们小型型号类别中最先进的型号，也是我们迄今为止最便宜的型号。它是多模态的（接受文本或图像输入并输出文本），具有更高的智能，但同样快。它旨在用于较小的任务，包括视觉任务。gpt-3.5-turbo

我们建议您选择您以前使用的地方，因为这种模型功能更强大且更便宜。gpt-4o-minigpt-3.5-turbo

MODEL	Context window	Max output tokens	Knowledge cutoff
GPT-4O-迷你我们经济实惠的智能小型型号，适用于快速、轻便的任务。GPT-4o mini 比 GPT-3.5 Turbo 更便宜、功能更强大。当前指向。`gpt-4o-mini-2024-07-18`	128,000 个代币	16,384 个代币	2023 年 10 月
GPT-4O-迷你-2024-07-18 `gpt-4o-mini`当前指向此版本。	128,000 个代币	16,384 个代币	2023 年 10 月

GPT-4o 实时 + 音频
试用版

这是 GPT-4o Realtime 和 Audio 模型的预览版。这些模型能够通过 WebSocket 接口响应音频和文本输入。如需了解更多信息，请参阅 Realtime API 指南。以下模型可用于 Chat Completions 以生成音频响应。gpt-4o-realtime-*gpt-4o-audio-*

MODEL	Context window	Max output tokens	Knowledge cutoff
gpt-4o-实时预览 Realtime API 预览版	128,000 个代币	4,096 个代币	2023 年 10 月
GPT-4O-实时预览-2024-10-01 Realtime API 模型的当前快照。	128,000 个代币	4,096 个代币	2023 年 10 月
gpt-4o-音频预览预览聊天补全中音频输入的版本。	128,000 个代币	16,384 个代币	2023 年 10 月
GPT-4o-音频预览-2024-10-01 Audio API 模型的当前快照。	128,000 个代币	16,384 个代币	2023 年 10 月

o1-preview 和 o1-mini
试用版

o1 系列大型语言模型采用强化训练学习进行复杂推理。o1 模型在回答之前会三思而后行，在响应用户之前产生一个漫长的内部思维链。
在我们的推理指南中了解 o1 模型的功能和限制。

目前有两种型号可供选择：

o1-preview：旨在解决跨领域的难题的推理模型。
o1-mini：更快、更便宜的推理模型，特别擅长编码、数学和科学。

MODEL	Context window	Max output tokens	Knowledge cutoff
o1-preview 指向 o1 模型的最新快照：`o1-preview-2024-09-12`	128,000 个代币	32,768 个代币	2023 年 10 月
o1-preview-2024-09-12 最新的 o1 模型快照	128,000 个代币	32,768 个代币	2023 年 10 月
O1-迷你指向最新的 o1-mini 快照：`o1-mini-2024-09-12`	128,000 个代币	65,536 个代币	2023 年 10 月
o1-迷你-2024-09-12 最新的 o1-mini 模型快照	128,000 个代币	65,536 个代币	2023 年 10 月

GPT-4 Turbo 和 GPT-4

GPT-4 是一个大型多模态模型（接受文本或图像输入并输出文本），由于其更广泛的常识和先进的推理能力，它可以比我们以前的任何模型更准确地解决难题。GPT-4 在 OpenAI API 中可供付费客户使用。与一样，GPT-4 针对聊天进行了优化，但适用于使用 Chat Completions API 的传统完成任务。在我们的文本生成指南中了解如何使用 GPT-4。gpt-3.5-turbo

MODEL	Context window	Max output tokens	Knowledge cutoff
gpt-4-turbo 具有视觉功能的最新 GPT-4 Turbo 模型。Vision 请求现在可以使用 JSON 模式和函数调用。当前指向。`gpt-4-turbo-2024-04-09`	128,000 个代币	4,096 个代币	2023 年 12 月
gpt-4-turbo-2024-04-09 GPT-4 Turbo with Vision 模型。Vision 请求现在可以使用 JSON 模式和函数调用。当前指向此版本。`gpt-4-turbo`	128,000 个代币	4,096 个代币	2023 年 12 月
gpt-4-turbo-preview GPT-4 Turbo 预览模型。当前指向。`gpt-4-0125-preview`	128,000 个代币	4,096 个代币	2023 年 12 月
GPT-4-0125-preview GPT-4 Turbo 预览模型旨在减少模型未完成任务的“懒惰”情况。了解更多。	128,000 个代币	4,096 个代币	2023 年 12 月
GPT-4-1106-preview GPT-4 Turbo 预览模型具有改进的指令跟随、JSON 模式、可重现输出、并行函数调用等功能。这是一个预览模型。了解更多。	128,000 个代币	4,096 个代币	2023 年 4 月
GPT-4 当前指向。请参阅持续模型升级。`gpt-4-0613`	8,192 个代币	8,192 个代币	2021 年 9 月
GPT-4-0613 2023 年 6 月 13 日的快照，改进了函数调用支持。`gpt-4`	8,192 个代币	8,192 个代币	2021 年 9 月
GPT-4-0314 Legacy 2023 年 3 月 14 日的快照。`gpt-4`	8,192 个代币	8,192 个代币	2021 年 9 月

对于许多基本任务，GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而，在更复杂的推理情况下，GPT-4 比我们之前的任何模型都要强大得多。

多语言功能

GPT-4 的性能优于以前的大型语言模型和截至 2023 年的大多数最先进的系统（通常具有特定于基准的训练或手动工程）。在 MMLU 基准测试（涵盖 57 个主题的英语多项选择题套件）上，GPT-4 不仅在英语中以相当大的优势优于现有模型，而且在其他语言中也表现出强劲的性能。

GPT-3.5 Turbo

GPT-3.5 Turbo 模型可以理解和生成自然语言或代码，并已针对使用 Chat Completions API 的聊天进行了优化，但也适用于非聊天任务。

截至 2024 年 7 月，应该用来代替，因为它更便宜、更强大、多式联运且同样快速。仍可在 API 中使用。gpt-4o-minigpt-3.5-turbogpt-3.5-turbo

MODEL	Context window	Max output tokens	Knowledge cutoff
GPT-3.5-turbo-0125 最新的 GPT-3.5 Turbo 模型在响应请求的格式时具有更高的准确性，并修复了导致非英语函数调用出现文本编码问题的错误。了解更多。	16,385 个代币	4,096 个代币	2021 年 9 月
GPT-3.5-turbo增压器当前指向。`gpt-3.5-turbo-0125`	16,385 个代币	4,096 个代币	2021 年 9 月
GPT-3.5-turbo-1106 GPT-3.5 Turbo 模型，具有改进的指令跟随、JSON 模式、可重现的输出、并行函数调用等。了解更多。	16,385 个代币	4,096 个代币	2021 年 9 月
gpt-3.5-turbo-instruct 与 GPT-3 时代模型类似的功能。与旧版 Completions 端点兼容，与 Chat Completions 不兼容。	4,096 个代币	4,096 个代币	2021 年 9 月

DALL·E

DALL·E 是一个 AI 系统，可以根据自然语言的描述创建逼真的图像和艺术。DALL·E 3 当前支持在提示时创建具有特定大小的新图像的功能。DALL·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。

DALL·E 3 通过我们的图像 API 以及 DALL·E 2.您可以试用 DALL·E 3 通过 ChatGPT Plus。

MODEL	描述
`dall-e-3`	最新的 DALL·E 型号于 2023 年 11 月发布。了解更多。
`dall-e-2`	上一代 DALL·E 型号于 2022 年 11 月发布。The 2nd iteration of DALL·E 具有更逼真、更准确且分辨率比原始模型高 4 倍的图像。

TTS

TTS 是一种 AI 模型，可将文本转换为听起来自然的口语文本。我们提供两种不同的模型变体，针对实时文本转语音用例进行了优化，并针对质量进行了优化。这些模型可以与音频 API 中的 Speech 终端节点一起使用。tts-1tts-1-hd

MODEL	描述
`tts-1`	最新的文本转语音模型，针对速度进行了优化。
`tts-1-hd`	最新的文本转语音模型，针对质量进行了优化。

Whisper

Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 使用模型名称获得。whisper-1

目前，Whisper 的开源版本和通过我们的 API 提供的版本之间没有区别。但是，通过我们的 API，我们提供了一个优化的推理过程，这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节，您可以阅读论文。

Embeddings

嵌入是文本的数字表示形式，可用于度量两段文本之间的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。

MODEL	输出维度
`text-embedding-3-large` 最适合英语和非英语任务的嵌入模型	3,072
`text-embedding-3-small` 与第 2 代 ADA 嵌入模型相比，性能更高	1,536
`text-embedding-ada-002` 功能最强大的第 2 代嵌入模型，取代了 16 个第一代模型	1,536

评审

审核模型旨在检查内容是否符合 OpenAI 的使用策略。这些模型提供了分类功能，用于查找仇恨、自残、性内容、暴力等类别中的内容。在我们的审核指南中了解有关审核文本和图像的更多信息。

MODEL	最大令牌数
`omni-moderation-latest` 当前指向。`omni-moderation-2024-09-26`	32,768
`omni-moderation-2024-09-26` 我们新的多模态审核模型的最新固定版本，能够分析文本和图像。	32,768
`text-moderation-latest` 当前指向。`text-moderation-007`	32,768
`text-moderation-stable` 当前指向。`text-moderation-007`	32,768
`text-moderation-007` 上一代纯文本审核。我们预计 models 将是未来最好的默认模型。`omni-moderation-*`	32,768

GPT 基础

GPT 基础模型可以理解和生成自然语言或代码，但不使用指令跟随进行训练。这些模型是为了替代我们原来的 GPT-3 基本模型，并使用传统的 Completions API。大多数客户应使用 GPT-3.5 或 GPT-4。

MODEL	最大令牌数	Knowledge cutoff
`babbage-002` 替代 GPT-3 和基本模型。`adababbage`	16,384 个代币	2021 年 9 月
`davinci-002` 替代 GPT-3 和基本模型。`curiedavinci`	16,384 个代币	2021 年 9 月

我们如何使用您的数据

您的数据就是您的数据。

自 2023 年 3 月 1 日起，发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型（除非您明确选择与我们共享数据，例如在 Playground 中提供反馈）。选择加入的一个好处是，随着时间的推移，模型可能会在您的使用案例中变得更好。

为了帮助识别滥用行为，API 数据可能会保留长达 30 天，之后将被删除（除非法律另有要求）。对于使用敏感应用程序的受信任客户，可能可以使用零数据保留。在零数据保留的情况下，请求和响应正文不会持久化到任何日志记录机制中，而仅存在于内存中以便为请求提供服务。

请注意，此数据政策不适用于 OpenAI 的非 API 消费者服务，如 ChatGPT 或 DALL·E 实验室。

按终端节点划分的默认使用策略

Endpoint	用于训练的数据	默认保留期	符合零保留条件
`/v1/chat/completions`*	不	30 天	是的，但（a）图像输入、（b）为结构化输出提供的架构或（c）音频输出除外。*
`/v1/assistants`	不	30 天 **	不
`/v1/threads`	不	30 天 **	不
`/v1/threads/messages`	不	30 天 **	不
`/v1/threads/runs`	不	30 天 **	不
`/v1/vector_stores`	不	30 天 **	不
`/v1/threads/runs/steps`	不	30 天 **	不
`/v1/images/generations`	不	30 天	不
`/v1/images/edits`	不	30 天	不
`/v1/images/variations`	不	30 天	不
`/v1/embeddings`	不	30 天	是的
`/v1/audio/transcriptions`	不	零数据保留	-
`/v1/audio/translations`	不	零数据保留	-
`/v1/audio/speech`	不	30 天	是的
`/v1/files`	不	直到客户删除	不
`/v1/fine_tuning/jobs`	不	直到客户删除	不
`/v1/batches`	不	直到客户删除	不
`/v1/moderations`	不	零数据保留	-
`/v1/completions`	不	30 天	是的
`/v1/realtime`（测试版）	不	30 天	是的

* 聊天完成次数：

通过、、或 models （或之前）进行的图像输入不符合零保留条件。gpt-4ogpt-4o-minichatgpt-4o-latestgpt-4-turbogpt-4-vision-preview
音频输出将存储 1 小时以启用多轮对话，目前不符合零保留条件。
启用 Structured Outputs 后，提供的架构（作为或在函数定义中）不符合零保留条件，尽管完成本身是。response_format
通过 API 中的选项使用存储的补全时，这些补全将存储 30 天。补全在 API 响应后以未过滤的形式存储，因此请避免存储包含敏感数据的补全。store: true

** 助手 API：

与 Assistants API 相关的对象将在您通过 API 或控制面板删除 30 天后从我们的服务器中删除。未通过 API 或控制面板删除的对象将无限期保留。

评估：

评估数据：当您创建评估时，与该评估相关的数据将在您通过控制面板删除 30 天后从我们的服务器中删除。未通过控制面板删除的评估数据将无限期保留。

有关详细信息，请参阅我们的 API 数据使用政策。要了解有关零留存的更多信息，请联系我们的销售团队。

模型终端节点兼容性

Endpoint	最新型号
/v1/assistants 中	所有 GPT-4o（除外）、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型。该工具需要（和后续的日期模型授权）或（和后续版本）。`chatgpt-4o-latestretrievalgpt-4-turbo-previewgpt-3.5-turbo-1106`
/v1/audio/transcriptions （英语）	`whisper-1`
/v1/audio/translations 中	`whisper-1`
/v1/audio/speech	`tts-1`,`tts-1-hd`
/v1/chat/completions	所有 GPT-4o（实时预览除外）、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型及其过时版本。动态模型。、、、和的微调版本。`chatgpt-4o-latestgpt-4ogpt-4o-minigpt-4gpt-3.5-turbo`
/v1/completions（旧版）	`gpt-3.5-turbo-instruct`, ,`babbage-002davinci-002`
/v1/embeddings	`text-embedding-3-small`, ,`text-embedding-3-largetext-embedding-ada-002`
/v1/fine_tuning/jobs 中	`gpt-4o`, , ,`gpt-4o-minigpt-4gpt-3.5-turbo`
/v1/moderations （英语）	`text-moderation-stable`,`text-moderation-latest`
/v1/images/generations 中	`dall-e-2`,`dall-e-3`
/v1/realtime（测试版）	`gpt-4o-realtime-preview`,`gpt-4o-realtime-preview-2024-10-01`

此列表不包括我们所有已弃用的模型。

模型

旗舰型号

模型概述

持续的模型升级

GPT-4o

GPT-4o mini

GPT-4o 实时 + 音频试用版

o1-preview 和 o1-mini试用版

GPT-4 Turbo 和 GPT-4

多语言功能

GPT-3.5 Turbo

DALL·E

TTS

Whisper

Embeddings

评审

GPT 基础

我们如何使用您的数据

按终端节点划分的默认使用策略

模型终端节点兼容性

GPT-4o 实时 + 音频
试用版

o1-preview 和 o1-mini
试用版