模型

旗舰型号

模型概述

OpenAI API 由具有不同功能和价位的各种模型提供支持。您还可以通过微调来针对您的特定用例对我们的模型进行自定义。

MODEL描述
GPT-4o我们的高智能旗舰模型,适用于复杂的多步骤任务
GPT-4o mini我们经济实惠的智能小型型号,适用于快速、轻便的任务
o1-preview 和 o1-mini使用强化学习训练的语言模型来执行复杂的推理。
GPT-4 Turbo 和 GPT-4上一组高智能模型
GPT-3.5 Turbo适用于简单任务的快速、廉价模型
DALL·E可以在给定自然语言提示的情况下生成和编辑图像的模型
TTS一组可以将文本转换为自然语音音频的模型
Whisper可以将音频转换为文本的模型
Embeddings一组可以将文本转换为数字形式的模型
评审可以检测文本是否敏感或不安全的微调模型
已废弃已弃用的模型的完整列表以及建议的替代模型

对于 GPT 系列模型,上下文窗口是指单个请求中可以使用的最大令牌数,包括输入和输出令牌。

我们还发布了开源模型,包括 Point-EWhisperJukeboxCLIP

持续的模型升级

gpt-4o、 、 并指向各自的最新模型版本。您可以通过在发送请求后查看响应对象来验证这一点。响应将包括使用的特定模型版本(例如 )。模型版本不断指向 ChatGPT 中使用的 GPT-4o 版本,并在有重大变化时频繁更新。除 外,我们提供固定模型版本,开发人员可以在引入更新模型后至少继续使用这些版本三个月。gpt-4o-minigpt-4-turbogpt-4gpt-3.5-turbogpt-3.5-turbo-1106chatgpt-4o-latestchatgpt-4o-latest

在我们的弃用页面上了解有关模型弃用的更多信息。

GPT-4o

GPT-4o(“o”代表“omni”)是我们最先进的 GPT 模型。它是多模态的(接受文本或图像输入并输出文本),它具有与 GPT-4 Turbo 相同的高智能,但效率要高得多——它生成文本的速度提高了 2 倍,成本降低了 50%。此外,GPT-4o 在我们的任何模型中在非英语语言中具有最好的视野和性能。GPT-4o 在 OpenAI API 中可供付费客户使用。在我们的文本生成指南中了解如何使用 GPT-4o。

MODELContext windowMax output tokensKnowledge cutoff
GPT-4O
我们的高智能旗舰模型,适用于复杂的多步骤任务。GPT-4o 比 GPT-4 Turbo 更便宜、更快。当前指向 。gpt-4o-2024-08-06
128,000 个代币16,384 个代币2023 年 10 月
GPT-4O-2024-11-20
2024 年 11 月 20 日的最新快照。gpt-4o
128,000 个代币16,384 个代币2023 年 10 月
GPT-4O-2024-08-06
第一个支持结构化输出的快照。 当前指向此版本。gpt-4o
128,000 个代币16,384 个代币2023 年 10 月
GPT-4O-2024-05-13
2024 年 5 月 13 日的原始快照。gpt-4o
128,000 个代币4,096 个代币2023 年 10 月
chatgpt-4o-最新
模型版本不断指向 ChatGPT 中使用的 GPT-4o 版本,并在有重大变化时频繁更新。chatgpt-4o-latest
128,000 个代币16,384 个代币2023 年 10 月

GPT-4o mini

GPT-4o mini(“o”代表“omni”)是我们小型型号类别中最先进的型号,也是我们迄今为止最便宜的型号。 它是多模态的(接受文本或图像输入并输出文本),具有更高的智能,但同样快。 它旨在用于较小的任务,包括视觉任务。gpt-3.5-turbo

我们建议您选择您以前使用的地方,因为这种模型功能更强大且更便宜。gpt-4o-minigpt-3.5-turbo

MODELContext windowMax output tokensKnowledge cutoff
GPT-4O-迷你
我们经济实惠的智能小型型号,适用于快速、轻便的任务。GPT-4o mini 比 GPT-3.5 Turbo 更便宜、功能更强大。当前指向 。gpt-4o-mini-2024-07-18
128,000 个代币16,384 个代币2023 年 10 月
GPT-4O-迷你-2024-07-18
gpt-4o-mini当前指向此版本。
128,000 个代币16,384 个代币2023 年 10 月

GPT-4o 实时 + 音频

试用版

这是 GPT-4o Realtime 和 Audio 模型的预览版。这些模型能够通过 WebSocket 接口响应音频和文本输入。如需了解更多信息,请参阅 Realtime API 指南。以下模型可用于 Chat Completions 以生成音频响应gpt-4o-realtime-*gpt-4o-audio-*

MODELContext windowMax output tokensKnowledge cutoff
gpt-4o-实时预览
Realtime API 预览版
128,000 个代币4,096 个代币2023 年 10 月
GPT-4O-实时预览-2024-10-01
Realtime API 模型的当前快照。
128,000 个代币4,096 个代币2023 年 10 月
gpt-4o-音频预览
预览聊天补全中音频输入的版本。
128,000 个代币16,384 个代币2023 年 10 月
GPT-4o-音频预览-2024-10-01
Audio API 模型的当前快照。
128,000 个代币16,384 个代币2023 年 10 月

o1-preview 和 o1-mini

试用版

o1 系列大型语言模型采用强化训练 学习进行复杂推理。o1 模型在回答之前会三思而后行, 在响应用户之前产生一个漫长的内部思维链。
在我们的推理指南中了解 o1 模型的功能和限制。

目前有两种型号可供选择:

  • o1-preview:旨在解决跨领域的难题的推理模型。
  • o1-mini:更快、更便宜的推理模型,特别擅长编码、数学和科学。
MODELContext windowMax output tokensKnowledge cutoff
o1-preview
指向 o1 模型的最新快照:o1-preview-2024-09-12
128,000 个代币32,768 个代币2023 年 10 月
o1-preview-2024-09-12
最新的 o1 模型快照
128,000 个代币32,768 个代币2023 年 10 月
O1-迷你
指向最新的 o1-mini 快照:o1-mini-2024-09-12
128,000 个代币65,536 个代币2023 年 10 月
o1-迷你-2024-09-12
最新的 o1-mini 模型快照
128,000 个代币65,536 个代币2023 年 10 月

GPT-4 Turbo 和 GPT-4

GPT-4 是一个大型多模态模型(接受文本或图像输入并输出文本),由于其更广泛的常识和先进的推理能力,它可以比我们以前的任何模型更准确地解决难题。GPT-4 在 OpenAI API 中可供付费客户使用。与 一样,GPT-4 针对聊天进行了优化,但适用于使用 Chat Completions API 的传统完成任务。在我们的文本生成指南中了解如何使用 GPT-4。gpt-3.5-turbo

MODELContext windowMax output tokensKnowledge cutoff
gpt-4-turbo
具有视觉功能的最新 GPT-4 Turbo 模型。Vision 请求现在可以使用 JSON 模式和函数调用。当前指向 。gpt-4-turbo-2024-04-09
128,000 个代币4,096 个代币2023 年 12 月
gpt-4-turbo-2024-04-09
GPT-4 Turbo with Vision 模型。Vision 请求现在可以使用 JSON 模式和函数调用。 当前指向此版本。gpt-4-turbo
128,000 个代币4,096 个代币2023 年 12 月
gpt-4-turbo-preview
GPT-4 Turbo 预览模型。当前指向 。gpt-4-0125-preview
128,000 个代币4,096 个代币2023 年 12 月
GPT-4-0125-preview
GPT-4 Turbo 预览模型旨在减少模型未完成任务的“懒惰”情况。了解更多
128,000 个代币4,096 个代币2023 年 12 月
GPT-4-1106-preview
GPT-4 Turbo 预览模型具有改进的指令跟随、JSON 模式、可重现输出、并行函数调用等功能。这是一个预览模型。了解更多
128,000 个代币4,096 个代币2023 年 4 月
GPT-4
当前指向 。请参阅持续模型升级gpt-4-0613
8,192 个代币8,192 个代币2021 年 9 月
GPT-4-0613
2023 年 6 月 13 日的快照,改进了函数调用支持。gpt-4
8,192 个代币8,192 个代币2021 年 9 月
GPT-4-0314
Legacy
2023 年 3 月 14 日的快照。gpt-4
8,192 个代币8,192 个代币2021 年 9 月

对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都要强大得多。

多语言功能

GPT-4 的性能优于以前的大型语言模型和截至 2023 年的大多数最先进的系统(通常具有特定于基准的训练或手动工程)。在 MMLU 基准测试(涵盖 57 个主题的英语多项选择题套件)上,GPT-4 不仅在英语中以相当大的优势优于现有模型,而且在其他语言中也表现出强劲的性能。

GPT-3.5 Turbo

GPT-3.5 Turbo 模型可以理解和生成自然语言或代码,并已针对使用 Chat Completions API 的聊天进行了优化,但也适用于非聊天任务。

截至 2024 年 7 月,应该用来代替 ,因为它更便宜、更强大、多式联运且同样快速。 仍可在 API 中使用。gpt-4o-minigpt-3.5-turbogpt-3.5-turbo

MODELContext windowMax output tokensKnowledge cutoff
GPT-3.5-turbo-0125
最新的 GPT-3.5 Turbo 模型在响应请求的格式时具有更高的准确性,并修复了导致非英语函数调用出现文本编码问题的错误。了解更多
16,385 个代币4,096 个代币2021 年 9 月
GPT-3.5-turbo增压器
当前指向 。gpt-3.5-turbo-0125
16,385 个代币4,096 个代币2021 年 9 月
GPT-3.5-turbo-1106
GPT-3.5 Turbo 模型,具有改进的指令跟随、JSON 模式、可重现的输出、并行函数调用等。了解更多
16,385 个代币4,096 个代币2021 年 9 月
gpt-3.5-turbo-instruct
与 GPT-3 时代模型类似的功能。与旧版 Completions 端点兼容,与 Chat Completions 不兼容。
4,096 个代币4,096 个代币2021 年 9 月

DALL·E

DALL·E 是一个 AI 系统,可以根据自然语言的描述创建逼真的图像和艺术。DALL·E 3 当前支持在提示时创建具有特定大小的新图像的功能。DALL·E 2 还支持编辑现有图像或创建用户提供的图像的变体的功能。

DALL·E 3 通过我们的图像 API 以及 DALL·E 2.您可以试用 DALL·E 3 通过 ChatGPT Plus

MODEL描述
dall-e-3最新的 DALL·E 型号于 2023 年 11 月发布。了解更多
dall-e-2上一代 DALL·E 型号于 2022 年 11 月发布。The 2nd iteration of DALL·E 具有更逼真、更准确且分辨率比原始模型高 4 倍的图像。

TTS

TTS 是一种 AI 模型,可将文本转换为听起来自然的口语文本。我们提供两种不同的模型变体,针对实时文本转语音用例进行了优化,并针对质量进行了优化。这些模型可以与音频 API 中的 Speech 终端节点一起使用。tts-1tts-1-hd

MODEL描述
tts-1最新的文本转语音模型,针对速度进行了优化。
tts-1-hd最新的文本转语音模型,针对质量进行了优化。

Whisper

Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。Whisper v2-large 模型目前可通过我们的 API 使用模型名称获得。whisper-1

目前,Whisper 的开源版本和通过我们的 API 提供的版本之间没有区别。但是,通过我们的 API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以阅读论文

Embeddings

嵌入是文本的数字表示形式,可用于度量两段文本之间的相关性。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。

MODEL输出维度
text-embedding-3-large
最适合英语和非英语任务的嵌入模型
3,072
text-embedding-3-small
与第 2 代 ADA 嵌入模型相比,性能更高
1,536
text-embedding-ada-002
功能最强大的第 2 代嵌入模型,取代了 16 个第一代模型
1,536

评审

审核模型旨在检查内容是否符合 OpenAI 的使用策略。这些模型提供了分类功能,用于查找仇恨、自残、性内容、暴力等类别中的内容。在我们的审核指南中了解有关审核文本和图像的更多信息。

MODEL最大令牌数
omni-moderation-latest
当前指向 。omni-moderation-2024-09-26
32,768
omni-moderation-2024-09-26
我们新的多模态审核模型的最新固定版本,能够分析文本和图像。
32,768
text-moderation-latest
当前指向 。text-moderation-007
32,768
text-moderation-stable
当前指向 。text-moderation-007
32,768
text-moderation-007
上一代纯文本审核。我们预计 models 将是未来最好的默认模型。omni-moderation-*
32,768

GPT 基础

GPT 基础模型可以理解和生成自然语言或代码,但不使用指令跟随进行训练。这些模型是为了替代我们原来的 GPT-3 基本模型,并使用传统的 Completions API。大多数客户应使用 GPT-3.5 或 GPT-4。

MODEL最大令牌数Knowledge cutoff
babbage-002
替代 GPT-3 和基本模型。adababbage
16,384 个代币2021 年 9 月
davinci-002
替代 GPT-3 和基本模型。curiedavinci
16,384 个代币2021 年 9 月

我们如何使用您的数据

您的数据就是您的数据。

自 2023 年 3 月 1 日起,发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型(除非您明确选择与我们共享数据,例如在 Playground 中提供反馈)。选择加入的一个好处是,随着时间的推移,模型可能会在您的使用案例中变得更好。

为了帮助识别滥用行为,API 数据可能会保留长达 30 天,之后将被删除(除非法律另有要求)。对于使用敏感应用程序的受信任客户,可能可以使用零数据保留。在零数据保留的情况下,请求和响应正文不会持久化到任何日志记录机制中,而仅存在于内存中以便为请求提供服务。

请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPTDALL·E 实验室

按终端节点划分的默认使用策略

Endpoint用于训练的数据默认保留期符合零保留条件
/v1/chat/completions*30 天是的,但 (a) 图像输入、(b) 为结构化输出提供的架构或 (c) 音频输出除外。*
/v1/assistants30 天 **
/v1/threads30 天 **
/v1/threads/messages30 天 **
/v1/threads/runs30 天 **
/v1/vector_stores30 天 **
/v1/threads/runs/steps30 天 **
/v1/images/generations30 天
/v1/images/edits30 天
/v1/images/variations30 天
/v1/embeddings30 天是的
/v1/audio/transcriptions零数据保留-
/v1/audio/translations零数据保留-
/v1/audio/speech30 天是的
/v1/files直到客户删除
/v1/fine_tuning/jobs直到客户删除
/v1/batches直到客户删除
/v1/moderations零数据保留-
/v1/completions30 天是的
/v1/realtime(测试版)30 天是的

* 聊天完成次数:

  • 通过 、 、 或 models (或之前) 进行的图像输入不符合零保留条件。gpt-4ogpt-4o-minichatgpt-4o-latestgpt-4-turbogpt-4-vision-preview
  • 音频输出将存储 1 小时以启用多轮对话,目前不符合零保留条件。
  • 启用 Structured Outputs 后,提供的架构(作为 或 在函数定义中)不符合零保留条件,尽管完成本身是。response_format
  • 通过 API 中的选项使用存储的补全时,这些补全将存储 30 天。补全在 API 响应后以未过滤的形式存储,因此请避免存储包含敏感数据的补全。store: true

** 助手 API:

  • 与 Assistants API 相关的对象将在您通过 API 或控制面板删除 30 天后从我们的服务器中删除。未通过 API 或控制面板删除的对象将无限期保留。

评估:

  • 评估数据:当您创建评估时,与该评估相关的数据将在您通过控制面板删除 30 天后从我们的服务器中删除。未通过控制面板删除的评估数据将无限期保留。

有关详细信息,请参阅我们的 API 数据使用政策。要了解有关零留存的更多信息,请联系我们的销售团队

模型终端节点兼容性

Endpoint最新型号
/v1/assistants 中所有 GPT-4o(除外)、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型。该工具需要 (和后续的日期模型授权) 或 (和后续版本)。chatgpt-4o-latestretrievalgpt-4-turbo-previewgpt-3.5-turbo-1106
/v1/audio/transcriptions (英语)whisper-1
/v1/audio/translations 中whisper-1
/v1/audio/speechtts-1,tts-1-hd
/v1/chat/completions所有 GPT-4o(实时预览除外)、GPT-4o-mini、GPT-4 和 GPT-3.5 Turbo 模型及其过时版本。 动态模型。、、 、 和 的微调版本。chatgpt-4o-latestgpt-4ogpt-4o-minigpt-4gpt-3.5-turbo
/v1/completions(旧版)gpt-3.5-turbo-instruct, ,babbage-002davinci-002
/v1/embeddingstext-embedding-3-small, ,text-embedding-3-largetext-embedding-ada-002
/v1/fine_tuning/jobs 中gpt-4o, , ,gpt-4o-minigpt-4gpt-3.5-turbo
/v1/moderations (英语)text-moderation-stable,text-moderation-latest
/v1/images/generations 中dall-e-2,dall-e-3
/v1/realtime(测试版)gpt-4o-realtime-preview,gpt-4o-realtime-preview-2024-10-01

此列表不包括我们所有已弃用的模型