跳到主要内容

模型(Model)

概述

OpenAI API 由具有不同功能和价位的多种模型提供支持。您还可以通过微调(fine-tuning),针对您的特定用例对我们的原始基本模型进行有限的定制。

模型描述
GPT-4 Beta一组改进 GPT-3.5 的模型,可以理解和生成自然语言或代码
GPT-3.5一组改进 GPT-3 的模型,可以理解并生成自然语言或代码
DALL·E Beta可以在给定自然语言提示的情况下生成和编辑图像的模型
Whisper Beta可以将音频转换为文本的模型
Embeddings一组可以将文本转换为数字形式的模型
Codex Limited Beta一组可以理解和生成代码的模型,包括将自然语言转换为代码
Moderation可以检测文本是否敏感或不安全的微调模型
GPT-3一组可以理解和生成自然语言的模型

我们还发布了开源模型,包括Point-EWhisperJukeboxCLIP。

访问 供研究人员的模型索引 详细了解我们的研究论文中介绍了哪些模型以及 InstructGPT 和 GPT-3.5 等模型系列之间的差异。

持续升级的模型

随着的发布 gpt-3.5-turbo ,我们的一些模型现在正在不断更新。我们还提供静态模型版本,开发人员可以在更新的模型引入后继续使用至少三个月。随着模型更新的新节奏,我们还让人们能够贡献评估,以帮助我们改进不同用例的模型。如果你感兴趣,请查看 OpenAI Evals 存储库。

以下模型是临时快照,一旦更新版本可用,我们将宣布其弃用日期。如果要使用最新的模型版本,请使用标准模型名称,如 gpt-4gpt-3.5-turbo

Model name(GPT 模型)Discontinuation date(停用时间)Replacement model(替换的 GPT 模型)
gpt-3.5-turbo-030109/13/2023gpt-3.5-turbo-0613
gpt-4-031409/13/2023gpt-4-0613
gpt-4-32k-031409/13/2023gpt-4-32k-0613

在我们的弃用页面了解更多关于模型弃用的信息

GPT-4 Limited beta

GPT-4 是一个大型多模态模型(今天接受文本输入和发出文本输出,将来会出现图像输入),由于其更广泛的一般知识和高级推理能力,它可以比我们以前的任何模型更准确地解决难题。与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于传统的补全(Completion)任务。在我们的 会话补全(Completion)指南 中了解如何使用 GPT-4。

注意

GPT-4 目前处于 Limited beta 阶段,只有获得访问权限的人才能访问。请加入候补名单,以便在容量可用时获得访问权限。

MODEL描述最大 tokens 数训练数据
gpt-4比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,并针对聊天进行了优化。将使用我们最新的模型迭代进行更新。8,192 个 tokens截至 2021 年 9 月
gpt-4-06132023 gpt-4 年 6 月 13 日的快照,包含函数调用数据。与此不同 gpt-4 ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。8,192 个 tokens截至 2021 年 9 月
gpt-4-32k与基本gpt-4模式相同的功能,但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。32,768 个 tokens截至 2021 年 9 月
gpt-4-32k-06132023 gpt-4-32 年 6 月 13 日的快照。与此不同 gpt-4-32k ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。32,768 个 tokens截至 2021 年 9 月

对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。但是,在更复杂的推理情况下,GPT-4 比我们以前的任何型号都更强大。

GPT-3.5

GPT-3.5 模型可以理解和生成自然语言或代码。我们在 GPT-3.5 系列中功能最强大、最具成本效益的型号是gpt-3.5-turbo,它已针对聊天进行了优化,但也适用于传统的补全(Completion)任务。

LATEST MODEL(最新模型)描述最大 tokens 数训练数据
gpt-3.5-turbo功能最强大的 GPT-3.5 型号,针对聊天进行了优化,成本仅为 text-davinci-003 的 1/10。将使用我们最新的模型迭代进行更新。4096 tokens截至 2021 年 9 月
gpt-3.5-turbo-16k与标准模型gpt-3.5-turbo有相同的功能,但该模型是其 4 倍的上下文。16,384 tokens截至 2021 年 9 月
gpt-3.5-turbo-06132023 gpt-3.5-turbo 年 6 月 13 日的快照,包含函数调用数据。与此不同 gpt-3.5-turbo ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。4096 tokens截至 2021 年 9 月
gpt-3.5-turbo-16k-06132023 gpt-3.5-turbo-16k 年 6 月 13 日的快照。与此不同 gpt-3.5-turbo-16k ,此模型将不会收到更新,并将在新版本发布后 3 个月弃用。16,384 tokens截至 2021 年 9 月
text-davinci-003可以比 curie、babbage、ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务。还支持在文本中 插入补全。4097 tokens截至 2021 年 6 月
text-davinci-002text-davinci-003 类似的功能,但使用监督微调而不是强化学习进行训练4097 tokens截至 2021 年 6 月
code-davinci-002针对代码完成任务进行了优化8001 tokens截至 2021 年 6 月

我们建议使用 gpt-3.5-turbo 而不是其他 GPT-3.5 模型,因为它的成本更低。

注意

OpenAI 模型是不确定的,这意味着相同的输入可以产生不同的输出。将 温度(Temperature ) 设置为 0 将使输出大部分具有确定性,但可能会保留少量可变性。

OpenAI 模型是非确定性的,这意味着相同的输入可以产生不同的输出。将温度设置为 0 将使输出大部分具有确定性,但可能会保留少量可变性。

特定功能模型

虽然新的 gpt-3.5-turbo 模型针对会话进行了优化,但它对于传统的完成任务也非常有效。原始的 GPT-3.5 模型针对 文本补全 进行了优化。

我们用于 创建嵌入(Embedding)编辑文本 的端点它们自己的一组专用模型。

找到合适的模型

使用 gpt-3.5-turbo 进行试验是了解 API 功能的好方法。在您了解要实现的目标后,您可以继续使用 gpt-3.5-turbo 或其他模型并尝试围绕其功能进行优化。

您可以使用 GPT 比较工具,让您并排运行不同的模型来比较输出、设置和响应时间,然后将数据下载到 Excel 电子表格中。

DALL·E Beta

DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。我们目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过我们的 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。您可以通过我们的 实验室界面API 进行试用。

Whisper Beta

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 目前可通过我们的 API(模型名 whisper-1)使用 Whisper v2-large 模型。

目前,Whisper 的开源版本 和通过我们的 API 提供的版本之间没有区别。但是,通过我们的 API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。有关 Whisper 的更多技术细节,您可以 阅读论文

嵌入(Embedding)

嵌入(Embedding)是文本的数字表示,可用于衡量两段文本之间的相关性。我们的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 种第一代嵌入(Embedding)模型。嵌入(Embedding)可用于搜索、聚类、推荐、异常检测和分类任务。您可以在 公告博客文章 中阅读有关我们最新嵌入模型的更多信息。

Codex

Codex 模型是我们的 GPT-3 模型的后代,可以理解和生成代码。他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。了解更多

精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。

我们目前提供两种 Codex 型号

MODEL描述最大 tokens 数训练数据
code-davinci-002功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。除了补全代码,还支持在代码中插入插入补全。8001 tokens截至 2021 年 6 月
code-cushman-001几乎与 Davinci Codex 一样强大,但速度稍快。这种速度优势可能使其成为实时应用程序的首选。最多 2048 个 tokens

有关更多信息,请访问我们的 Codex 使用指南

Codex 模型在有限测试期间可免费使用,并受降低的 速率限制 的约束。当我们了解使用情况时,我们将寻求提供定价以支持广泛的应用程序。

在此期间,只要符合我们的 使用政策 ,欢迎您使用您的应用程序。我们欢迎在早期使用这些模型时提供任何反馈,并期待与社区互动。

特定功能模型

主要的 Codex 模型旨在与 文本补全(Completion) 端点一起使用。我们还提供专门用于我们的端点以 创建嵌入(Embedding)编辑代码


审核(Moderation)

审核模型旨在检查内容是否符合 OpenAI 的使用策略。这些模型提供了查找以下类别内容的分类功能:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。您可以在我们的 审核指南 中找到更多信息。

审核模型采用任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

MODEL描述
text-moderation-latest最有能力的审核模型,精度会比稳定模型略高
text-moderation-stable几乎与最新型号一样强大,但略旧。

GPT-3

GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。但是,原始 GPT-3 基本模型( davincicurieadababbage )是当前唯一可用于微调的模型。

MODEL描述最大 tokens 数训练数据
text-curie-001非常有能力,比 davinci 更快,成本更低。2,049 tokens截至 2019 年 10 月
text-babbage-001能够完成简单的任务,速度非常快,成本更低。2,049 tokens截至 2019 年 10 月
text-ada-001能够完成非常简单的任务,通常是 GPT-3 系列中最快的型号,成本最低。2,049 tokens截至 2019 年 10 月
davinci功能最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务,通常质量更高。2,049 tokens截至 2019 年 10 月
curie非常有能力,但比 davinci 更快,成本更低。2,049 tokens截至 2019 年 10 月
babbage能够完成简单的任务,速度非常快,成本更低。2,049 tokens截至 2019 年 10 月
ada能够完成非常简单的任务,通常是 GPT-3 系列中最快的型号,成本最低。2,049 tokens截至 2019 年 10 月

模型 Endpoint(指具体的某个 API)兼容性

Endpoint(指具体的某个 API)型号名称
/v1/chat/completionsgpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completionstext-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001, davinci, curie, babbage, ada
/v1/edits text-davinci-edit-001text-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptionswhisper-1
/v1/audio/translationswhisper-1
/v1/fine-tunesdavinci, curie, babbage, ada
/v1/embeddingstext-embedding-ada-002, text-search-ada-doc-001
/v1/moderations文本审核稳定,文本审核最新

此列表不包括我们的第一代嵌入(Embedding)模型,也不包括我们的 DALL·E 模型