OpenAI 开发者日:深入探索 ChatGPT 的新功能与 API

作者:API传播员 · 2025-12-05 · 阅读时间:5分钟

在 OpenAI 开发者日(DevDay 2023)上,OpenAI 发布了一系列令人兴奋的新功能和工具,旨在为开发者和普通用户提供更强大的 AI 体验。从定制化的 ChatGPT 到全新的 GPT-4 Turbo 模型,再到功能丰富的助手 API,这些创新为日常任务、学习和开发工作带来了全新可能性。以下是对这些功能的详细解析。


定制化 ChatGPT:打造属于你的 GPT

OpenAI 推出了一个名为 GPT 的功能,允许用户创建自己的定制化 ChatGPT。这项功能特别适合那些经常需要重复使用特定提示的用户。通过 GPT,用户可以根据自己的需求设计专属助手,无论是帮助理解复杂规则、提供创意写作指导,还是成为一名虚拟厨师。

更重要的是,这些定制化的 GPT 不仅可以个人使用,还可以与他人分享,极大地扩展了 ChatGPT 的应用场景。


图像与语音功能的全面升级

ChatGPT 的输入和输出方式已经从最初的纯文本扩展到支持图像和语音,这为用户提供了更多的交互可能性。

图像上传与生成

通过 ChatGPT 4(需 ChatGPT Plus 订阅),用户可以上传图像并与 AI 进行对话。例如,用户可以请求识别图像中的物体、获取操作说明,甚至通过图像解决问题。

语音交互功能

在 ChatGPT 移动端应用(支持 iOS 和 Android)中,用户可以通过语音与 ChatGPT 交互。只需点击录音按钮,说出提示内容,ChatGPT 就会将语音转化为文本并生成响应。这种交互方式不仅方便,还具有极高的准确性。


实时互联网搜索:获取最新信息

借助 ChatGPT 的“使用 Bing 浏览”功能,用户可以进行实时互联网搜索,而不再局限于模型的训练数据。这意味着 ChatGPT 可以根据最新的网络信息生成更准确、更及时的回答。

在最新版本中,ChatGPT 4 能够智能判断用户是否需要最新信息,并自动触发网络搜索,为用户提供更贴合需求的内容。


GPT-4 Turbo:更强大的开发者工具

GPT-4 Turbo 是 OpenAI 最新发布的模型,相较于标准版 GPT-4,它具备更高的性能和更大的上下文窗口,支持多达 128K 的令牌。这相当于在一次对话中处理约 300 页的文本内容。

改进的函数调用

GPT-4 Turbo 支持在单条消息中调用多个函数。例如,用户可以一次性查询多个城市的天气,而无需多次请求。此外,模型还支持 JSON 模式,确保返回的结果是有效的 JSON 格式。

新增种子参数

通过种子参数,开发者可以更好地控制模型输出的确定性。这对于调试和单元测试等场景尤为重要,能够保证每次生成的结果具有一致性。


助手 API:构建智能代理

新发布的助手 API 为开发者提供了构建智能代理的能力。这些代理不仅可以利用 OpenAI 模型的强大功能,还能与用户交互、做出决策,并从外部资源中获取信息。

助手的核心功能

  1. 代码解释器:允许助手在沙盒环境中编写和运行 Python 代码,生成图表并处理文件。
  2. 检索工具:通过用户提供的文件增强助手的知识库。
  3. 函数调用:支持调用自定义函数或外部 API,并返回结构化的 JSON 数据。

开发者可以通过 API 或助手 Playground 轻松尝试这些功能,无需编写复杂代码。


API 的视觉、图像与语音处理能力

OpenAI 的新功能不仅限于 ChatGPT,还扩展到了 API 层面,为开发者提供了更多可能性。

  • GPT-4 Turbo 的视觉处理:通过聊天完成 API,GPT-4 Turbo 支持图像输入。
  • DALL-E 3 集成:通过 Images API,开发者可以利用 DALL-E 3 的强大图像生成能力。
  • 文本到语音(TTS):开发者可以通过 TTS API 将文本转化为类人语音,为应用程序增加语音输出功能。

微调与定制模型

OpenAI 提供了对 GPT-3.5 模型的微调功能,允许用户在特定领域优化模型表现。虽然 GPT-4 的微调功能尚在开发中,但 OpenAI 已推出了定制模型计划,为拥有大规模专有数据的组织提供深度定制服务。


版权保护:为用户保驾护航

针对生成式 AI 可能引发的版权争议,OpenAI 推出了版权保护政策。该政策承诺保护用户免受版权侵权相关的法律索赔,并承担由此产生的费用。这一保护适用于 ChatGPT Enterprise 和开发者平台,进一步增强了用户的信心。


总结

OpenAI 在 DevDay 2023 上展示的这些新功能和工具,无论是定制化 GPT、GPT-4 Turbo,还是助手 API,都为开发者和普通用户提供了前所未有的可能性。从图像生成到语音交互,从实时搜索到智能代理,每一项功能都在推动 AI 技术的边界。现在就开始探索这些创新,看看它们如何改变你的日常工作和生活吧!

原文链接: https://www.pluralsight.com/resources/blog/ai-and-data/aitm-new-chatgpt-features-assistants-api