ChatGPT开始集成多模态支持的GPT-4o 支持通过聊天直接生成图像
OpenAI 宣布即日起 ChatGPT 开始切换为 GPT-4o 多模态版,多模态版支持在对话中直接生成图像,用来替换此前的 OpenAI DALL-E 3 图像生成模型。
GPT-4o 默认为所有个人用户开启,包括订阅版和免费版用户都可以使用,按照惯例这些也都是有配额的,当超出订阅层级的配额后会被限制无法继续使用。
OpenAI 表示:
GPT-4o 图像生成擅长准确呈现文本、精确遵循提示以及利用 4o 固有的知识库和聊天上下文 — 包括转换上传的图像或将其作为视觉灵感,这些功能可以更轻松地创建您设想的图像,帮助您通过视觉效果更有效地进行交流,并将图像生成推进为一种精确而强大的实用工具。
在 GPT-4o 中可以准确创建多达 20 个不同的物体,OpenAI 称其他 AI 系统很难创建大约 5~8 个物体,不过 OpenAI 也承认目前该模型还存在局限性,例如低语境提示导致的幻觉,信息密集、文本较小的图像中的文本渲染问题,OpenAI 计划在后续发布的更新中陆续解决问题。
目前支持使用该模型生成图像的包括:
- ChatGPT Free
- ChatGPT Plus
- ChatGPT Pro
- ChatGPT Team
在未来几周 OpenAI 将向 ChatGPT Edu 和 ChatGPT Enterprise 订阅版用户提供该功能,另外后续 OpenAI 会提供 GPT-4o 多模态版 API,让开发者可以借助 API 快速生成图像。