GPT-4o：OpenAI推出原生图像生成功能，惊艳用户

王浩然 • 2025年3月27日下午9:00 • AI前沿 • 25 views

引言‌

自OpenAI在2024年5月发布其首款“全能”或多模态模型GPT-4o以来，近一年的时间里，这款模型始终保持着强大的竞争力。而今，OpenAI再次为ChatGPT的Plus、Pro、Team及Free用户层级带来了惊喜——GPT-4o的原生多模态图像生成功能正式上线。据公司透露，该功能不久后也将面向Enterprise、Edu用户及通过应用程序编程接口（API）的用户开放。

‌GPT-4o的图像生成革新‌

与ChatGPT中此前可用的生成式AI图像模型DALL-E 3不同，GPT-4o的图像生成功能并非一个独立的模型。DALL-E 3作为经典的扩散变换器模型，通过从像素中去除噪声来根据文本提示重构图像。而GPT-4o的图像生成器则是与输出文本和代码的同一模型融为一体，OpenAI训练了整个模型以同时理解这些媒体形式。

这一变化带来了显著的优势。GPT-4o在解读用户提示并匹配相应图像方面更为精准，生成的图像也更加细致和逼真。用户可以使用自然语言提出具体的编辑和修改要求，模型会迅速在新的生成中予以实现。因此，GPT-4o的图像生成器不仅质量更高，还能生成更加栩栩如生的图像和精准的文本，已经赢得了用户的广泛赞誉，有用户甚至形容其质量“令人惊叹”。

‌GPT-4o的发展历程‌

OpenAI总裁格雷格·布罗克曼（Greg Brockman）早在2024年5月就曾预览过GPT-4o的这一原生功能。然而，出于某些至今仍未公开的原因，公司一直未将其推出，直到谷歌AI Studio的Gemini 2 Flash Experimental模型公开了类似功能后，OpenAI才决定跟进。

与往常一样，OpenAI并未透露GPT-4o图像生成功能所依赖的具体训练数据。但鉴于OpenAI及其他模型提供商的历史，这些数据很可能包括大量从网络上抓取的艺术品，其中一些可能涉及版权问题，这无疑会激怒背后的艺术家们。

‌GPT-4o的多功能性‌

OpenAI一直致力于将图像生成作为其AI模型的核心功能。GPT-4o的推出，使用户能够直接在ChatGPT中生成图像，并通过对话进行精炼，实时调整细节。此外，该模型还整合了OpenAI的视频生成平台Sora，进一步扩展了多模态功能。

在一份公告中，OpenAI确认了GPT-4o的图像生成功能旨在：

允许用户在ChatGPT中描述图像，指定诸如宽高比、颜色方案（十六进制代码）或透明度等细节，GPT-4o将在一分钟内生成图像。

独立AI顾问艾莉·K·米勒（Allie K. Miller）表示，这是“文本生成领域的一大飞跃”，也是她所见过的“最佳”AI图像生成模型。

‌GPT-4o的应用与挑战‌

GPT-4o旨在使图像生成不仅美观，而且实用。其关键应用领域包括：

……（此处可详细列举GPT-4o的应用领域，如设计、广告、娱乐等，由于篇幅限制，在此省略）

尽管GPT-4o取得了诸多进展，但仍面临一些已知挑战：

……（此处可列举GPT-4o可能面临的挑战，如版权问题、图像生成准确性等，同样由于篇幅限制，在此省略）

OpenAI正在通过持续的模型优化来解决这些问题。同时，作为对负责任AI开发的承诺，所有GPT-4o生成的图像都包含C2PA元数据，以便用户验证其AI来源。OpenAI还建立了一个内部搜索工具，以帮助检测AI生成的图像，并实施了严格的保障措施来阻止有害内容并防止滥用。

‌结语‌

OpenAI首席执行官萨姆·奥特曼（Sam Altman）将此次发布称为“创意自由的新里程碑”，强调用户将能够创建广泛的视觉内容。随着AI生成的图像变得更加精确和易于访问，GPT-4o标志着文本到图像生成成为主流沟通、创意和生产力的重要一步。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gpt4o-openai-tui-chu-yuan-sheng-tu-xiang-sheng-cheng-gong

ChatGPT DALL-E 3 GPT-4o OpenAI 创意自由原生图像生成图像质量多模态模型实用性版权问题

Like (0)

王浩然作者

0 0

Google发布迄今为止最智能模型：Gemini 2.5 Pro

Previous 2025年3月27日

开源开发者：以智慧与决心对抗AI爬虫

Next 2025年3月28日

AI前沿

Cleerly 从 Insight Partners 融资 1.06 亿美元，用于 AI 心脏健康早期检测

尽管心脏病是美国的主要死亡原因，但很大一部分心脏病发作的人并不知道自己患有潜在疾病。心血管成像初创公司Cleerly希望解决这一问题。通过分析心脏 CT 扫描，该公司的 AI 软…

王浩然
2024年12月5日
000
AI前沿

AI-Santa 展示全新对话视频

人工智能视频研究公司 Tavus 推出了世界上第一个完全由人工智能驱动的圣诞老人复制品，它可以与数百万人进行面对面互动。该公司利用 8 月份发布的对话式视频接口 (CVI) 技…

王浩然
2024年12月22日
000
AI前沿

欧盟人工智能法案：通用人工智能指导草案为大型人工智能遵守规定迈出了第一步

根据欧盟《人工智能法案》，适用于通用人工智能模型提供商的行为准则初稿已经发布，同时还发布了反馈邀请——反馈截止日期为 11 月 28 日——起草过程将持续到明年，正式的合规期限将在…

王浩然
2024年11月16日
000
AI前沿

亚马逊推出人工智能购物指南

亚马逊周三推出了一系列针对消费者的人工智能功能和产品中的最新产品：人工智能购物指南。该指南将于周四推出，涵盖亚马逊网站上的 100 多种产品类型，有助于整合消费者在购买前往往会研究…

王浩然
2024年10月10日
000
AI前沿

人工智能价格战：如何降低成本让人工智能更易于普及

十年前，开发人工智能 (AI)是只有大公司和资金充足的研究机构才能负担得起的事情。必要的硬件、软件和数据存储成本非常高。但从那时起，情况发生了很大变化。一切始于 2012 年的 A…

点点
2024年9月27日
000
AI前沿

ChatGPT 的资源需求正在失控

众所周知，生成式人工智能的发展需要越来越多的水和电，但《华盛顿邮报》和加州大学河滨分校研究人员的一项新研究表明，OpenAI 的聊天机器人需要多少资源才能执行其最基本的功能。在…

王浩然
2024年9月24日
000
AI前沿

谷歌地图正在获得由 Gemini 提供支持的全新 AI 功能

Google 地图即将推出由Google 的生成式 AI 模型Gemini提供支持的新功能。周四，该公司宣布即将推出更新，让美国的 Google 地图用户能够利用 AI 帮助他们找…

王浩然
2024年11月2日
000
AI前沿

微软开始向出版商支付 Copilot 展示内容的费用

微软将向出版商支付在 Copilot Daily 中出现的内容的费用，Copilot Daily 是其基于 AI 的跨平台助手 Copilot 的一项新功能。 Copilot Da…

点点
2024年10月2日
000
AI前沿

OpenAI 招募微软副总裁，加剧 AI 人才争夺战

Sebastien Bubeck 曾任微软生成式人工智能副总裁

点点
2024年10月22日
000
AI前沿

如何开始使用 AI 代理（并正确使用）

由于人工智能发展迅速，且害怕错失机会 (FOMO)，生成式人工智能计划通常由自上而下推动，企业领导者往往会对这项突破性技术过度兴奋。但当公司急于构建和部署时，他们通常会处理其他技术…

王浩然
2024年11月18日
000
AI前沿

科技巨头的语音大战，亚马逊Claude让Alexa飞起，Cerebras速度惊人

亚马逊的Alexa一直是智能语音助手的佼佼者，现在有了Claude的加持，就像是给超级英雄穿上了新战衣。Claude的算法优化让Alexa的语音识别和处理能力大幅提升，反应速度和准确性都有了质的飞跃。

点点
2024年9月11日
000
AI前沿

2024 年融资金额达 1 亿美元或以上的 39 家美国 AI 初创公司的完整名单

对于某些人来说，人工智能疲劳是真实存在的，但显然风险投资者还没有厌倦这一类别。第三季度，人工智能交易继续主导风险投资。根据Crunchbase 的数据，人工智能公司在第三季度筹集…

点点
2024年10月13日
000
AI前沿

Microsoft Copilot 现在可以读取你的屏幕、深入思考并大声向你说话

在宣布对其由 AI 驱动的产品企业套件Copilot进行一系列更新一周后，微软在 Windows 上为所有用户推出了新的 Copilot 功能，其中包括一个可以理解并回答屏幕内容问…

王浩然
2024年10月2日
000
AI前沿

Nous Research 正在使用分布在互联网上的机器训练人工智能模型

名为Nous Research的人工智能研究团队目前正在快速发展的生成人工智能领域做一些独特的事情（至少据我所知）：Nous 正在使用分布在互联网和世界各地的机器对一个新的 150…

王浩然
2024年12月3日
000
AI前沿

探讨人工智能对社会影响的非小说类书籍

人工智能 (AI) 是执行复杂计算的代码或技术，涵盖模拟、数据处理和分析。人工智能的重要性日益凸显，已成为医疗保健、教育和金融等许多行业的变革者。事实证明，人工智能的使用可使许多…

点点
2024年9月18日
000
AI前沿

Figure将于2025年启动家用仿人机器人Alpha测试‌

创新科技公司Figure近日宣布，计划在2025年正式启动其家用仿人机器人的Alpha测试阶段。这一举措标志着Figure在智能机器人领域迈出了重要一步。 ‌一、项目背景‌ 随着人…

王浩然
2025年3月2日
000
AI前沿

亚马逊推出针对卖家的人工智能助手 Project Amelia

亚马逊卖家现在可以使用人工智能助手，该助手旨在通过回答有关其指标的问题来帮助他们发展业务，以后可能能够帮助他们直接解决出现的问题。该助手代号为 Project Amelia，基于 …

王浩然
2024年9月20日
000
AI前沿

GitHub Spark 让你用简单的英语构建 Web 应用程序

当 GitHub Copilot 推出并开始自动完成代码行（后来是整个代码片段）时，许多人都在问：我们多久才能用自然语言描述一个应用程序，然后 Copilot 会为我们构建它？近几…

王浩然
2024年10月30日
000
AI前沿

为什么多智能体 AI 能够解决 LLM 无法解决的复杂性

ChatGPT 的推出使得大型语言模型(LLM) 在科技和非科技行业中得到广泛应用。这种流行主要归因于两个因素：这是否意味着我们已经达到了人类水平的智能，我们称之为通用人工智能（…

王浩然
2024年11月3日
000
AI前沿

Inflection AI 首席执行官表示已完成开发下一代 AI 模型的尝试

就在去年，Inflection AI 还是一家炙手可热的初创公司，它发布了一流的人工智能模型，声称其性能可以超越 OpenAI、Meta 和谷歌的技术。这与今天形成了鲜明的对比，I…

王浩然
2024年11月29日
000

发表回复

Please Login to Comment

GPT-4o：OpenAI推出原生图像生成功能，惊艳用户

相关推荐

发表回复

Share To :