← 返回博客列表

2025年12月17日 · 8 min read · GetGPT Pro Team

OpenAI GPT Image 1.5:精准编辑时代来临,图像生成进入"手术级"操作

目录
OpenAI GPT Image 1.5:精准编辑时代来临,图像生成进入"手术级"操作

2025 年 12 月 17 日,OpenAI 正式发布新一代旗舰图像生成模型GPT Image 1.5,驱动升级后的 ChatGPT Images 功能。此次升级标志着 AI 图像生成从"拼概率"向"精准执行"的关键跃迁——模型不仅能听懂指令,更能"指哪打哪",在多轮编辑中保持核心细节不丢失。

配合 4 倍速生成和 20%的 API 降价,OpenAI 正将专业级图像编辑能力送入每个用户的口袋。

Image 1.5 核心突破:精准编辑,不崩全图

GPT Image 1.5 的最大革新在于局部精确修改能力。当用户上传图片要求编辑时,模型仅改变指定区域,光线、构图、人物外貌等关键元素在多轮迭代中保持高度一致。这解决了以往 AI 图像编辑的痛点:每次修改都可能导致全局崩坏。

官方演示中,模型展示了添加、删除、合成、混合、移植五大编辑操作:

三张输入图:两个男人、一只狗

输入图1

输入图2

输入图3

  • 将三张独立图片(两位男士+一只狗)无缝合成为 2000 年代胶片风格派对场景

合成效果

  • 在背景中添加尖叫奔跑的儿童,前景主体完全保留

添加背景元素

  • 同一张图中实现三种风格并存:左侧人物转手绘动漫风,中间狗变为毛绒玩具,右侧保持真人写实

多风格并存

  • 根据参考图换装,精准应用 OpenAI 卫衣样式

换装效果

  • 最终移除人物,只保留狗并置入直播画面

移除与保留

五轮连续编辑下来,狗的形象始终如一,这在上一代模型中几乎无法实现。

怎么使用 Image 1.5?

用户现可通过专属入口 https://chatgpt.com/images/ 直达绘图空间,内置的预设滤镜与热门提示词模板让创作无需从零构思。这一细节再次印证 OpenAI 在产品体验上的深厚功力。

更重要的是,GPT Image 1.5 已完成全量推送,所有用户,Plus、Pro、Team 等默认使用新版本,无需任何手动切换即可享受升级体验,免费用户也能体验一些次数~

Image 1.5 界面

💡 还没有 ChatGPT Plus? 前往 GetGPT Pro 一键升级,支持支付宝/微信支付,1 分钟完成充值。

Image 1.5 实测对比:指令遵循与审美双提升

复杂构图精准执行

在 6×6 网格生成测试中,GPT Image 1.5 完美呈现 36 个指定物品(希腊字母 β、沙滩球、机器人等),而旧版出现格子数错误、物品乱放等问题。这种精确性对信息图、产品目录、教学材料等场景至关重要。

新版结果:

新版6x6网格

旧版结果:

旧版6x6网格

与竞品的较量

第三方测试显示,在生成细腻人像写真和 3D 等距魔法地图时,ChatGPT Images 的指令遵循能力略胜一筹,但在审美表现力上两者各有千秋。目前 ChatGPT Images 已登顶大模型竞技场图像排名榜首。

文字渲染与质量全面提升

密集文本处理能力

GPT Image 1.5 在处理小字号、多段落文字时表现强悍。官方演示将 Markdown 文档渲染为报纸版面,表格、标题、正文清晰可辨。但实测显示,中文渲染仍有提升空间,复杂汉字可能出现模糊。

Markdown渲染成报纸

多人脸与场景自然度

在"1970 年代伦敦街景"测试中,新版生成的人脸更自然,年代氛围感更到位,避免了旧版的"塑料感"和过早裁切问题。模型在渲染大量小人脸时的稳定性显著增强。

API 开放:成本直降 20%,企业级应用就绪

同步上线的 GPT Image 1.5 API 继承所有 ChatGPT Images 能力,且输入输出成本比上一代降低 20%,提供三档质量选择:

质量等级1024×10241024×15361536×1024
Low$0.009$0.013$0.013
Medium$0.034$0.051$0.050
High$0.133$0.200$0.199

High 模式价格与 Google 的 2K 生成($0.139)相当,但提供更低价位选项。该 API 特别适合:

  • 营销材料制作:跨编辑保持品牌 Logo 一致性
  • 电商产品目录:基于单张源图生成多场景、多角度变体
  • 创意工具集成:已有企业接入用于设计流程自动化

局限与未来方向

尽管进步显著,GPT Image 1.5 仍有提升空间:

  • 风格一致性:某些艺术风格转换不够稳定
  • 多语言支持:非英语文字(尤其是中文)渲染质量待优化
  • 多人脸场景:偶尔出现面部畸变

OpenAI 官方表示,模型在科学准确性上约达 70%,画面生动度已大幅改善。

Image 1.5 如何体验

新功能已面向全球所有 ChatGPT 用户推送,无需手动选择模型。用户可通过:

旧版 ChatGPT Images 将保留为自定义 GPT 供怀旧用户使用。

结语

GPT Image 1.5 的发布,标志着 AI 图像生成进入**"手术级精度"时代**。它不仅是速度更快、价格更便宜的工具,更是首个能在多轮编辑中保持"数字资产完整性"的商用模型。

对于创作者、营销人和开发者而言,这意味着 AI 从"玩具"进化为"可靠的生产力伙伴"。随着中文支持等短板的补齐,OpenAI 有望进一步巩固其在多模态 AI 领域的领先地位。


图源:OpenAI 官方演示及第三方测试