介绍
谷歌通过其最新的人工智能图像模型再次提高了人工智能标准。Gemini 2.5 Flash Image(通常称为 Nano-Banana)解决了当前困扰 AI 图像模型的许多问题,从缺乏一致性到编辑功能不佳,谷歌的新模型纠正了这些问题等等。更好的是,他们发布了一套免费的、可定制的工具,展示了所有这些新功能和改进。

Gemini 2.5 Flash Image 有什么新功能?
Gemini 2.5 Flash Image 引入了许多用于在 Gemini 中处理图像的重要更新。让我们回顾一下主要变化:
- 图像混合:现在,您可以使用新的图像模型轻松地将多个图像合并为一个图像。这极大地扩展了您对模型的控制,并帮助您的想法更快地变为现实。
- 角色一致性:使用人工智能最困难的部分之一是它很难创建一致的图像/对象。这个问题已经通过这个新模型直接解决了,现在在重复创建相同的角色方面要好得多。
- 更好的编辑:人工智能的另一个常见问题是,您将通过一个小问题创建出色的图像。然后,您将面临两个选项,尝试编辑图像(结果可能好坏参半),或者您可以重新生成整个图像。谷歌正试图通过允许用户更好地控制编辑来改善这个循环。您现在可以选择图像中要更改的元素,而不会影响其余元素。
- 更智能的模型:谷歌还赋予了这款新模型其他 Gemini 模型的强大功能和知识。这体现在允许双子座理解你给它的图像并与之互动。
如何访问 Gemini 2.5 Flash 图像
目前仅提供此模型的预览版。因此,您还无法通过 Gemini 应用程序访问它。该模型可以通过两种方式使用:
应用程序接口-
对于希望使用此模型进行构建的开发人员,您可以通过 Gemini API 访问它。
人工智能工作室 -
您还可以通过 AI Studio 试验 Flash Image 模型。这将使您更好地了解新模型的功能。
您可以在 AI Studio 中选择模型。
定价:Gemini 2.5 Flash Image 的价格为每 100 万个输出代币 30.00 美元,每张图像为 1290 个输出代币(每张图像 0.039 美元)。
Gemini 2.5 Flash 图像在运行
为了帮助展示这种新模型的功能,谷歌团队在 Google AI Studio 中创建了一系列免费应用程序,每个应用程序都涉及一个独特的用例。请注意,这些应用程序只是起点,可以通过简单的氛围编码和自然语言进行更改。
示例 1:组合图像
谷歌的模板“Home Canvas”应用程序旨在将多个图像组合成一个场景。他们设计了该应用程序,允许用户创建和试验房间设计,但如果需要,它可以用来组合任何图像。
首先,您将上传要添加的场景和对象。然后,您将对象拖动到正确的位置并砰砰作响,就完成了。
我首先添加了家具和房间的照片。
双子座随后以一种自然的方式将两者结合在一起。
示例 2:使用知识
许多以前的图像模型只专注于生成图像,而牺牲了知识。2.5 Flash Image 不这样做,而是能够生成和理解图像。这是一个可用于回答各种问题的素描板示例。
双子座能够看到我画的东西并正确回答我的问题。
从上面的例子中可以看出,我画了一张图(抱歉质量不好),让 Gemini 完成了我创建的数学题。
示例 3:图像编辑
正如我上面提到的,这个新模型具有强大的编辑功能。我使用 Google 的 Pixshop 应用程序编辑了一些图像。我所做的只是上传图像,单击我想要更改的内容,然后简要描述它。
这是初始图像
这是使用纳米香蕉后编辑的图像。
这些只是谷歌围绕新图像模型构建的一些出色应用程序。我建议您全部检查一下,看看这个新模型如何帮助您。
它如何比较?
与往常一样,我们需要看看这个新模型与其他最先进的图像模型相比如何。这个新的双子座模型在两个图像类别中在 LMArena 上排名 #1。
谷歌的新模型目前在两个类别中排名 #1。
对于任何不知道的人来说,LMArena 允许普通人对不同领域的顶级模型进行盲目、头对头的比较。如上图所示,用户更喜欢 Nano-banana 进行图像生成和图像编辑。这意味着该型号不仅价格便宜且使用速度快,而且因其高品质而成为当前用户的最爱。
结论
无论您是希望将高级图像功能集成到应用程序中的开发人员,还是探索新人工智能工具的创意专业人士,谷歌的新纳米香蕉模型都提供了引人注目的功能,值得通过 AI Studio 进行探索
主题测试文章,只做测试使用。发布者:善用AI的人,转转请注明出处:https://shanyongai.com/nano-banana-new.html