Nano-Banana 就在这里：Gemini 的新图像模型-善用AI

查看目录

介绍

谷歌通过其最新的人工智能图像模型再次提高了人工智能标准。Gemini 2.5 Flash Image（通常称为 Nano-Banana）解决了当前困扰 AI 图像模型的许多问题，从缺乏一致性到编辑功能不佳，谷歌的新模型纠正了这些问题等等。更好的是，他们发布了一套免费的、可定制的工具，展示了所有这些新功能和改进。

Gemini 2.5 Flash Image 有什么新功能？

Gemini 2.5 Flash Image 引入了许多用于在 Gemini 中处理图像的重要更新。让我们回顾一下主要变化：

图像混合：现在，您可以使用新的图像模型轻松地将多个图像合并为一个图像。这极大地扩展了您对模型的控制，并帮助您的想法更快地变为现实。
角色一致性：使用人工智能最困难的部分之一是它很难创建一致的图像/对象。这个问题已经通过这个新模型直接解决了，现在在重复创建相同的角色方面要好得多。
更好的编辑：人工智能的另一个常见问题是，您将通过一个小问题创建出色的图像。然后，您将面临两个选项，尝试编辑图像（结果可能好坏参半），或者您可以重新生成整个图像。谷歌正试图通过允许用户更好地控制编辑来改善这个循环。您现在可以选择图像中要更改的元素，而不会影响其余元素。
更智能的模型：谷歌还赋予了这款新模型其他 Gemini 模型的强大功能和知识。这体现在允许双子座理解你给它的图像并与之互动。

如何访问 Gemini 2.5 Flash 图像

目前仅提供此模型的预览版。因此，您还无法通过 Gemini 应用程序访问它。该模型可以通过两种方式使用：

应用程序接口-

对于希望使用此模型进行构建的开发人员，您可以通过 Gemini API 访问它。

人工智能工作室 -

您还可以通过 AI Studio 试验 Flash Image 模型。这将使您更好地了解新模型的功能。

您可以在 AI Studio 中选择模型。

注意

定价：Gemini 2.5 Flash Image 的价格为每 100 万个输出代币 30.00 美元，每张图像为 1290 个输出代币（每张图像 0.039 美元）。

Gemini 2.5 Flash 图像在运行

为了帮助展示这种新模型的功能，谷歌团队在 Google AI Studio 中创建了一系列免费应用程序，每个应用程序都涉及一个独特的用例。请注意，这些应用程序只是起点，可以通过简单的氛围编码和自然语言进行更改。

示例 1：组合图像

谷歌的模板“Home Canvas”应用程序旨在将多个图像组合成一个场景。他们设计了该应用程序，允许用户创建和试验房间设计，但如果需要，它可以用来组合任何图像。

首先，您将上传要添加的场景和对象。然后，您将对象拖动到正确的位置并砰砰作响，就完成了。

我首先添加了家具和房间的照片。

双子座随后以一种自然的方式将两者结合在一起。

示例 2：使用知识

许多以前的图像模型只专注于生成图像，而牺牲了知识。2.5 Flash Image 不这样做，而是能够生成和理解图像。这是一个可用于回答各种问题的素描板示例。

双子座能够看到我画的东西并正确回答我的问题。

从上面的例子中可以看出，我画了一张图（抱歉质量不好），让 Gemini 完成了我创建的数学题。

示例 3：图像编辑

正如我上面提到的，这个新模型具有强大的编辑功能。我使用 Google 的 Pixshop 应用程序编辑了一些图像。我所做的只是上传图像，单击我想要更改的内容，然后简要描述它。

这是初始图像

这是使用纳米香蕉后编辑的图像。

这些只是谷歌围绕新图像模型构建的一些出色应用程序。我建议您全部检查一下，看看这个新模型如何帮助您。

它如何比较？

与往常一样，我们需要看看这个新模型与其他最先进的图像模型相比如何。这个新的双子座模型在两个图像类别中在 LMArena 上排名 #1。

谷歌的新模型目前在两个类别中排名 #1。

对于任何不知道的人来说，LMArena 允许普通人对不同领域的顶级模型进行盲目、头对头的比较。如上图所示，用户更喜欢 Nano-banana 进行图像生成和图像编辑。这意味着该型号不仅价格便宜且使用速度快，而且因其高品质而成为当前用户的最爱。

结论

无论您是希望将高级图像功能集成到应用程序中的开发人员，还是探索新人工智能工具的创意专业人士，谷歌的新纳米香蕉模型都提供了引人注目的功能，值得通过 AI Studio 进行探索

主题测试文章，只做测试使用。发布者：善用AI的人，转转请注明出处：https://shanyongai.com/nano-banana-new.html

Nano-Banana 就在这里：Gemini 的新图像模型

介绍