摘要: 本文介绍了 Gemini 2.5 Flash Image(又称 nano-banana),这是一款先进的图像生成和编辑模型。该模型支持将多张图像融合成一张,保持角色一致性进行丰富叙事,使用自然语言进行有针对性的变换,并利用 Gemini 的世界知识生成和编辑图像。Gemini 2.5 Flash Image 已通过 Gemini API、Google AI Studio 和 Vertex AI 推出,定价为每百万输出令牌 30 美元。此外,文章还展示了如何使用 Google AI Studio 中的“构建模式”来测试和定制该模型,并提供了多个应用示例,包括保持角色一致性、基于提示的图像编辑、利用世界知识以及多图像融合等。
讨论: 这段内容主要讨论了最新的图像编辑模型Gemini 2.5 Flash(别名nano-banana)及其在图像编辑领域的应用。许多用户对它的强大功能表示赞赏,尤其是在多图像编辑和细节修复方面。然而,也有用户指出该模型存在一些限制,如对某些提示的拒绝和无法进行局部编辑等问题。此外,一些用户担心模型的安全性和滥用风险,例如深度伪造和隐私侵犯。整体上,Gemini 2.5 Flash被视为图像编辑领域的一个重要里程碑,但也引发了对技术伦理和社会影响的讨论。
原文标题:Gemini 2.5 Flash Image
原文链接:https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/
讨论链接:https://news.ycombinator.com/item?id=45026719