中东

谷歌发布Nano Banana 2:人工智能图像生成领域的一次飞跃,但仍存在显著局限性

谷歌正式推出了Nano Banana 2,这是其AI驱动图像生成器的最新版本,现已无缝集成到其Gemini聊天机器人中作为默认功能。尽管它提供了卓越的速度和先进的编辑能力,但实际操作经验揭示了一些缺陷,包括实时数据错误和对提示的意外解释。这个强大的工具引发了关于数字时代图像验证和媒体责任的重要问题。

159 次查看 1 分钟阅读
1.0×

Global - 艾赫巴里通讯社

谷歌发布Nano Banana 2:人工智能图像生成领域的一次飞跃,但仍存在显著局限性

谷歌已正式推出Nano Banana 2,这是其人工智能驱动图像生成器的最新迭代,标志着可访问AI创意工具的重大进步。这个更新的模型现已无缝集成到谷歌多功能Gemini聊天机器人中作为默认图像生成引擎,承诺为用户提供从快速图像创建到复杂照片编辑的增强功能。

Nano Banana 2的旅程始于去年8月,当时推出了最初的Nano Banana模型,随后仅三个月后迅速发布了Nano Banana Pro。每个版本都带来了渐进式改进,Nano Banana Pro显著增强了文本渲染并实现了实时网络搜索,以生成更具上下文相关性的图像。Nano Banana 2在这些基础上构建,不仅提供了卓越的速度,还提供了更强大的照片编辑功能,使其成为休闲用户和内容创作者的强大工具。

可访问性是此版本的基础。用户可以通过Gemini应用程序或网站轻松与Nano Banana 2互动,通过点击专用的“香蕉表情符号”或直接将请求整合到聊天机器人提示中来启动图像生成。此外,谷歌扩大了其覆盖范围,使这个先进的图像模型在其更广泛的生态系统中可用,包括谷歌搜索工具、AI Studio和云服务,从而使尖端AI艺术的访问民主化。

Nano Banana 2最受吹捧的功能之一是它能够从网络中提取实时信息,这一功能对于生成信息图表等数据丰富的视觉内容特别有用。为了测试这一点,一位用户最近委托Gemini为其即将到来的滑雪之旅创建一份自定义天气报告信息图。初步输出看起来很有希望:清晰的文本、渲染良好的滑雪者以及包括温度、风和雪条件在内的详细预测,并附有关于验证官方来源的免责声明。

然而,这种看似完美的执行很快揭示了AI持续面临的挑战之一。在与独立天气来源进行交叉参照后,很明显Gemini错误地提取了前一周的过时天气数据,导致日期和预测不一致。尽管机器人能够根据提示纠正其错误,但这一事件提醒我们,即使与旨在提高准确性的高级AI系统交互时,人类监督和验证的内在需求仍然至关重要。 “垃圾进,垃圾出”的原则,或者在这种情况下,“过时数据进,不准确信息图出”,仍然是一个强大的因素。

除了事实准确性之外,Nano Banana 2的创意解释也可能导致意想不到的,有时甚至是幽默的结果。在尝试生成一张用户在热水浴缸中“滑稽地皱纹”的图像时,AI生成了一个令人惊讶的衰老描绘,使个体看起来比长时间浸泡后仅仅像梅子一样皱纹,而是老了几十年。更奇怪的是,尽管是热水浴缸的背景,机器人却莫名其妙地让用户穿着衬衫。然而,在这些怪癖之中,该模型展示了对原始上传照片中微小细节的卓越忠实度,例如衬衫的独特设计和特定的珠宝,将它们无缝地集成到新的、逼真的雪景按摩浴缸场景中。这突出了一种迷人的二分法:令人印象深刻的微细节复制与令人惊讶的上下文理解缺乏并存。

为了进一步推动幻想的界限,另一位用户请求了一张自己“肌肉发达、赤膊上阵、以强烈的滑雪速度向所有人喷洒粉雪”的“逼真图像”。生成的图像,尽管拥有逼真的雪花飞溅和正确渲染的手等令人印象深刻的技术元素(早期AI模型的常见陷阱),但却受到了“恐怖谷”效应的影响,尤其是在面部周围。用户将其描述为“糟糕的Photoshop”,其中他们的头部似乎笨拙地叠加在健身模特的身体上,创造了一个刺耳、不真实的视觉效果。这种情况强调了AI在实现人类主题真正无缝、逼真修改方面持续面临的挑战,尤其是在组合不同元素时。

尽管在初步实践经验中存在这些偶尔的失误和持续的“粗糙边缘”,Nano Banana 2无疑代表了谷歌在追求逼真AI工具方面迈出的重要一步。该公司在改进图像操纵能力方面的持续投资显而易见,即使这种强大技术的伦理影响变得更加突出。谷歌确实对其AI生成的输出进行水印处理,这是一项值得称赞的努力,旨在区分合成内容。然而,随着这些生成质量的显著提高,这些微妙的水印很容易被快速滚动社交媒体动态的用户忽略,使得真实图像和AI伪造图像之间的区别变得越来越模糊。

Nano Banana 2在Gemini应用程序和其他谷歌服务中免费广泛可用,使创建高度特定但完全虚构的图像的能力比以往任何时候都更快地民主化。这种易于访问性伴随着数字内容消费者的一项关键责任:对在线遇到的未经核实的图像进行高度审查。随着AI工具不断发展,在创建令人信服的现实方面变得越来越复杂,媒体素养和批判性思维的必要性变得至关重要,作为抵御潜在虚假信息和视觉媒体信任度下降的重要防御。

分享:

相关新闻

尚未阅读