你的位置:云开app官方入口下载 > 新闻中心 > kaiyun东说念主们浓烈筹商模子自己的同期-云开app官方入口下载

kaiyun东说念主们浓烈筹商模子自己的同期-云开app官方入口下载

时间:2025-10-28 13:06 点击:183 次

kaiyun东说念主们浓烈筹商模子自己的同期-云开app官方入口下载

文 | 刺猬公社kaiyun,作家|朗宁,剪辑|陈梅希

八月中旬,一个低调的匿名模子悄然登陆国外 AI 测评平台 LMArena,莫得诞生者标签,也莫得品牌背书,唯唯独个奇怪的代号" Nano Banana "。

固然看起来憨厚巴交的,但 Nano Banana 却在平台的 Battle 模式中,展现出惊东说念主的图像一致性和当然话语剪辑智商,粗略打败了宽敞盛名敌手。网友们被其一骑绝尘的硬实力笃信,自愿为它打上"一致性之王"和" Photoshop 杀手"等标签。

很快,Nano Banana 的热度从 AI 测评平台膨胀至 Reddit 和 Discord 的时期论坛中,东说念主们浓烈筹商模子自己的同期,都试图揭开背后诞生者的深邃面纱。

正大网友众说纷纭、吵吵闹闹地解谜时,谷歌 AI Studio 负责东说念主 Logon 在 X 平台发布了一个香蕉颜料标识,DeepMind 居品司理 Naina 也共享了一张香蕉艺术贴墙作品,加上谷歌以往就有将袖珍模子定名为 Nano 的历史,谜底变得呼之欲出。

当 Nano Banana 的热度攀升到峰值时,谷歌终于在 8 月 27 日躬行下场揭晓谜底:Nano Banana 恰是其全新推出的图像生成与剪辑模子 Gemini 2.5 Flash Image。

这场匿名模子激发的人人竞猜游戏,以谷歌官宣认领而告终,但颠覆性的 AI 图像怒潮,才刚刚驱动。

Nano Banana 风暴席卷互联网

Nano Banana 厚爱上线一周后,谷歌推行室总裁 Josh Woodward 在 X 平台清楚,该模子全面推出后已累计完成超2 亿次图像剪辑,为 Gemini 诱骗了越过 1000 万新用户,其火爆进度以致导致谷歌里面" TPU 严重过载,SRE 警报不竭"。

汹涌而来的存眷用户,让 Nano Banana 险些刷屏了人人各大社交媒体,东说念主们不甘人后参与体验、诞生新玩法、共享传播的盛景,不禁令业内东说念主士发出"好像 2023 年 ChatGPT 时刻"的热爱。

领先出圈的是 Nano Banana 多元素拼接的玩法,用户不错上传一张多元素排布图,并给图中每个物品打好标签,然后在辅导中下达你想要生成的图片概述即可。

比如一位叫 Travis David 的用户在 X 发文称,他将 13 个元素排布在一张图里上传到 Nano Banana,粗略获取了一张堪比 VOGUE 杂志的先锋大片。

多元素拼接功能在海量用户的诞生下,很快出现各类邪修玩法。

最基础确当属"完了 OOTD 解放",以往需要而已心念念扒明星同款穿搭的先锋博主们,如今只须把图片上传给 Nano Banana,模子就能秒出穿搭清单,以致二次元动漫变装的穿搭也能被逶迤为 OOTD 图。

实测过程中,刺猬公社发现,用户以致不错让 Nano Banana 按照辅导生成某种作风的模特穿搭图,再将生成的穿搭图拆解为 OOTD,全程仅耗时三分钟。拆解 OOTD 过程中,它犯了一个小小的谬妄,导致"靴子"单品出现两次,提议修改辅导时,它也能"听懂东说念主话",只删掉过剩元素,莫得改造图片的其他部分。

AI 生成的模特图和 OOTD,生成器具:Gemini2.5FlashImage(Nano Banana)

这个使用场景反过来雷同惊艳,关于日常真东说念主出镜拍摄 OOTD 的网红模特来说,大不错省去画全妆、找格局、摆 pose 等一系列为了出片所作念的繁琐职责,选一张情景好的全身照、一张面部写照,再把穿搭单品图片上传,写照级别且无需修图的素材须臾即得。

除了应用于东说念主与物之间的图像生成,网友们还发现 Nano Banana 雷同适用于东说念主与东说念主关系的拼贴,这让一众追星党们直呼万岁。

无论是鸡犬相闻的好莱坞巨星,仍是怒斥风浪的商界巨擎,就算是叫嚣着我方是火星东说念主的马斯克,只须一声令(prompt ) 下,都得沉奔赴来跟你拍一张合照。

而更进阶、亦然近期最出圈的玩法,即是期骗 Nano Banana 克己手办。

简洁的操作是上传自家毛孩子、明星、二次元偶像的图片,径直下令生成适用手办制作的图像,Nano Banana 就会给出建模图,以致连手办制品的细节图乃至视频也能获取。

固然还没灵验户实测作念首先办的共享,但刺猬公社发当今全能的电商平台上,已有商家驱动贯串基于 Nano Banana 生成图像的手办制作。经咱们商量,该商家暗示 AI 生成的手办建模图只可行为参考,什物作念出来仍有差距。

左侧是用户上传图片,右侧是商家笔据 Nano Banana 生成图片制作的手办

好多东说念主看到这里也许已默不作声,但 Nano Banana 的一齐实力远不啻于此,比如它在舆图和建筑边界的空间推理图像再生恶果,就让好多专科东说念主士啧啧称奇。

Nano Banana 的舆图视觉推明智商之强,不错在只上传一张平面舆图的情况下,按照用户打的标签和辅导,幽谷起高楼般生成舆图对应的实景。

相对应地,淌若用户上传一张城市建筑实景图,Nano Banana 又能了了地给出图中建筑的模子图,或者按照用户的条件标注图片建筑的关系信息。

不仅如斯,有网友实测这个功能雷同适用于数码电子居品以致智能汽车。

跟着 Nano Banana 的走红,层见错出的创意玩法以日为单元被诞生出来,期骗模子作念漫画分镜、给线图上色,以致径直生成有连贯剧情的电影画面…… .

上述一切的发生只用了短短两周时刻,其爆发速率以致迥殊了当年横空出世的 ChatGPT。

剥开 Nano Banana 的香蕉皮

剥开这款 AI 居品的香蕉皮,就会发现 Nano Banana 能够风靡社交媒体,绝非仅是互联网营销的得手,更是一场时期范式的冲突。

平时来说,Nano Banana 的时期冲突不错贯串为一整套针对"贯串 - 生成 - 保持一致 - 快速迭代"闭环的工程化贬责决策。

在贯串上,早期的 AI 模子每每"偏科"严重,ChatGPT 有很强的翰墨读写智商,但不太懂图像;而 Midjourney 和 DALL-E 3 为代表的模子,绘画智商虽强但对翰墨的解读却很简洁,每每把辅导的需求搞错。

原因在于这些传统模子更像一个"翻译官",它将用户的辅导(prompt)逶迤成一个中间的、抽象的数学暗示,然后图像生成模子再笔据这个数学暗示来绘画。

这种单向管说念式的职责旨趣,一方面不成幸免地会在"中间暗示"重要丢失多半原始辅导的轻细语义;另一方面,它很难原生地处理图像输入,当用户上传一张图片进行剪辑时,模子需要先将图片"反向翻译"成中间暗示,然后再进一步绘画。

而 Nano Banana 则像一个生于多话语环境的东说念主,从纯熟之初就以文本、图像、代码等数据给模子学习,因此它不再需要将一个模态"翻译"成另一个模态,而是自然就具有多模态语义对皆智商。恰是这种在翰墨和图像之间无缝丝滑的切换智商,使得用户不错用日常对话的体式(暗昧辅导),无痛用嘴修图。

Nano Banana 的时期冲突远不啻于此,它在交错式生成与一致性保持上,也对传统模子进行了降维打击。

顾名念念义,交错式生成指模子能够在一个一语气的、多措施的会话中,抽象贯串通盘险阻文的智商,包括用户之前下达的翰墨辅导、上传的图片,以及模子我方生成的历史按捺;而一致性保持则指模子在屡次生成和剪辑中,保持特定主题(东说念主物、物体、作风)的中枢智商,亦然 AI 图像模子耐久竞逐的"圣杯"。

用一个例子来呈现 Nano Banana 与传统模子的差距,假定任务是为哈利波特创作一组不同场景下的插图。

传统模子就像是与多位零丁的插画师合作,每次下达任务前,你都需要用翰墨再行形色哈利的一齐特征"黑头发、绿眼睛、圆眼镜,额头有闪电伤痕",但令东说念主捏狂的是,每个插画师对翰墨的贯串不尽交流,最终得到的每张图片的哈利固然都有上述特征,但看起来并不像统一个东说念主。

不仅如斯,零丁插画师之间对互相的作风并不了解,淌若你想让插画师 B 绘制"哈利在藏书楼温习的场景,且与插画师 A 负责的魁地奇球场分镜作风一致",这险些是不成能完成的任务,因为插画师 B 既不知说念魁地奇球场什么样,也不知说念插画师 A 的作风是什么。

而 Nano Banana 则像一位与你耐久合作的资深插画师,你只需要在最驱动职责时告诉他哈利的特征,然后就能与至好对话般粗略和运动的方式,让这位追想力绝佳的艺术家,听从你的蜕变。

此外,Nano Banana 还有着远超传统模子的快速迭代智商。

任何好模子若无法快速反应用户,都会极大缩短破圈与提升的后劲。在对用户辅导的反应与快速迭代上,传统模子就像用打字机写稿,任何一个修改都可能需要重打整页纸,而 Nano Banana 则进化到了 word 写稿,不错随时删除 / 修改局部,并坐窝看到整篇著述(图像)的新模样。

Nano Banana 能完了这一冲突,不仅在于团队将模子压缩优化到本色居品中以秒级反应(实测约 13 秒 / 张)返还高清图像,上述多模态语义对皆、交错式生成和一致性保持等上风的加持,亦然 Nano Banana 对用户辅导快速反应迭代的挫折原因。

颠覆、重塑与共生

从问世到席卷人人的两周时刻,Nano Banana 的冲击波雷同撼动了老本市集与产业端的神经。

谷歌发布 Nano Banana 当日,创意软件巨头 Adobe 的股价就应声下落约 2%;比即时波动更重要的是长线走势,据 Business Insider 报说念,Adobe 的股价在昔时一年累计下落了 35%,主要原因之一即是极速发展的东说念主工智能带来的颠覆性变革。

颠覆带来的危急感跟着网友连续解锁 Nano Banana 的新玩法,传导至更多劳动边界。

一位刚入行的电商服装模特告诉刺猬公社,原来中小商家礼聘模特拍摄每天成本约 1500 元 / 东说念主,上架时刻至少以周为单元,而 Nano Banana 能将这一整套历程压缩至分钟级,"淌若 AI 生成图像的细节不绝完善下去,异日笃定不需要这样多真东说念主模特了"。

还有好多电商影相师、后期修图师,乃至视觉野心师,也纷纭在社媒平台发帖簸弄称眼看着被 AI 抢了饭碗,准备转行去卖咖啡、送外卖、开滴滴。

AI 在产业端变成的颤动不仅发生在图像赛说念,就在谷歌上线 Nano Banana 的前一天,翻译界的最高学府蒙特雷国际计划学院晓示关闭,这家曾培养了多半应付官、翻译众人和国际 NGO 组织负责东说念主的顶级名校,自 ChatGPT 问世以来生源大幅暴减,最终堕入财务窘境。

但历史上的时期翻新告诉咱们,创新从未单纯地使某个行业沉迷,旧坐褥关系被颠覆的同期,例必跟随产业重构和新劳动的出身。

模特行业不会沉迷,但将走向分化,"批量平替"需求例必会被 AI 取代,但唯独东说念主类才气发扬出的"故事性"与"神志细节",恒久是市集的稀缺资源。

与此同期,买卖影相师、修图师和野心师的变装也在被重塑,他们的中枢价值不再局限于操控相机或软件,而是延展到审好意思判断、叙事构念念和心理造就,以及最重要的新智商:独霸 AI 完了创作意图。

而关于 Adobe 在内的器具型平台而言,摩根士丹利分析师觉得,这些应用软件在 AI 期间的价值,在于提供"临了一公里"办事。

事实上,互联网用户关于图像和翰墨生成的需求,无论是千东说念主千面的万般化进度,仍是用户基数决定的雄壮且碎屑化的辅导数目,都决定了通用 AI 模子很难提供端到端的完好意思贬责决策。

因此就像物流运载公司负责半途货运,临了一公里交由快递站点配送一样,Adobe 等平台当前也驱动接入第三方基础大模子,并基于自身的数据与资源进行后期纯熟,最终打造出更贴合用户需求、更专科的 AI 落地居品。

换一种视角看,这场时期海浪并不是一场零和游戏。Nano Banana 的出现加快了产业洗牌,但同期也在开放新的契机窗口。无论是创作家、野心师仍是企业,信得过的挑战并非何如抵牾 AI,而是何如找到与之互助的旅途。

工业翻新时期的机器扩展了东说念主类的肌肉力量,如今的生成式 AI 则在延展东说念主类的设想力和抒发力。能够咱们正在参加一个全新的内容创作阶段,在这里,东说念主与 AI 并非对立的南北极,而是互为补充的伙伴关系。

与 AI 共生的期间kaiyun,正迟缓拉开帷幕。

官网: www.zzqsgl.com

邮箱: b25d266e@outlook.com

地址: 新闻中心科技园390号

Powered by 云开app官方入口下载 RSS地图 HTML地图


云开app官方入口下载-kaiyun东说念主们浓烈筹商模子自己的同期-云开app官方入口下载