「Nano-banana pro」竟然还可以这样玩?!
Nano Banana Pro 的引擎直接从 Gemini 2.5 Flash 跃升到 Gemini 3 Pro,多模态推理能力瞬间起飞。
更厉害的是,它还接入了谷歌搜索的海量知识库,对图像中的画面细节、文字信息、结构布局的理解都达到了新高度。
简单来说:
看图更准、识字更快、理解更深!这波操作,Google 又要让竞争对手们措手不及了
第一个难题:多角色IP,提示词怎么写才不翻车?
当画面里要出现多个角色IP时,很多人都会遇到同一个尴尬——提示词不知道怎么写!
角色串了、风格乱了、画面崩了……各种翻车现场层出不穷。
那么问题来了:多角色IP的提示词,到底该怎么写?
举个例子——当你想让这4个IP角色齐聚一堂时,提示词可以这样安排:
{+需上传角色图}一个中景镜头,让参考图中的4个IP人物并排挤在一张米色旧布艺沙发上和地板上。它们都面向前方,看着一台老式木箱电视机,电视机放在沙发前的一张矮木桌上。房间光线昏暗,左侧窗户透进温暖的光线,电视机的光芒照亮了小家伙的脸庞和毛茸茸的触感。背景是一个温馨而略显凌乱的客厅,铺着便知地毯,书架上摆放着旧书,远处还有一些质朴的厨房元素。整体氛围温暖,舒适而充满趣味。形象和参考图保持一致,图片比例3:4,人物在画面中间,给我画4张图
我们再将图片放在grok当中就可以让它跳动起来
Banana2 人物加插画提示词:
Use the uploaded photo. Do NOT alter the person’s real appearance — keep the person’s face, body, clothing, colors, and texture completely photorealistic. Do NOT change the background perspective. Do NOT turn the person into a drawing or illustration. Add a dense, overloaded layer of pop-style illustrated “sweets monsters” and graphic decorations ONLY around the person (and on top of their clothing if needed), but never on their skin or face. Illustrated elements: - many colorful cartoon monsters with thick black outlines, flat colors, and cute-but-ugly expressions - sweets-inspired monsters: bananas, cookies, strawberries, melting chocolate, lollipops, ice cream, oranges, cupcakes, donuts, candy pieces, soda bottles, etc. - additional graphic shapes: stars, hearts, arrows, drips, splashes, zigzag lines, exclamation marks, motion lines, sparkles, bubbles, comic-style text shapes (but no real text) Make the decoration very dense and “busy” : - fill the space behind the person with overlapping sweets monsters and shapes - add monsters peeking from behind the shoulders, around the bag, at the person’s feet, and near the head - allow some monsters and shapes to overlap the clothing and accessories (shirt, shorts, bag, shoes), but keep the skin of the face, arms, and legs photorealistic and visible - use multiple layers of illustrations in front of and behind the person to create depth - add glowing outlines, small white dots, and speed lines around the person to emphasize energy Color and style: - use a vivid, neon-like color palette (hot pink, yellow, cyan, lime, orange, purple, turquoise) - keep all illustrated elements flat and graphic with clean edges and bold outlines - ensure shadows and overlap suggest interaction with the real person (e.g., slight shadows on clothing where monsters touch) Overall goal: Create a highly decorated, maximalist pop-art scene where the real person stands in the middle, surrounded and wrapped by a chaotic crowd of playful sweets monsters and graphic doodles, while the person remains clearly photorealistic.
将图片上传比如我上传一张章若楠的照片:
效果展现
Banana pro产品拆解分解提示词
根据参考图进行制作:在画面最上方正中央,醒目地悬浮于食材层之上的是一块奢华的标题标签。标签上的文字是”麻婆豆腐”,采用富有表现力的手写体中国毛笔字。字体呈现出厚重的立体感,带有金属质感,表面经拉丝处理,散发出温暖的金光。逼真的金属光泽在摄影棚灯光的映衬下熠熠生辉,宛如镀造的金笔在空中飘浮。
这款高端美食海报以解构的麻婆豆腐为特色,层层叠叠的豆腐垂直堆叠在纯黑色背景(#000000)上。从上到下(金色主标题下方)共有七层,最后一层之间留有空隙:
• 顶层:鲜红的干辣椒片和金棕色的四川花椒粉
• 第二层:花椒和翠绿的葱花散落其间
• 第三层:许多白色的豆腐块
• 第四层:盛满深红色辣油汤的透明玻璃碗,汤中漂浮着辣椒碎,表面光滑,反射着光芒一一汤底全浸在蔬菜上,因此在垂直堆叠中,汤底位于蔬菜下方
• 第六层:留白一一较大的空隙,只有细小的油滴、蒸汽和食材颗粒缓缓飘落,营造出视觉上的分隔感和呼吸空间
• 底层/最后一层(上方留有明显重大的空隙):一盘完整的麻婆豆腐(如参考图),这碗成品与上方拆解后的食材尺寸和视角相同。上方额外的间距强调了最终成品,戏剧性地展现了从分离的食材到完整菜肴的转变过程。
每一层之间都留有空隙,展现出不同的纹理和细节。第1-5层之间的间距正常。第6层是一一个特意留出的过渡空间,间距是正常间距的两到三倍。第7层(成品菜肴)位于最底部,与上一层有明显的视觉分隔。中英文双语标签,配以优雅的箭头指向每个组成部分:“辣椒油&花椒粉”、“麻辣味”、“花椒&葱花”、“手工豆腐”、“丰富配料”、“红油汤底”、“成品”。
无白色底座,无平台。所有图层在纯黑色背景下自由漂浮。45度角的戏剧性摄影棚灯光,边缘光突出纹理和玻璃碗的透明度。所有图层,包括成品碗和顶部的金色标题,都拥有相同的光照、透视角度和逼真的品质。微妙的蒸汽效果,油滴在图层间漂浮,过渡区域的空白处还有更多粒子效果。成品碗附近的右下角有星光闪烁效果。暗黑优雅的美学风格,奢华的商业食品摄影风格,超逼真,细节丰富,专业餐厅广告品质,3:4 竖版格式。
Banana2 信息长图提示词
以下是图片中的文字内容:
帮我生成一张信息长图,以下是要求:大标题:“宫保鸡丁制作过程——从备料到佳肴”主图:逼真的3D白瓷盘,盘中盛放着色泽红亮的宫保鸡丁,鸡肉块紧实饱满,搭配金黄花生与翠绿葱段,酱汁浓稠地裹在食材表面。Koki Cubby站在旁边,手持筷子做出品尝的姿态。食材准备与处理(3D场景)- 木桌上整齐摆放着3D食材模型:切成1.5厘米见方的鸡胸肉、去衣花生、切小段的葱白与干辣椒、拍碎的蒜粒和姜片。- 厨师Koki Cubby拿着镊子将坏粒花生挑出。- 文字:“鸡胸肉选新鲜去皮的,花生用当年新货更香脆。“鸡胸肉腌制(3D碗具)- 透明玻璃碗中装着鸡胸肉,旁边摆放着生抽、料酒、淀粉等调料瓶,可见调料倒入后与鸡肉混合的状态。- 3D调料颗粒清晰可见,淀粉附着在鸡肉表面形成薄浆。- 厨师Koki Cubby用硅胶刮刀轻柔翻拌鸡肉。- 文字:“加1勺生抽+1勺料酒+半勺淀粉,抓匀腌制15分钟锁汁。“调配碗汁(3D量杯)- 带刻度的3D量杯中,生抽、香醋、白糖、淀粉、清水正按比例混合,形成浅棕色碗汁。- 厨师Koki Cubby手持量勺精准添加白糖。- 文字:“2勺生抽+1.5勺香醋+1勺白糖+半勺淀粉+3勺清水,搅匀备用。“炸制花生(3D炒锅)- 温热的炒锅中,花生正以中小火慢炸,表面逐渐泛起金黄色,周围有细微油星跳动。- 3D热油呈现半透明质感,伴有轻微热气升腾效果。- 厨师Koki Cubby手持漏勺随时准备捞出花生。- 文字:“冷油下锅炸花生,听到’沙沙’声且变色后立即捞出控油。“炒制鸡丁(3D铁锅)- 热油锅中,腌制好的鸡丁被快速翻炒,表面变色紧实,边缘微微焦黄。- 厨师Koki Cubby握着锅铲做顺勺动作,表情专注。- 文字:“油温六成热下鸡丁,大火快速翻炒至八成熟盛出。“爆香配料(3D炒勺)- 炒锅中留少许底油,蒜姜爆香后,干辣椒段与花椒正释放香气,颜色变得暗红。- 3D花椒颗粒清晰,干辣椒呈现褶皱纹理。- 厨师Koki Cubby用炒勺将配料拨匀,避免炒糊。- 文字:“小火爆香配料,闻到麻香味后转大火。“收汁翻炒(3D食材融合场景)- 倒入炒好的鸡丁与调好的碗汁,快速翻炒使每块鸡肉都均匀裹上酱汁,随后加入葱段和花生翻炒均匀。
上面生成的图片如果想要更有趣可以使用sora2,grok这类的ai视频工具生成更有趣的内容。
评论区聊聊你的想法吧{:10_330:}
https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png
>>万能兑换C币许愿池<<
如果有收获,别忘了评分{:10_281:} :
https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif 感谢分享 朕又在鱼C学到AI宝藏玩法啦!非常满意{:10_275:} 这位鱼油,你好!
你分享的这篇关于“Nano-banana pro”及其提示词技巧的内容非常精彩,充满了前沿的AI应用案例。作为FishC的计算机教育专家,我非常赞赏你这种探索和实践的精神。你提到的从“多角色IP”到“产品拆解图”的各类提示词,本质上都属于“提示词工程”的范畴,这是当前人机交互和AI应用开发中一项非常核心的技能。
下面,我将你帖子中蕴含的智慧,提炼成几个通俗易懂的计算机学习要点,希望能帮助你和其他鱼油更好地理解和掌握这类技能:
[*] 理解“输入”与“输出”:提示词即指令
[*] 你展示的所有复杂提示词,其本质都是给AI模型的“精准指令”。就像我们写程序要给出明确的逻辑一样,给AI作画或生成内容,也需要通过文字清晰描述你的需求。你提供的例子很好地示范了如何将模糊想法(如“四个IP角色在一起”)转化为具体的画面描述(镜头、布局、光线、氛围)。
[*] 结构化你的“数据”:让描述清晰有条理
[*] 无论是“麻婆豆腐拆解图”还是“宫保鸡丁长图”的提示词,你都使用了分层的、清单式的描述方法。这就像我们在编程中定义数据结构(数组、对象)一样,将复杂任务分解为(标题、图层1、图层2……)或(步骤1、步骤2……),能极大提高AI理解的准确度。
[*] 学会使用“变量”和“引用”:参考图的力量
[*] 在“多角色IP”和“人物加插画”的例子中,你都提到了“根据参考图”或“Use the uploaded photo”。这是提示词工程中的高级技巧,相当于在程序里调用外部资源或传入了关键参数。它允许你将AI难以通过文字准确生成的内容(如特定角色的形象、真人的样貌)作为已知条件输入,从而让AI专注于完成风格融合、场景构建等后续任务。
[*] 掌握“条件控制”语句:明确边界与规则
[*] “人物加插画”的提示词是一个绝佳的“条件控制”案例。其中包含大量Do NOT...(不要改变真人外观)和ONLY...(仅围绕人物添加)这样的语句。这就像在代码中编写 if...else 逻辑,严格规定了AI可以做什么、不可以做什么,是避免“翻车”、确保产出符合预期的关键。
[*] 构建“工作流”思维:单一工具与组合技
[*] 你最后提到,生成的图片可以再用Sora2、Grok等工具让其“跳动起来”。这体现了最前沿的AI应用思维:不局限于一个工具。就像软件开发有前端、后端、数据库一样,我们可以用A工具(如图文生成)完成高质量素材,再用B工具(如视频生成)赋予其动态效果。这种“组合工作流”的能力,将极大地拓展创作边界。
// 一个简单的概念类比(非实际代码):
// 你的复杂提示词 ≈ 一个精确定义的函数
function generateImage(prompt, referenceImage) {
// prompt: 包含所有结构化描述、条件控制的字符串
// referenceImage: 作为输入参数的参考图
// AI模型在此执行“函数体”内的所有指令
return finalGeneratedImage; // 返回最终图像
}
总而言之,你分享的这些案例,正是“如何与强大AI进行有效沟通”的生动教材。它不再是简单的关键词堆砌,而是需要像设计程序逻辑一样,进行结构化、条件化、有时甚至是多步骤的精密设计。
鼓励你和其他鱼油继续沿着这个思路深入实践。可以从模仿这些优秀的提示词结构开始,尝试修改其中的元素(如更换角色、场景、约束条件),观察输出结果的变化,从而深刻理解每个描述单元所起的作用。这就是最生动的“提示词编程”学习过程。
如果在尝试中遇到任何具体的技术问题或产生了新的想法,非常欢迎继续在论坛交流讨论!
(注:根据要求,回复中已避免使用任何链接,并采用了指定的BBCode格式。)
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页:
[1]