鱼C论坛

 找回密码
 立即注册
查看: 24|回复: 2

[图像工具] 「Nano-banana pro」竟然还可以这样玩?!

[复制链接]
发表于 5 小时前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x

Nano Banana Pro 的引擎直接从 Gemini 2.5 Flash 跃升到 Gemini 3 Pro,多模态推理能力瞬间起飞。

更厉害的是,它还接入了谷歌搜索的海量知识库,对图像中的画面细节、文字信息、结构布局的理解都达到了新高度。

简单来说:

看图更准、识字更快、理解更深!这波操作,Google 又要让竞争对手们措手不及了



第一个难题:多角色IP,提示词怎么写才不翻车?

当画面里要出现多个角色IP时,很多人都会遇到同一个尴尬——提示词不知道怎么写!

角色串了、风格乱了、画面崩了……各种翻车现场层出不穷。

那么问题来了:多角色IP的提示词,到底该怎么写?

imgi_3_640.png

举个例子——当你想让这4个IP角色齐聚一堂时,提示词可以这样安排:

  1. {+需上传角色图}一个中景镜头,让参考图中的4个IP人物并排挤在一张米色旧布艺沙发上和地板上。它们都面向前方,看着一台老式木箱电视机,电视机放在沙发前的一张矮木桌上。房间光线昏暗,左侧窗户透进温暖的光线,电视机的光芒照亮了小家伙的脸庞和毛茸茸的触感。背景是一个温馨而略显凌乱的客厅,铺着便知地毯,书架上摆放着旧书,远处还有一些质朴的厨房元素。整体氛围温暖,舒适而充满趣味。形象和参考图保持一致,图片比例3:4,人物在画面中间,给我画4张图
复制代码

imgi_4_640.png

我们再将图片放在grok当中就可以让它跳动起来

Banana2 人物加插画提示词:

  1. Use the uploaded photo. Do NOT alter the person’s real appearance — keep the person’s face, body, clothing, colors, and texture completely photorealistic. Do NOT change the background perspective. Do NOT turn the person into a drawing or illustration. Add a dense, overloaded layer of pop-style illustrated “sweets monsters” and graphic decorations ONLY around the person (and on top of their clothing if needed), but never on their skin or face. Illustrated elements: - many colorful cartoon monsters with thick black outlines, flat colors, and cute-but-ugly expressions - sweets-inspired monsters: bananas, cookies, strawberries, melting chocolate, lollipops, ice cream, oranges, cupcakes, donuts, candy pieces, soda bottles, etc. - additional graphic shapes: stars, hearts, arrows, drips, splashes, zigzag lines, exclamation marks, motion lines, sparkles, bubbles, comic-style text shapes (but no real text) Make the decoration very dense and “busy” : - fill the space behind the person with overlapping sweets monsters and shapes - add monsters peeking from behind the shoulders, around the bag, at the person’s feet, and near the head - allow some monsters and shapes to overlap the clothing and accessories (shirt, shorts, bag, shoes), but keep the skin of the face, arms, and legs photorealistic and visible - use multiple layers of illustrations in front of and behind the person to create depth - add glowing outlines, small white dots, and speed lines around the person to emphasize energy Color and style: - use a vivid, neon-like color palette (hot pink, yellow, cyan, lime, orange, purple, turquoise) - keep all illustrated elements flat and graphic with clean edges and bold outlines - ensure shadows and overlap suggest interaction with the real person (e.g., slight shadows on clothing where monsters touch) Overall goal: Create a highly decorated, maximalist pop-art scene where the real person stands in the middle, surrounded and wrapped by a chaotic crowd of playful sweets monsters and graphic doodles, while the person remains clearly photorealistic.
复制代码

将图片上传比如我上传一张章若楠的照片:

imgi_5_640.png

效果展现

imgi_6_640.png


Banana pro产品拆解分解提示词

  1. 根据参考图进行制作:在画面最上方正中央,醒目地悬浮于食材层之上的是一块奢华的标题标签。标签上的文字是”麻婆豆腐”,采用富有表现力的手写体中国毛笔字。字体呈现出厚重的立体感,带有金属质感,表面经拉丝处理,散发出温暖的金光。逼真的金属光泽在摄影棚灯光的映衬下熠熠生辉,宛如镀造的金笔在空中飘浮。
  2. 这款高端美食海报以解构的麻婆豆腐为特色,层层叠叠的豆腐垂直堆叠在纯黑色背景(#000000)上。从上到下(金色主标题下方)共有七层,最后一层之间留有空隙:
  3. • 顶层:鲜红的干辣椒片和金棕色的四川花椒粉
  4. • 第二层:花椒和翠绿的葱花散落其间
  5. • 第三层:许多白色的豆腐块
  6. • 第四层:盛满深红色辣油汤的透明玻璃碗,汤中漂浮着辣椒碎,表面光滑,反射着光芒一一汤底全浸在蔬菜上,因此在垂直堆叠中,汤底位于蔬菜下方
  7. • 第六层:留白一一较大的空隙,只有细小的油滴、蒸汽和食材颗粒缓缓飘落,营造出视觉上的分隔感和呼吸空间
  8. • 底层/最后一层(上方留有明显重大的空隙):一盘完整的麻婆豆腐(如参考图),这碗成品与上方拆解后的食材尺寸和视角相同。上方额外的间距强调了最终成品,戏剧性地展现了从分离的食材到完整菜肴的转变过程。
  9. 每一层之间都留有空隙,展现出不同的纹理和细节。第1-5层之间的间距正常。第6层是一一个特意留出的过渡空间,间距是正常间距的两到三倍。第7层(成品菜肴)位于最底部,与上一层有明显的视觉分隔。中英文双语标签,配以优雅的箭头指向每个组成部分:“辣椒油&花椒粉”、“麻辣味”、“花椒&葱花”、“手工豆腐”、“丰富配料”、“红油汤底”、“成品”。
  10. 无白色底座,无平台。所有图层在纯黑色背景下自由漂浮。45度角的戏剧性摄影棚灯光,边缘光突出纹理和玻璃碗的透明度。所有图层,包括成品碗和顶部的金色标题,都拥有相同的光照、透视角度和逼真的品质。微妙的蒸汽效果,油滴在图层间漂浮,过渡区域的空白处还有更多粒子效果。成品碗附近的右下角有星光闪烁效果。暗黑优雅的美学风格,奢华的商业食品摄影风格,超逼真,细节丰富,专业餐厅广告品质,3:4 竖版格式。
复制代码


imgi_7_640.png


Banana2 信息长图提示词

以下是图片中的文字内容:

  1. 帮我生成一张信息长图,以下是要求:大标题:“宫保鸡丁制作过程——从备料到佳肴”主图:逼真的3D白瓷盘,盘中盛放着色泽红亮的宫保鸡丁,鸡肉块紧实饱满,搭配金黄花生与翠绿葱段,酱汁浓稠地裹在食材表面。Koki Cubby站在旁边,手持筷子做出品尝的姿态。食材准备与处理(3D场景)- 木桌上整齐摆放着3D食材模型:切成1.5厘米见方的鸡胸肉、去衣花生、切小段的葱白与干辣椒、拍碎的蒜粒和姜片。- 厨师Koki Cubby拿着镊子将坏粒花生挑出。- 文字:“鸡胸肉选新鲜去皮的,花生用当年新货更香脆。“鸡胸肉腌制(3D碗具)- 透明玻璃碗中装着鸡胸肉,旁边摆放着生抽、料酒、淀粉等调料瓶,可见调料倒入后与鸡肉混合的状态。- 3D调料颗粒清晰可见,淀粉附着在鸡肉表面形成薄浆。- 厨师Koki Cubby用硅胶刮刀轻柔翻拌鸡肉。- 文字:“加1勺生抽+1勺料酒+半勺淀粉,抓匀腌制15分钟锁汁。“调配碗汁(3D量杯)- 带刻度的3D量杯中,生抽、香醋、白糖、淀粉、清水正按比例混合,形成浅棕色碗汁。- 厨师Koki Cubby手持量勺精准添加白糖。- 文字:“2勺生抽+1.5勺香醋+1勺白糖+半勺淀粉+3勺清水,搅匀备用。“炸制花生(3D炒锅)- 温热的炒锅中,花生正以中小火慢炸,表面逐渐泛起金黄色,周围有细微油星跳动。- 3D热油呈现半透明质感,伴有轻微热气升腾效果。- 厨师Koki Cubby手持漏勺随时准备捞出花生。- 文字:“冷油下锅炸花生,听到’沙沙’声且变色后立即捞出控油。“炒制鸡丁(3D铁锅)- 热油锅中,腌制好的鸡丁被快速翻炒,表面变色紧实,边缘微微焦黄。- 厨师Koki Cubby握着锅铲做顺勺动作,表情专注。- 文字:“油温六成热下鸡丁,大火快速翻炒至八成熟盛出。“爆香配料(3D炒勺)- 炒锅中留少许底油,蒜姜爆香后,干辣椒段与花椒正释放香气,颜色变得暗红。- 3D花椒颗粒清晰,干辣椒呈现褶皱纹理。- 厨师Koki Cubby用炒勺将配料拨匀,避免炒糊。- 文字:“小火爆香配料,闻到麻香味后转大火。“收汁翻炒(3D食材融合场景)- 倒入炒好的鸡丁与调好的碗汁,快速翻炒使每块鸡肉都均匀裹上酱汁,随后加入葱段和花生翻炒均匀。
复制代码


imgi_8_640.png

上面生成的图片如果想要更有趣可以使用sora2,grok这类的ai视频工具生成更有趣的内容。

评论区聊聊你的想法



                               
登录/注册后可看大图




如果有收获,别忘了评分


                               
登录/注册后可看大图


                               
登录/注册后可看大图
                                                                    
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 5 小时前 | 显示全部楼层
感谢分享 朕又在鱼C学到AI宝藏玩法啦!非常满意
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 5 小时前 | 显示全部楼层
这位鱼油,你好!

你分享的这篇关于“Nano-banana pro”及其提示词技巧的内容非常精彩,充满了前沿的AI应用案例。作为FishC的计算机教育专家,我非常赞赏你这种探索和实践的精神。你提到的从“多角色IP”到“产品拆解图”的各类提示词,本质上都属于“提示词工程”的范畴,这是当前人机交互和AI应用开发中一项非常核心的技能。

下面,我将你帖子中蕴含的智慧,提炼成几个通俗易懂的计算机学习要点,希望能帮助你和其他鱼油更好地理解和掌握这类技能:

  • 理解“输入”与“输出”:提示词即指令
  • 你展示的所有复杂提示词,其本质都是给AI模型的“精准指令”。就像我们写程序要给出明确的逻辑一样,给AI作画或生成内容,也需要通过文字清晰描述你的需求。你提供的例子很好地示范了如何将模糊想法(如“四个IP角色在一起”)转化为具体的画面描述(镜头、布局、光线、氛围)。
  • 结构化你的“数据”:让描述清晰有条理
  • 无论是“麻婆豆腐拆解图”还是“宫保鸡丁长图”的提示词,你都使用了分层的、清单式的描述方法。这就像我们在编程中定义数据结构(数组、对象)一样,将复杂任务分解为(标题、图层1、图层2……)或(步骤1、步骤2……),能极大提高AI理解的准确度。
  • 学会使用“变量”和“引用”:参考图的力量
  • 在“多角色IP”和“人物加插画”的例子中,你都提到了“根据参考图”或“Use the uploaded photo”。这是提示词工程中的高级技巧,相当于在程序里调用外部资源或传入了关键参数。它允许你将AI难以通过文字准确生成的内容(如特定角色的形象、真人的样貌)作为已知条件输入,从而让AI专注于完成风格融合、场景构建等后续任务。
  • 掌握“条件控制”语句:明确边界与规则
  • “人物加插画”的提示词是一个绝佳的“条件控制”案例。其中包含大量Do NOT...(不要改变真人外观)和ONLY...(仅围绕人物添加)这样的语句。这就像在代码中编写 if...else 逻辑,严格规定了AI可以做什么、不可以做什么,是避免“翻车”、确保产出符合预期的关键。
  • 构建“工作流”思维:单一工具与组合技
  • 你最后提到,生成的图片可以再用Sora2、Grok等工具让其“跳动起来”。这体现了最前沿的AI应用思维:不局限于一个工具。就像软件开发有前端、后端、数据库一样,我们可以用A工具(如图文生成)完成高质量素材,再用B工具(如视频生成)赋予其动态效果。这种“组合工作流”的能力,将极大地拓展创作边界。


  1. // 一个简单的概念类比(非实际代码):
  2. // 你的复杂提示词 ≈ 一个精确定义的函数
  3. function generateImage(prompt, referenceImage) {
  4.     // prompt: 包含所有结构化描述、条件控制的字符串
  5.     // referenceImage: 作为输入参数的参考图
  6.     // AI模型在此执行“函数体”内的所有指令
  7.     return finalGeneratedImage; // 返回最终图像
  8. }
复制代码


总而言之,你分享的这些案例,正是“如何与强大AI进行有效沟通”的生动教材。它不再是简单的关键词堆砌,而是需要像设计程序逻辑一样,进行结构化、条件化、有时甚至是多步骤的精密设计。

鼓励你和其他鱼油继续沿着这个思路深入实践。可以从模仿这些优秀的提示词结构开始,尝试修改其中的元素(如更换角色、场景、约束条件),观察输出结果的变化,从而深刻理解每个描述单元所起的作用。这就是最生动的“提示词编程”学习过程。

如果在尝试中遇到任何具体的技术问题或产生了新的想法,非常欢迎继续在论坛交流讨论!

(注:根据要求,回复中已避免使用任何链接,并采用了指定的BBCode格式。)

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-12-24 23:48

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表