گوگل از نانو بنانا ۲ رونمایی کرد: جهشی در تولید تصویر با هوش مصنوعی با محدودیت‌های قابل توجه

Global - خبرگزاری اخباری

گوگل از نانو بنانا ۲ رونمایی کرد: جهشی در تولید تصویر با هوش مصنوعی با محدودیت‌های قابل توجه

گوگل رسماً نانو بنانا ۲، آخرین نسخه از تولیدکننده تصویر مبتنی بر هوش مصنوعی خود را عرضه کرده است که پیشرفت چشمگیری در ابزارهای خلاقانه هوش مصنوعی قابل دسترس محسوب می‌شود. این مدل به‌روز شده اکنون به طور یکپارچه به عنوان موتور پیش‌فرض تولید تصویر در چت‌بات چندمنظوره Gemini گوگل ادغام شده و به کاربران قابلیت‌های بهبود یافته‌ای از ایجاد سریع تصویر تا ویرایش پیچیده عکس را نوید می‌دهد.

سفر به سوی نانو بنانا ۲ در آگوست سال گذشته با عرضه مدل اولیه نانو بنانا آغاز شد و پس از آن، تنها سه ماه بعد، نسخه پرو به سرعت منتشر شد. هر نسخه بهبودهای تدریجی را به همراه داشت، به طوری که نانو بنانا پرو به طور قابل توجهی رندر متن را بهبود بخشید و امکان جستجوی وب در زمان واقعی را برای تولید تصاویر مرتبط‌تر با متن فراهم کرد. نانو بنانا ۲ بر اساس این پایه‌ها ساخته شده و نه تنها سرعت بالاتری را ارائه می‌دهد، بلکه قابلیت‌های ویرایش عکس قوی‌تری نیز دارد و آن را به ابزاری قدرتمند برای کاربران عادی و تولیدکنندگان محتوا تبدیل می‌کند.

Read Also

دسترسی‌پذیری از ارکان اصلی این انتشار است. کاربران می‌توانند به راحتی با نانو بنانا ۲ از طریق اپلیکیشن یا وب‌سایت Gemini تعامل داشته باشند و تولید تصویر را با کلیک بر روی یک "ایموجی موز" اختصاصی یا با گنجاندن درخواست‌ها به طور مستقیم در دستورات چت‌بات خود آغاز کنند. علاوه بر این، گوگل دامنه خود را گسترش داده و این مدل تصویر پیشرفته را در اکوسیستم گسترده‌تر خود، از جمله ابزارهای جستجوی گوگل، AI Studio و خدمات ابری، در دسترس قرار داده و دسترسی به هنر پیشرفته هوش مصنوعی را دموکراتیک کرده است.

یکی از تحسین‌شده‌ترین ویژگی‌های نانو بنانا ۲، توانایی آن در استخراج اطلاعات در زمان واقعی از وب است، قابلیتی که به ویژه برای تولید تصاویر غنی از داده مانند اینفوگرافیک‌ها مفید است. برای آزمایش این موضوع، یک کاربر اخیراً به Gemini دستور داد تا یک اینفوگرافیک گزارش آب و هوایی سفارشی برای سفر اسکی آینده خود ایجاد کند. خروجی اولیه امیدوارکننده به نظر می‌رسید: متن واضح، اسکی‌بازان به خوبی رندر شده، و پیش‌بینی دقیق شامل دما، باد و شرایط برف، همراه با سلب مسئولیتی در مورد تأیید منابع رسمی.

با این حال، این اجرای به ظاهر بی‌عیب و نقص به سرعت یکی از چالش‌های پایدار هوش مصنوعی را آشکار کرد. پس از مقایسه با منابع مستقل آب و هوا، مشخص شد که Gemini به اشتباه داده‌های آب و هوایی منسوخ شده هفته گذشته را دریافت کرده و تاریخ‌ها و پیش‌بینی‌ها را نادرست نشان داده است. در حالی که ربات قادر به تصحیح اشتباه خود در صورت درخواست بود، این حادثه به عنوان یادآوری مهمی از نیاز ذاتی به نظارت و تأیید انسانی عمل می‌کند، حتی هنگام تعامل با سیستم‌های پیشرفته هوش مصنوعی که برای دقت طراحی شده‌اند. اصل "ورودی بی‌ارزش، خروجی بی‌ارزش"، یا در این مورد، "داده‌های منسوخ شده ورودی، اینفوگرافیک نادرست خروجی"، همچنان یک عامل قوی است.

فراتر از دقت واقعی، تفسیرهای خلاقانه نانو بنانا ۲ نیز می‌تواند منجر به نتایج غیرمنتظره و گاهی اوقات طنزآمیز شود. در تلاشی برای تولید تصویری "به طرز کمدی چروکیده" از یک کاربر در یک جکوزی، هوش مصنوعی تصویری به طرز شگفت‌آوری پیر تولید کرد که باعث شد فرد به جای اینکه فقط از خیساندن طولانی چروکیده به نظر برسد، ده‌ها سال پیرتر به نظر برسد. علاوه بر این، ربات به طرز غیرقابل توضیحی پیراهن کاربر را با وجود زمینه جکوزی بر تن او نگه داشت. با این حال، در میان این عجیب و غریب‌ها، مدل وفاداری قابل توجهی به جزئیات کوچک عکس اصلی آپلود شده، مانند طراحی منحصر به فرد یک پیراهن و جواهرات خاص، نشان داد و آنها را به طور یکپارچه در صحنه جکوزی برفی فوتورئالیستی جدید ادغام کرد. این نشان‌دهنده یک دوگانگی جذاب است: تکرار جزئیات کوچک چشمگیر در کنار فقدان تعجب‌آور درک متنی.

یک کاربر دیگر برای فراتر رفتن از مرزهای فانتزی، درخواست یک "تصویر فوتورئالیستی" از خود را با عنوان "عضلانی و بدون پیراهن، با سرعت اسکی شدید همه را با پودر برف می‌پوشاند" کرد. تصویر حاصل، اگرچه دارای عناصر فنی چشمگیری مانند پاشش واقعی برف و دست‌های به درستی رندر شده بود (یک دام رایج برای مدل‌های هوش مصنوعی قبلی)، اما از اثر "دره وهم‌آور"، به ویژه در اطراف صورت، رنج می‌برد. کاربر آن را به عنوان یک "فتوشاپ بد" توصیف کرد که در آن سر او به طرز ناشیانه‌ای روی بدن یک مدل تناسب اندام قرار گرفته بود و یک تصویر ناخوشایند و غیرواقعی ایجاد می‌کرد. این سناریو بر چالش مداوم هوش مصنوعی در دستیابی به تغییرات واقعاً یکپارچه و فوتورئالیستی از سوژه‌های انسانی، به ویژه هنگام ترکیب عناصر مختلف، تأکید می‌کند.

با وجود این اشتباهات گاه به گاه و "لبه‌های ناهموار" مداوم که در تجربیات عملی اولیه مشاهده شد، نانو بنانا ۲ بدون شک گام مهمی در پیگیری گوگل برای ابزارهای هوش مصنوعی فوتورئالیستی است. سرمایه‌گذاری مستمر این شرکت در بهبود قابلیت‌های دستکاری تصویر آشکار است، حتی با برجسته‌تر شدن پیامدهای اخلاقی چنین فناوری قدرتمندی. گوگل خروجی‌های تولید شده توسط هوش مصنوعی خود را واترمارک می‌کند، تلاشی قابل ستایش برای متمایز کردن محتوای مصنوعی. با این حال، با بهبود چشمگیر کیفیت این نسل‌ها، این واترمارک‌های ظریف می‌توانند به راحتی توسط کاربرانی که به سرعت در فیدهای رسانه‌های اجتماعی پیمایش می‌کنند، نادیده گرفته شوند و تمایز بین تصاویر واقعی و تصاویر ساخته شده توسط هوش مصنوعی را به طور فزاینده‌ای مبهم کنند.

Related News

دسترسی گسترده به نانو بنانا ۲، رایگان برای استفاده در اپلیکیشن Gemini و سایر خدمات گوگل، توانایی ایجاد تصاویر بسیار خاص، اما کاملاً ساختگی، را سریع‌تر از همیشه دموکراتیک می‌کند. این سهولت دسترسی با مسئولیتی حیاتی برای مصرف‌کنندگان محتوای دیجیتال همراه است: انجام بررسی دقیق‌تر بر روی تصاویر تأیید نشده که به صورت آنلاین با آنها مواجه می‌شوند. همانطور که ابزارهای هوش مصنوعی به تکامل خود ادامه می‌دهند و در ایجاد واقعیت‌های قانع‌کننده پیچیده‌تر می‌شوند، ضرورت سواد رسانه‌ای و تفکر انتقادی حیاتی می‌شود و به عنوان یک دفاع حیاتی در برابر اطلاعات نادرست احتمالی و فرسایش اعتماد به رسانه‌های بصری عمل می‌کند.

خبرگزاری اخباری

گوگل از نانو بنانا ۲ رونمایی کرد: جهشی در تولید تصویر با هوش مصنوعی با محدودیت‌های قابل توجه

جدیدترین تولیدکننده تصویر هوش مصنوعی گوگل سرعت و ویژگی‌های و