Global - خبرگزاری اخباری
گوگل از نانو بنانا ۲ رونمایی کرد: جهشی در تولید تصویر با هوش مصنوعی با محدودیتهای قابل توجه
گوگل رسماً نانو بنانا ۲، آخرین نسخه از تولیدکننده تصویر مبتنی بر هوش مصنوعی خود را عرضه کرده است که پیشرفت چشمگیری در ابزارهای خلاقانه هوش مصنوعی قابل دسترس محسوب میشود. این مدل بهروز شده اکنون به طور یکپارچه به عنوان موتور پیشفرض تولید تصویر در چتبات چندمنظوره Gemini گوگل ادغام شده و به کاربران قابلیتهای بهبود یافتهای از ایجاد سریع تصویر تا ویرایش پیچیده عکس را نوید میدهد.
سفر به سوی نانو بنانا ۲ در آگوست سال گذشته با عرضه مدل اولیه نانو بنانا آغاز شد و پس از آن، تنها سه ماه بعد، نسخه پرو به سرعت منتشر شد. هر نسخه بهبودهای تدریجی را به همراه داشت، به طوری که نانو بنانا پرو به طور قابل توجهی رندر متن را بهبود بخشید و امکان جستجوی وب در زمان واقعی را برای تولید تصاویر مرتبطتر با متن فراهم کرد. نانو بنانا ۲ بر اساس این پایهها ساخته شده و نه تنها سرعت بالاتری را ارائه میدهد، بلکه قابلیتهای ویرایش عکس قویتری نیز دارد و آن را به ابزاری قدرتمند برای کاربران عادی و تولیدکنندگان محتوا تبدیل میکند.
Read Also
- استراتژی برتری آلمان: ده دانشگاه نخبه برای هفت سال دیگر بودجه مستمر دریافت میکنند
- انتخابات شهرداری در بایرن: فضای سیاسی در سمت راست CSU سئودر در حال گسترش است
- تنگه هرمز: چگونه ایران میتواند با مینهای دریایی کشتیرانی جهانی را تهدید کند
- چین «قانون وحدت قومی» را اجرا میکند، تشدید همسانسازی اقلیتها
- مناقشة أموال الاتحاد الأوروبي: المعارضة البولندية تخشى الهيمنة الألمانية
دسترسیپذیری از ارکان اصلی این انتشار است. کاربران میتوانند به راحتی با نانو بنانا ۲ از طریق اپلیکیشن یا وبسایت Gemini تعامل داشته باشند و تولید تصویر را با کلیک بر روی یک "ایموجی موز" اختصاصی یا با گنجاندن درخواستها به طور مستقیم در دستورات چتبات خود آغاز کنند. علاوه بر این، گوگل دامنه خود را گسترش داده و این مدل تصویر پیشرفته را در اکوسیستم گستردهتر خود، از جمله ابزارهای جستجوی گوگل، AI Studio و خدمات ابری، در دسترس قرار داده و دسترسی به هنر پیشرفته هوش مصنوعی را دموکراتیک کرده است.
یکی از تحسینشدهترین ویژگیهای نانو بنانا ۲، توانایی آن در استخراج اطلاعات در زمان واقعی از وب است، قابلیتی که به ویژه برای تولید تصاویر غنی از داده مانند اینفوگرافیکها مفید است. برای آزمایش این موضوع، یک کاربر اخیراً به Gemini دستور داد تا یک اینفوگرافیک گزارش آب و هوایی سفارشی برای سفر اسکی آینده خود ایجاد کند. خروجی اولیه امیدوارکننده به نظر میرسید: متن واضح، اسکیبازان به خوبی رندر شده، و پیشبینی دقیق شامل دما، باد و شرایط برف، همراه با سلب مسئولیتی در مورد تأیید منابع رسمی.
با این حال، این اجرای به ظاهر بیعیب و نقص به سرعت یکی از چالشهای پایدار هوش مصنوعی را آشکار کرد. پس از مقایسه با منابع مستقل آب و هوا، مشخص شد که Gemini به اشتباه دادههای آب و هوایی منسوخ شده هفته گذشته را دریافت کرده و تاریخها و پیشبینیها را نادرست نشان داده است. در حالی که ربات قادر به تصحیح اشتباه خود در صورت درخواست بود، این حادثه به عنوان یادآوری مهمی از نیاز ذاتی به نظارت و تأیید انسانی عمل میکند، حتی هنگام تعامل با سیستمهای پیشرفته هوش مصنوعی که برای دقت طراحی شدهاند. اصل "ورودی بیارزش، خروجی بیارزش"، یا در این مورد، "دادههای منسوخ شده ورودی، اینفوگرافیک نادرست خروجی"، همچنان یک عامل قوی است.
فراتر از دقت واقعی، تفسیرهای خلاقانه نانو بنانا ۲ نیز میتواند منجر به نتایج غیرمنتظره و گاهی اوقات طنزآمیز شود. در تلاشی برای تولید تصویری "به طرز کمدی چروکیده" از یک کاربر در یک جکوزی، هوش مصنوعی تصویری به طرز شگفتآوری پیر تولید کرد که باعث شد فرد به جای اینکه فقط از خیساندن طولانی چروکیده به نظر برسد، دهها سال پیرتر به نظر برسد. علاوه بر این، ربات به طرز غیرقابل توضیحی پیراهن کاربر را با وجود زمینه جکوزی بر تن او نگه داشت. با این حال، در میان این عجیب و غریبها، مدل وفاداری قابل توجهی به جزئیات کوچک عکس اصلی آپلود شده، مانند طراحی منحصر به فرد یک پیراهن و جواهرات خاص، نشان داد و آنها را به طور یکپارچه در صحنه جکوزی برفی فوتورئالیستی جدید ادغام کرد. این نشاندهنده یک دوگانگی جذاب است: تکرار جزئیات کوچک چشمگیر در کنار فقدان تعجبآور درک متنی.
یک کاربر دیگر برای فراتر رفتن از مرزهای فانتزی، درخواست یک "تصویر فوتورئالیستی" از خود را با عنوان "عضلانی و بدون پیراهن، با سرعت اسکی شدید همه را با پودر برف میپوشاند" کرد. تصویر حاصل، اگرچه دارای عناصر فنی چشمگیری مانند پاشش واقعی برف و دستهای به درستی رندر شده بود (یک دام رایج برای مدلهای هوش مصنوعی قبلی)، اما از اثر "دره وهمآور"، به ویژه در اطراف صورت، رنج میبرد. کاربر آن را به عنوان یک "فتوشاپ بد" توصیف کرد که در آن سر او به طرز ناشیانهای روی بدن یک مدل تناسب اندام قرار گرفته بود و یک تصویر ناخوشایند و غیرواقعی ایجاد میکرد. این سناریو بر چالش مداوم هوش مصنوعی در دستیابی به تغییرات واقعاً یکپارچه و فوتورئالیستی از سوژههای انسانی، به ویژه هنگام ترکیب عناصر مختلف، تأکید میکند.
با وجود این اشتباهات گاه به گاه و "لبههای ناهموار" مداوم که در تجربیات عملی اولیه مشاهده شد، نانو بنانا ۲ بدون شک گام مهمی در پیگیری گوگل برای ابزارهای هوش مصنوعی فوتورئالیستی است. سرمایهگذاری مستمر این شرکت در بهبود قابلیتهای دستکاری تصویر آشکار است، حتی با برجستهتر شدن پیامدهای اخلاقی چنین فناوری قدرتمندی. گوگل خروجیهای تولید شده توسط هوش مصنوعی خود را واترمارک میکند، تلاشی قابل ستایش برای متمایز کردن محتوای مصنوعی. با این حال، با بهبود چشمگیر کیفیت این نسلها، این واترمارکهای ظریف میتوانند به راحتی توسط کاربرانی که به سرعت در فیدهای رسانههای اجتماعی پیمایش میکنند، نادیده گرفته شوند و تمایز بین تصاویر واقعی و تصاویر ساخته شده توسط هوش مصنوعی را به طور فزایندهای مبهم کنند.
Related News
دسترسی گسترده به نانو بنانا ۲، رایگان برای استفاده در اپلیکیشن Gemini و سایر خدمات گوگل، توانایی ایجاد تصاویر بسیار خاص، اما کاملاً ساختگی، را سریعتر از همیشه دموکراتیک میکند. این سهولت دسترسی با مسئولیتی حیاتی برای مصرفکنندگان محتوای دیجیتال همراه است: انجام بررسی دقیقتر بر روی تصاویر تأیید نشده که به صورت آنلاین با آنها مواجه میشوند. همانطور که ابزارهای هوش مصنوعی به تکامل خود ادامه میدهند و در ایجاد واقعیتهای قانعکننده پیچیدهتر میشوند، ضرورت سواد رسانهای و تفکر انتقادی حیاتی میشود و به عنوان یک دفاع حیاتی در برابر اطلاعات نادرست احتمالی و فرسایش اعتماد به رسانههای بصری عمل میکند.