تصاویری که DALL-E ۲ میسازد بسیار جالبتر از متنهایی هستند که چت باتهای مبتنی بر هوش مصنوعی میسازند.
فرارو- دامنه و سهولت اختراع تصویری ارائه شده توسط هوش مصنوعی شگفت انگیز است. با این وجود، پرسش این است که آیا ورود آن صرفا تفریحی میباشد یا در واقع یک انقلاب است. آیا مانند اختراع لامپ چراغ برق است یا مانند ظهور چراغ گدازهای؟
به گزارش فرارو به نقل از نیویورکر، تلاقی ماشینهای جدید با انواع جدید تصاویر سابقه طولانی دارد. پیشتر نوعی دوربین لوسیدا با آینههای بازتابنده و منشورهای شکستی ماشینی برای ترسیم جهان لقب گرفته بود و موضوعی را بازتاب میداد به گونهای که به نظر میرسید بر روی کاغذ تکه تکه شده و شما به راحتی میتوانید آن را ردیابی کنید. بدیهی است که وظیفه تصویرسازی برش دادن و تنظیم یک نقاشی با الگوی نور است و به خودی خود کاری دشوار بود که هنرمندان را برای قرنها به خود مشغول کرده بود.
این که آیا ماشینهای واقعی مانند آن نقش مهمی در هنر ورمیر یا رامبراند داشتند یا خیر یک پرسش لاینحل است. با این وجود، سیستمهایی مانند DALL-E ۲ در نور و سایه کار نمیکنند. این سیستمها بر اساس تاریخ هنر عمل میکنند. این سیستمها براساس مخزن تقریبا بی انتهایی از تصاویری که بر اساس آن آموزش دیده اند کار میکنند. قدرت تصاویر کمتر در استدلال آن سیستمها نهفته است تا در ابهامات آن. به همین خاطر است که تصاویری که DALL-E ۲ میسازد بسیار جالبتر از متنهایی هستند که چت باتهای مبتنی بر هوش مصنوعی میسازند.
برای متقاعد شدنتان باید گفت یک متن به یک نکته نیاز دارد. در مقابل، با نگاه کردن به تصاویر میتوان مجذوب فضاها و عدم قطعیتها شد. حتی تصاویری که برای متقاعد کردن ساخته میشوند مانند پوسترهای پروپاگاندا تیز با دانش بیرونی ما از روایتها ارتباط برقرار میکنند. زمانی که داستان را ندانید تصاویر نیز مبهم میشوند.
در "شام آخر" لئوناردو داوینچی زبان آشفته دستها معنایی ندارد چه کسی به چه چیزی اشاره میکند و چرا؟ مگر آن که ما از پیش از داستان مطلع باشیم. همین امر در مورد گلدانهای آتنی نیز صدق میکند. این ضعف تصاویر بهعنوان زبان ارتباط نیست بلکه یک نقطه قوت است و ما مجموعهای از کلمات را ایجاد کرده ایم که قدرت عجیب شان را در طلسم کردن بدون اشاره به نکته بیان میکنند. ما در مورد تصاویر متقاعد کننده صحبت نمیکنیم بلکه از تصاویری میگوییم که دلهره آور، جذاب و فراموش نشدنی هستند.
مطمئنا این موضوع نشان میدهد که چرا تصاویر خلق شده توسط هوش مصنوعی در حال حاضر متقاعد کنندهتر از نثر خلق شده توسط هوش مصنوعی هستند. از DALL-E ۲ خواسته شد تا نقاشی آبرنگی از یکی از خیابانهای پاریس به سبک "چارلز دموت" نقاش امریکایی معاصر خلق کند. نتیجه جالب توجه بود کسی که نمونه کارهای دموت را میشناسد تفاوت چندانی بین دو اثر خلق شده توسط هنرمند و هوش مصنوعی احساس نمیکند.
سیستم DALL-E ۲ با آزاد کردن تصاویر از مقاصد منظم و استدلالی و تقلیل آن به پاسخهایی سریع به ما یادآوری میکند که تصاویر در دنیایی متفاوت از معنای نثر وجود دارند. به طور مشابه از چت جی پی تی میخواهیم یک ترانه به سبک بیتلز درباره "رنه ماگریت" (نقاش بلژیکی صاحب سبک و پیشتاز در عرصه سورئالیسم) بنویسد، اما آن چه تولید میکند در سبک بیتلز نیست. نتیجه این بود:"رنه ماگریت، اوه نمیتوانی ببینی؟ هنر تو مانند یک راز است با سیب و پیپ و پرندهای در قفس تو ما را به عصر دیگری میآوری".
یکی از کارهایی که ماشینهای فکر به طور سنتی انجام میدهند تیز کردن افکار ما در مورد تفکر خودمان است. برنامههای شطرنج نقش خاص حافظه را در شطرنج جدا میکنند. سیستمهای آموزش دیده هنر مانند Mid journey و DALL-E ۲ به نوبه خود ممکن است به ما کمک کنند تا با وضوح بیش تری به هنرمان نگاه کنیم.
برای مثال، ما معمولا در مورد سبک هنری به عنوان یک کارکرد یا ویژگی جدا از موضوعات هنری صحبت میکنیم: سبک امپرسیونیستی راهی برای نقاشی است و اشیایی که به آن متصل میشوند از جمله بلوارهای پاریس تنها نمونههایی از آن چه سبک میتواند روی آن عمل کند میباشند. برای یک ماشین هنرسازی سبک از موضوعی که معمولا بر آن نظارت میکند جداییناپذیر است.
باز هم باید پرسید آیا هوش مصنوعی لامپ چراغ برق است یا مانند ظهور چراغ گدازهای؟ مطمئنا در حال حاضر یک لامپ گدازه است یک انحراف از لحظه. اما در مورد این ایده که هنر همیشه باید بیشتر از نور الکتریکی باشد باید چیزی گفت. به هر حال لامپ یک نمونه عالی از فناوری تقلیدی است یک شمع مکانیزه. لامپ گدازه ترکیبی از چیزهایی است که تا به حال دیده نشده است.