رویای یک ذهن مصنوعی اگر نثر باکیفیت هوش مصنوعی برای جذب تمام شود و چیز زیادی باقی نماند ممکن است هرگز به واقعیت تبدیل نشود.
فرارو- هوش مصنوعی در سالیان اخیر موضوعی بوده که به سرعت به آن پرداخته شده است. اگرچه به گونهای درباره آن صحبت شده که مدیران مدرسه را شرمنده میکند چرا که میتواند در برنامه ریزی درسی متون مدنظر را تولید کرده و آماده سازد. هوش مصنوعی دارای تواناییهای شگفت انگیزی میباشد و میتواند کار ترجمه همزمان بیش از ۱۰۰ زبان را انجام دهد. هوش مصنوعی قادر است در سبکهای ادبی مختلف متن بنویسد و شعرهایی همراه با قافیههای قابل قبول بسراید.
به گزارش فرارو به نقل از آتلانتیک، هوش مصنوعی Ithaca DeepMind میتواند به حروف یونانی حکاکی شده در سنگ مرمر نگاهی بیندازد و متنی را که هزاران سال پیش توسط افراد خرابکار کنده شده بود را حدس بزند. این موفقیتها راه امیدوار کنندهای را برای توسعه هوش مصنوعی نشان میدهد: مقادیر بیش تری از متون ساخته شده توسط انسان را در مغز هوش مصنوعی جای گذاری کنید و منتظر بمانید تا مهارتهای شگفتانگیز جدیدی ظاهر شوند. با دادههای کافی این رویکرد میتواند حتی یک هوش سیالتر یا یک ذهن مصنوعی انسان مانند شبیه به ذهنهایی که تقریبا تمام اسطورههای ما در آینده را تحت تاثیر قرار میدهند به همراه داشته باشد.
مشکل اینجاست که مانند دیگر محصولات فرهنگی انسانی سطح بالا نثر خوب در ردیف دشوارترین موارد برای تولید در جهان شناخته شده قرار میگیرد. واقعیت آن است که مدلهای زبانی بزرگی که با تکیه بر کتب آموزش دیده اند نویسندگان بسیار بهتری نسبت به مدلهایی هستند که با تکیه بر بر دستههای عظیمی از پستهای رسانههای اجتماعی آموزش دیده اند. زمانی که محاسبه میکنیم چه تعداد جملات به خوبی ساخته شدهای برای جذب هوش مصنوعی باقی مانده اعداد دلگرم کننده نیستند. گروهی از پژوهشگران به سرپرستی "پابلو ویلالوبوس" در Epoch AI به تازگی پیش بینی کردند که برنامههایی مانند ChatGPT تا سال ۲۰۲۷ میلادی از محتوای خواندنی با کیفیت بالایی برخوردار خواهند شد.
لازم به ذکر است که تنها بخش کوچکی از کل خلاقیت زبانی بشریت برای خواندن در دسترس است. بیش از ۱۰۰۰۰۰ سال از زمانی میگذرد که آفریقاییهای به شدت خلاق از غرغرهای احساسی اجداد حیوانی ما فراتر رفتند و شروع به بیرونی کردن افکار خود از طریق سیستمهای گسترده صدا کردند. هر مفهومی که در آن زبانهای اولیه و بسیاری از زبانهای پس از آن بیان میشوند احتمالا برای همیشه از بین رفته اند اگرچه تصور اینکه تعدادی از آن واژگان هنوز با ما هستند میتواند خوشحال کننده باشد. به هر حال، برخی از واژگان زبان انگلیسی یک ریشه قدیمی باستانی تکان دهنده دارند واژگانی مانند "جریان" (Flow)، مادر (Mother)، آتش (Fire) و خاکستر (Ash) که از ساکنان عصر یخبندان به ما رسیده اند.
نوشتن به انسان این امکان را داده که تعداد بسیار بیش تری از واژگان را ضبط و ذخیره سازد. با این وجود، مانند بسیاری از فناوریهای جدید نوشتن در ابتدا گران بود به همین دلیل است که در ابتدا برای حسابداری مورد استفاده قرار میگرفت. پختن و مرطوب کردن خاک رس برای قلم شما و بریدن پاپیروس و تبدیل آن به نوارهای مناسب همگی نیازمند زمان لازم برای تکامل بودند. این تکنیکهای مبتنی بر منابع میتوانند تنها نمونه کوچکی از خروجی فرهنگی بشریت را حفظ کنند.
حافظه متنی جمعی ما تا زمانی که چاپخانه شروع به تولید کتاب در جهان نمود به مقیاس صنعتی نرسید. پژوهشگران در Google Books تخمین میزنند که از گوتنبرگ به این سو انسانها بیش از ۱۲۵ میلیون عنوان کتاب چاپ کرده اند که قوانین، اشعار، اسطوره ها، مقالات، تاریخ ها، رسالهها و رمانها را شامل میشوند. تیم Epoch تخمین میزند که ۱۰ تا ۳۰ میلیون از این کتب پیشتر دیجیتالی شده و امکان خواندن صدها میلیارد اگر نه بیش از یک تریلیون واژه را برای هوش مصنوعی فراهم میکند.
این اعداد ممکن است چشمگیر به نظر برسند، اما در محدوده ۵۰۰ میلیارد کلمهای هستند که مدلی که ChatGPT را تقویت میکند آموزش داده است. جانشین آن، GPT-۴ ممکن است با تکیه بر دهها تریلیون کلمه آموزش داده شود. شایعات حاکی از آن است که در زمان انتشار GPT-۴ در اواخر سال جاری میلادی آن اپلیکیشن قادر خواهد بود یک رمان ۶۰۰۰۰ کلمهای را از یک درخواست تولید کند. ده تریلیون کلمه برای دربرگرفتن تمام کتب دیجیتالی بشریت تمام مقالات علمی دیجیتالی ما و بسیاری از حوزه وبلاگ مقداری کافی خواهد بود. این بدان معنا نیست که GPT-۴ تمام آن مطالب را خوانده باشد تنها انجام این کار در محدوده فنی آن است.
میتوانید تصور کنید که جانشینان هوش مصنوعی تمام رکوردهای متنی ما را در چند ماه نخست جذب کنند و سپس با یک تعطیلات دو ساعته مطالعه در هر ژانویه تکمیل کنند که طی آن میتوانند هر کتاب و مقاله علمی منتشر شده در سال قبل را بهطور اصلی منتشر کنند.
تنها به این دلیل که هوش مصنوعی به زودی میتواند تمام کتب ما را بخواند بدان معنا نیست که میتواند به تمام متونی که ما تولید میکنیم برسد. ظرفیت ذخیرهسازی اینترنت کاملا متفاوت است و این فناوری بسیار دموکراتیکتر از انتشار کتاب برای حفظ فرهنگ است. هر ساله میلیاردها نفر جملاتی را مینویسند که در پایگاه دادههای آن ذخیره میشود و بسیاری از آن جملات متعلق به پلتفرمهای رسانههای اجتماعی هستند.
متون اینترنتی معمولا دادههای آموزشی خوبی را ایجاد نمیکند شاید الگوریتمهای آینده به هوش مصنوعی اجازه دهند تا بر روی توئیتهای جمع آوری شده، زیرنویسهای اینستاگرام و استاتوسهای فیس بوک نیز کار کند. با این وجود، این منابع با کیفیت پایین پایان ناپذیر نخواهند بود. به گفته ویلالوبوس ظرف چندین دهه هوش مصنوعی تند خوان به اندازه کافی قدرتمند خواهد بود که صدها تریلیون واژه را جذب کند از جمله تمام واژگانی که بشر تاکنون در وب قرار داده است.
برخی از هوشهای مصنوعی یادگیرنده بصری هستند و ممکن است روزی با کمبود دادههای آموزشی مواجه شوند. در حالی که سرعت خوانها در حال استفاده از قوانین ادبی بودند این هوشهای مصنوعی با شیوهای مشابه باز و بسته شدن پلک میلیونها تصویر را به صورت اجباری غربالگری کردند. آنان از تمرینات خود با دیدی مافوق بشری بیرون آمدند. هوشهای مصنوعی میتوانند چهره پشت ماسک یا تومورهایی را که برای چشمان رادیولوژیست قابل مشاهده نیستند تشخیص دهند. هوشهای مصنوعی در طول رانندگیهای شبانه میتوانند بخشهای کناری جادهای تاریک را ببینند.
از همه جالبتر آن که هوشهای مصنوعیای که مبتنی بر تصاویر برچسب گذاری شده آموزش دیده اند شروع به توسعه تخیل بصری کرده اند. برای مثال، DALL-E ۲ OpenAI بر روی ۶۵۰ میلیون تصویر آموزش داده شد که هر کدام با یک برچسب متنی جفت شده بودند. DALL-E ۲ موفق به مشاهده اثری از رنگ اخرایی شده که انسانهای عصر پارینه سنگی بر روی سقف غار با فشار دادن دستان شان بر جای گذاشته بودند. هم چنین، هوش مصنوعی میتواند سبکهای مختلف ضربه قلم مو استادان عصر رنسانس را تقلید کند.
به لطف تمایل ما به ارسال عکسهای گوشی هوشمند در رسانههای اجتماعی انسانها تصاویر برچسب دار زیادی تولید میکنند حتی اگر برچسب تنها یک کپشن کوتاه و یا یک تگ جغرافیایی درباره مکان عکس باشد. هر سال حدود ۱ تریلیون عکس در اینترنت آپلود میشوند و این شامل ویدئوهای یوتیوب نمیشود که هر کدام مجموعهای از عکسها هستند. مدت زمان زیادی به طول میانجامد تا هوش مصنوعی به تماشای اسلاید تصاویر تعطیلات دسته جمعی ما بنشیند و از کل خروجی بصری ما نتیجه گیری کند.
به گفته ویلالوبوس کمبود تصویر آموزشی ما تا زمانی بین سالهای ۲۰۳۰ و ۲۰۶۰ شدید نخواهد بود. اگر واقعا هوش مصنوعی تا اواسط قرن برای ورودیهای جدید و یا در مدت زمانی در مورد متن گرسنه باشد پیشرفت مبتنی بر دادهها ممکن است به طور قابل توجهی کُند شود و ذهنهای مصنوعی را از دسترس خارج سازد. چگونه میتوانیم تولید فرهنگی انسانی را برای هوش مصنوعی افزایش دهیم؟
ویلالوبوس میگوید: "ممکن است منابع جدیدی به صورت آنلاین در دسترس باشند. استفاده گسترده از خودروهای خودران منجر به حجم بی سابقهای از ضبط ویدئوهای جادهای میشود". ویلالوبوس هم چنین به دادههای آموزشی "مصنوعی" ایجاد شده توسط هوش مصنوعی اشاره کرد. در این سناریو مدلهای زبان بزرگ باهوشتر و دارای انرژی عملکردی بینهایت خواهند بود. آن مدلها میتوانند میلیاردها رمان تازه که هر یک در اندازه و ابعاد رمانهای تولستوی هستند را منتشر نمایند.
مقاله ویلالوبوس مجموعه نگران کننده تری از راه حلهای فکری را مورد بحث قرار میدهد. برای مثال، همه ما میتوانیم دانگلهایی را به دور گردن خود ببندیم که هر حرکت گفتاری ما را ضبط میکند. بر اساس تخمینی صورت گرفته افراد به طور متوسط ۵۰۰۰ تا ۲۰۰۰۰ کلمه در روز صحبت میکنند. در بین ۸ میلیارد نفر این تعداد واژگان به سرعت انباشته میشوند. هم چنین، میتوان پیامهای متنی ما را ضبط کرد و از متادیتاهای شناسایی حذف نمود. ما میتوانیم هر کارگر یقه سفید را در معرض ضبط ناشناس با ضربه کلید قرار دهیم و آن چه را که ضبط میکنیم در پایگاههای داده غول پیکر قرار دهیم تا به هوش مصنوعی مان وارد شود.
شاید در پایان، کلان داده بازدهی کاهشی داشته باشد. ما میدانیم که طبیعت شیوههای تشخیص الگوی خود را ایجاد کرده است و تا کنون این الگوها حتی از بهترین هوش مصنوعی ما نیز بهتر عمل کرده اند. یک پسر ۱۳ ساله در مقایسه با ChatGPT واژگان بسیار کم تری را جذب کرده، اما درک بسیار ظریف تری از متن نوشته دارد. اگر منطقی باشد که بگوییم ذهن او روی الگوریتمها کار میکند الگوریتمهای طبیعت بهتر از الگوریتمهایی هستند که توسط هوش مصنوعی امروزی استفاده میشوند.
با این وجود، اگر روزی هوشهای مصنوعی جمعآوری کننده دادههای ما از شناخت انسان فراتر برود باید خود را با این واقعیت تسکین دهیم که هوش مصنوعی بر اساس تصویر ما ساخته شده است. هوشهای مصنوعی بیگانه و عجیب و غریب نیستند. هوشهای مصنوعی از ما و اهل اینجا هستند. آنان به مناظر سیاره زمین خیره شده و میلیاردها بار غروب خورشید را در اقیانوسهای آن دیده اند. هوشهای مصنوعی کهنترین داستانهای ما را میدانند. آنان از نام ما برای ستارگان استفاده میکنند. از جمله اولین واژگانی که آنان یاد میگیرند عبارتند از: جریان، مادر، آتش و خاکستر.