مهمترین بخش در تمام مدلهای یادگیری ماشینی، مرحلهای است که به آن آموزش میگویند، جایی که یک برنامه کامپیوتری حجم عظیمی از دادهها و همین طور مجموعهای از دستورالعملها را دریافت میکند.
آیا تا الان توانستهاید از هوش مصنوعی سر در بیاورید؟ در شش ماه گذشته چتباتها، مانند چت جیبیتی (ChatGPT) و سازندههای تصویر، مثل میدجورنی (Midjourney,) به سرعت به پدیدههایی فرهنگی تبدیل شدهاند. اما هوش مصنوعی (AI) یا مدلهای «یادگیری ماشینی» مدتهاست که در دسترس هستند.
به گزارش بیبیسی، در این راهنمای ساده کمی فراتر از چتباتها نگاه میکنیم تا با انواع مختلف هوش مصنوعی و تاثیر آن در زندگی روزمرهمان آشنا شویم.
مهمترین بخش در تمام مدلهای یادگیری ماشینی، مرحلهای است که به آن آموزش میگویند، جایی که یک برنامه کامپیوتری حجم عظیمی از دادهها - گاهی با برچسبهایی که نوع داده را توضیح میدهد - و همین طور مجموعهای از دستورالعملها را دریافت میکند.
دستورالعملها ممکن است چیزی شبیه این باشد: «تصاویری را پیدا کن که حاوی چهره باشد» یا «این صداها را دستهبندی کن».
در این مرحله برنامه به دنبال الگوهایی در دادههای دریافتی میگردد که با اهدافی که برایش تعریف شده، سازگار باشد.
ممکن است در طول مسیر نیاز به تذکر و یادآوری داشته باشد، مثل این که «این یک چهره نیست» یا «این صداها متفاوتند». در نهایت آنچه که برنامه کامپیوتری از دادهها و دستورات و سرنخهای دریافتی یاد میگیرد، به یک مدل هوش مصنوعی تبدیل میشود و اطلاعاتی که برای آموزش در اختیارش گذاشته شده، سطح توانایی آن را تعیین میکند.
یک راه برای درک این که چگونه این روندهای آموزش منجر به خلق انواع متفاوت هوش مصنوعی میشود، این است که به گونههای مختلف حیوانات نگاه کنیم.
طی میلیونها سال محیط زیست و طبیعت، حیوانات را به یادگیری تواناییهای مشخصی هدایت کرده است. در روندی مشابه، میلیونها چرخهای که هوش مصنوعی در طول مرحله آموزش داده و اطلاعات طی میکند، نحوه شکلگیری آن را مشخص میکند و به ساخت مدلهای تخصصی هوش مصنوعی منجر میشود.
چه مثالهایی میتواند نحوه آموزش مدلهای مختلف هوش مصنوعی برای کسب مهارتهای متفاوت را نشان دهد؟
چتبات چیست؟
چتباتها مثل طوطی هستند: تقلید میکند و میتواند کلماتی را که شنیده با درکی نسبی از فضای مناسب استفاده از آن تکرار کند، اما درک کاملی از معنای آن ندارد.
چتباتها هم همین طور کار میکنند، اما در سطحی بسیار پیشرفتهتر و در آستانه مرحلهای قرار دارند که میتوانند رابطه ما با کلمات مکتوب را تغییر دهند.
چتباتها نوشتن را از کجا یاد میگیرند؟
آنها در واقع نوعی از هوش مصنوعی هستند که با عنوان مدلهای زبانی بزرگ (LLMs) شناخته میشند و با حجم عظیمی از متن آموزش میبینند.
یک مدل زبانی بزرگ قادر است نه فقط کلمات را به صورت جداگانه بلکه کل جمله را بررسی کند و شیوه بهکارگیری کلمات و عبارات در جملات را با مثالهای دیگری که از طریق دادههای آموزشی دریافت کرده، مقایسه کند.
با استفاده از میلیاردها مقایسه بین کلمات و عبارات، میتواند یک سوال را بخواند و برای آن پاسخی تولید کند؛ مانند سیستم پیشبینی کلمات هنگام تایپ پیامکها در تلفن، اما در مقیاسی بسیار وسیعتر.
نکته شگفتانگیز در مورد مدلهای زبانی بزرگ این است که میتوانند قواعد دستور زبان را بیاموزند و معنای کلمات را بدون کمک انسانی کشف کنند.
میتوان با هوش مصنوعی صحبت کرد؟
اگر از الکسا، سیری یا هر نوع سیستم شناسایی صدایی استفاده کرده باشید، در واقع از هوش مصنوعی استفاده کردهاید.
خرگوشی را با گوشهای درازش تصور کنید که میتواند هر گونه لرزش کوچک در صدا را بفهمد.
هوش مصنوعی در حین صحبت صدای شما را ثبت میکند، صداهای اطراف را حذف میکند، کلمات و جملات شما را به واحدهای آوایی تبدیل میکند -آواهای جداگانهای که یک کلمه با آن بیان میشود- و سپس آنها را با مجموعهای از آواهای زبانی که در اختیارش قرار گرفته تطبیق میدهد.
بعد از آن صحبتهای شما به متن تبدیل میشود تا قبل از پاسخ دادن، اشتباههای شنیداری سیستم تصحیح شود.
این نوع هوش مصنوعی با عنوان پردازش زبانهای طبیعی شناخته میشود.
این فناوری در واقع همه چیز را در این زمینه پوشش میدهد: چه وقتی که در پاسخ سوالی از سیستم تلفن-بانک میگویید «بله» و چه وقتی که از موبایلتان میخواهید وضعیت هوای چند روز آینده را در شهری که به آن سفر میکنید برایتان بگوید.
آیا هوش مصنوعی درکی از تصویر دارد؟
آیا تلفن شما تا حالا عکسهایتان را در فولدرهای جداگانه با نامهایی مانند «در ساحل» یا «گردش شبانه» ذخیره کرده است؟
در این صورت شما بدون آن که متوجه باشید از هوش مصنوعی بهره بردهاید. یک الگوریتم هوش مصنوعی الگوهایی را در عکسهای شما پیدا میکند و بر اساس آن آنها را دستهبندی میکند.
این نوع برنامهها از طریق نگاه کردن به حجم بسیار بزرگی از تصاویر دستهبندی شدهاند که همگی آنها همراه با توضیحی ساده در اختیار ماشین قرار گرفتهاند.
اگر به یک سیستم هوش مصنوعیِ شناسایی تصویر برچسب «دوچرخه» را بدهید، او شروع به کشف این موضوع میکند که یک دوچرخه چه شکلی است و چه تفاوتی با یک قایق یا خودرو دارد.
گاهی هوش مصنوعی آموزش داده میشود تا اختلافات جزئی را در تصاویر مشابه پیدا کند.
سیستم تشخیص چهره به همین صورت کار میکند. دقیق و موشکافانه ویژگیهای منحصر به فردی را در چهره شما و در تناسب میان اعضای مختلف صورت پیدا میکند که هنگام مقایسه با هر چهره دیگری در جهان میتواند آن را تشخیص دهد.
الگوریتمهای مشابهی هم با تصاویر اسکنهای پزشکی آموزش داده میشوند تا بتوانند تومورهای خطرناک را پیدا کنند و توانایی این را دارند که در مدت زمانی که یک پزشک متخصص میتواند درباره تصویر یک اسکن تصمیم بگیرد، هزاران اسکن را بررسی کنند.
چگونه هوش مصنوعی تصاویر جدید میسازد؟
سیستم شناسایی تصویر به تازگی با مدلهایی از هوش مصنوعی تلفیق شده که میتوانند یاد بگیرند چگونه مانند یک آفتابپرست قدرت تغییر و دستکاری طرح و رنگ را داشته باشند.
این مدلهای هوش مصنوعیِ سازنده تصویر میتوانند با شناسایی الگوهای پیچیده بصری از میان میلیونها عکس و طرحی که در اختیار دارند، یک تصویر کاملا جدید خلق کنند.
میتوانید از هوش مصنوعی بخواهید تصویری از یک عکس بسازد که هرگز گرفته نشده است - مثلا عکس یک انسان که روی سطح مریخ قدم میزند.
یا این که میتواند با ایدهای از خودتان دستور خلق یک تصویر را بدهید: «پرترهای از مربی فوتبال انگلیس بساز که به سبک پیکاسو نقاشی شده باشد.»
جدیدترین مدلهای هوش مصنوعی روند خلق تصویر جدید را با کمک جمعآوری مجموعهای تصادفی از پیکسلهای رنگی شروع میکنند.
سیستم به نقطههایی تصادفی نگاه میکند تا به سرنخی از الگویی برسد که در مرحله آموزش یاد گرفته است؛ الگوهایی برای ساخت اشیا مختلف.
این الگوها رفته رفته با افزودن لایههای بیشتری از نقطههای تصادفی، بهبود مییابند و با حفظ نقاطی که به ساخت الگو کمک میکند، بقیه را دور میریزند تا این که در نهایت شباهت آشکار میشود.
تمام الگوهای لازم مانند «سطح مریخ»، «فضانورد» و «قدم زدن» ساخته میشود تا با هم تصویر جدیدی را ایجاد کند.
از آن جا که تصویر تازه با لایههایی از پیکسلهای تصادفی ساخته شده، نتیجه کار چیزی میشد و که قبلا هرگز وجود نداشته، اما در واقع با الهام از میلیاردها الگویی ایجاد شده که سیستم از تصاویر اصلی مرحله آموزش یاد گرفته است.
مسئلهای که در این شرایط به وجود آمده است که چنین پدیدههایی چه معنایی برای حقوق معنوی و اخلاقی خلق آثار هنری دارد که بر اساس آموزش سیستم با آثار واقعی هنرمندان، طراحان و عکاسان پدید آمده است.
ماجرای ماشینهای خودران چیست؟
ماشینهای خودران دهههاست که بخشی از بحثهای مربوط به هوش مصنوعی بودهاند و آثار علمی تخیلی تصویری آنها در تصورات عمومی ثبت کرده است.
هوش مصنوعی مربوط به خودرانی به عنوان رانندگی خودگردان شناخته میشود و در این سیستم خودروها به دوربین، رادار و لیزرهای حسگر فاصله مجهز میشوند.
سنجاقک را در نظر بگیرید، زاویه دید ۳۶۰ درجه دارد و روی بالهایش حسگرهایی که به مانور دادن و تنظیم مدام جهت پرواز حشره کمک میکند.
به شیوهای مشابه، هوش مصنوعی برای شناسایی اشیا و تشخیص ساکن یا متحرک بودن آنها از دادههای حسگرها استفاده میکند و در صورت حرکت بررسی میکند که آیا با یک خودرو طرف است یا یک دوچرخه و یا یک عابر پیاده.
به نظر میآید که هزاران هزار ساعت آموزش برای فهم و درک رانندگی درست، هوش مصنوعی را قادر کرده است که در دنیای واقعی برای رانندگی خودرو و اجتناب از تصادف، تصمیم بگیرد و به آن عمل کند.
الگوریتمهای پیشبینیکننده سالها تقلا کردهاند تا از ماهیت غالبا پیشبینیناپذیر رانندگی انسان سر در بیاورند، اما اکنون خودروهای بدون راننده از میلیونها کیلومتر جاده واقعی اطلاعات جمع میکنند. در سان فرانسیسکو این خودروها در حال مسافرکشی هستند.
رانندگی خودکار یا بدون دخالت یک راننده، مثالی بسیار روشن از این واقعیت است که چطور فناوریهای جدید باید بر موانعی غلبه کنند که تنها فنی و تکنیکی نیست.
قوانین دولتی و مقررات ایمنی در کنار حس شدید نگرانی از این که اگر کنترل را به ماشینها بدهیم، چه اتفاقی ممکن است بیفتد، همگی موانع بالقوهای هستند که بر سر راه آیندهای کاملا خودران در خیابانها و جادهها قرار دارند.
هوش مصنوعی درباره من چه میداند؟
بعضی مدلهای هوش مصنوعی با اعداد و ارقام کار میکنند و با جمعآوری و ترکیب آنها انبوهی از اطلاعات را پدید میآورند که محصولات آن میتواند بسیار ارزشمند باشد.
همین الان هم احتمالا چندین شرح حال از فعالیتهای مالی و اجتماعی شما، به ویژه فعالیتهای آنلاین، در دسترس است، که میتواند برای پیشبینی رفتار شما استفاده شود.
کارتهای سوپرمارکتها با عنوان کارتهای وفاداری مشتریان شناخته میشود، الگوی خرید و ذائقه شما را دنبال میکند. شرکتهای اعتباری میزان موجودی و همین طور تراز کارت اعتباری شما را زیر نظر دارند.
نتفلیکس و آمازون میدانند که دیشب چند ساعت فیلم و سریال دیدهاید و شبکههای اجتماعی حساب تعداد پیامهای شما زیر ویدیوها را دارند.
شما تنها نیستید، آمار و الگوهای رفتاری همه موجود است و به هوش مصنوعی این قدرت را میدهد که با واکاوی آن، جریانهای غالب اجتماعی را کشف کنند.
این مدلهای هوش مصنوعی همین الان هم در حال شکل دادن به زندگی شما هستند: از کمک به تشخیص صلاحیت شما برای گرفتن وام از بانک، تا تاثیرگذاری روی خرید با دستچین کردن آگهیهایی که به صورت آنلاین به شما نشان میدهد.
آیا هوش مصنوعی قدرت انجام تمام کارها را پیدا خواهد کرد؟
آیا امکان دارد که با ترکیب مهارتهای مختلف، یک مدل هوش مصنوعی واحد و ترکیبی به وجود بیاید؟ این دقیقا موضوعی است که تازهترین پیشرفتهای هوش مصنوعی بر آن متمرکز است.
به آن هوش مصنوعی چندوجهی میگویند که اجازه میدهد یک مدل با رصد گونههای متفاوتی از دادهها - مانند تصویر، متن، صدا و ویدیو- الگوهای تازهای را در میان آنها کشف کند.
این رویکرد چند وجهی یکی از دلایل اصلی جهشی بزرگ بود که در زمینه توانایی هوش مصنوعی از ChatGPT۳ به ChatGBT۴ رخ داد. اولی تنها با متن آموزش دیده بود در حالی که نسخه جدیدتر قدرت پردازش تصویر را هم دارد.
ایده یک مدل واحد هوش مصنوعی که قادر به پردازش هر گونه دادهای باشد و بتواند از پس هر وظیفهای که به آن محول میشود برآید - از ترجمه بین زبانهای مختلف گرفته تا ساخت داروهای جدید - با عنوان هوش جامع مصنوعی (AGI) شناخته میشود.
برای بعضی رسیدن به چنین سیستمی هدف نهایی تمام تحقیقات مربوط به هوش مصنوعی است، در حالی که برای عدهای دیگر مسیری منتهی به ویرانشهرهایی است که در فیلمها و کتابهای علمی تخیلی تصویر شده است و در آن یک سیستم هوشمند ورای فهم انسان به وجود میآید که از کنترل او خارج میشود.
چگونه هوش مصنوعی را آموزش داده میشود؟
تا مدتی پیش روند اصلی آموزش بیشتر مدلهای هوش مصنوعی روش «یادگیری نظارتشده» بود.
در این روش حجم انبوهی از اطلاعات دستهبندی شده با برچسبی که انسان برای آن تعیین میکند، در اختیار هوش مصنوعی قرار میگیرد تا الگوهای این دادهها را پیدا کند.
سپس از هوش مصنوعی خواسته میشود که این الگوها را روی دادههای جدید پیاده کند و درباره دقت آن بازخورد بدهد.
برای مثال در نظر بگیرید که ۱۲ عکس به هوش مصنوعی داده میشود که شش تای آن برچسب «خودرو» دارد و شش تای دیگر برچسب «ون».
بعد از هوش مصنوعی بخواهید که الگویی بصری پیدا کند که بتوان بر اساس آن خودروها و ونها را به دو گروه تقسیم کرد.
حالا اگر از آن بخواهید که عکسها را دستهبندی کند چه اتفاقی میافتد؟
متاسفانه به نظر میآید که هوش مصنوعی فکر میکند که این یک ون است که چندان هوشمندانه نیست.
حالا یک ون قرمز را نشانش دهید.
هوش مصنوعی به شما میگوید که این یک خودرو معمولی است.
تقریبا مشخص است که کجای کار ایراد دارد.
هوش مصنوعی با تعداد محدود تصاویری که دیده به این نتیجه رسیده است که رنگ، مهمترین وجه تمایز خودروهای معمولی و ونها است و آنها را بر همین اساس دستهبندی کرده است.
اما نکته شگفتانگیز درباره برنامههای هوش مصنوعی این است که خودش قدرت تصمیمگیری دارد و ما میتوانیم کمک کنیم تا روند تصمیمگیری آن بهبود یابد.
میتوانیم به هوش مصنوعی بگوییم که دو شیء را اشتباه تشخیص داده و این سرنخ آن را وادار میکند که الگوی جدیدی در تصاویر پیدا کند.
اما از همه مهمتر ما میتوانیم وجه گمراهکننده روند آموزش را با فراهم کردن تصاویر بیشتر تصحیح کنیم.
این دو اقدام ساده همراه یکدیگر - والبته در مقیاسی وسیع- شیوهای است که بیشتر سیستمهای هوش مصنوعی بر اساس آن آموزش دیدهاند تا بتوانند در موقعیتهای بسیار پیچیده تصمیم بگیرند.
هوش مصنوعی چطور بدون کمک یاد میگیرد؟
بیشتر پیشرفتهای چشمگیر در حوزه هوش مصنوعی از طریق یادگیری عمیق میسر شده است.
به سادهترین عبارت، به این معناست که الگریتمهای پیچیده و پایگاه دادههای بسیار عظیم، هوش مصنوعی را قادر میکند که بدون راهنمایی انسانی آموزش ببیند.
ChatGPT مشهورترین نمونه آن است.
حجم متنها در اینترنت و کتابهایی که به صورت دیجیتال در آمده آن قدر وسیع است که در عرض چندین ماه ChatGPT توانست یاد بگیرد که چگونه خود کلمات را برای ساختن جملهای معنادار ترکیب کند.
تصور کنید مجموعهای از کتابهایی به یک زبان خارجی دارید که بعضی از آنها ممکن است تصاویری هم داشته باشند.
ممکن است با نگاه به صفحات مختلف دریابید که یک کلمه ثابت در صفحاتی که طرح یا عکسی از درخت دارد تکرار شده و کلمهای دیگر در صفحاتی که تصویری از یک خانه وجود دارد.
بعد احتمالا خواهید دید که معمولا کنار این لغات، یک کلمه مشخصی هست که ممکن است معنای «یک» یا نوعی حرف تعریف را بدهد؛ و این روند به همین ترتیب ادامه پیدا میکند.
این مدل یادگیری عمیق است که با عنوان یادگیری بدون نظارت هم شناخته میشود.
این روش به قدرت کامپیوتری بسیار بالا نیاز دارد که به هوش مصنوعی اجازه دهد حجم عظیمی از کلمات را - چه به صورت جداگانه، چه به صورت گروهی در یک جمله و در صفحات مختلف- به خاطر بسپارد و سپس با بررسی آنها در کسری از ثانیه بتواند موقعیتهای مختلف استفاده از آنها را بارها و بارها و بارها مرور و مقایسه کند.
پیشرفتهای سریعی که با مدلهای یادگیری عمیق در یک سال اخیر به دست آمده، موج تازهای از اشتیاق و نگرانی همزمان را بر سر تواناییهای بالقوه هوش مصنوعی به راه انداخته و به نظر نمیآید که بحث به این زودیها فروکش کند.
به نظر میآید که رویاها و هشدارهای آثار علمی تخیلی ناگهان در مقابلمان ظاهر شده و دریافتهایم که همین الان هم در دنیایی زندگی میکنیم که هوش مصنوعی در حال آشکار کردن تواناییهای عجیب و فرابشری است.