برای توضیح این عبارت ابتدا باید دانست که چت جیپیتی در اصل یک برنامه کامپیوتری مبتنی بر هوش مصنوعی است که مکالمات متنی تولید میکند. در واقع هر سوالی از آن بپرسید، چت جیپیتی بسیار طبیعی و همچون یک انسان برایتان یک متن آماده میکند و تحویل میدهد.
یورونیوز نوشت: این روزها بعید است کسی اینترنتگردی کند و این طرف و آن طرف چشمش به «چت جیپیتی» و زلزلهای که به راه انداخته نیفتد. این پدیده در نام خود اشارهای مختصر به فناوری پیشرفتهای دارد که پیش از این برای عموم چندان شناختهشده نبود.
علیرغم این محبوبیت، اما شاید تعداد قابل توجهی از مردم نتوانند به شما بگویند که جیپیتی در «چت جیپیتی» چه چیزی را نشان میدهد. این کلمه در واقع مخفف «ترانسفورمر تولیدگر از پیش آموزش دیده» (Generative Pre-trained Transformer) است.
برای توضیح این عبارت ابتدا باید دانست که چت جیپیتی در اصل یک برنامه کامپیوتری مبتنی بر هوش مصنوعی است که مکالمات متنی تولید میکند. در واقع هر سوالی از آن بپرسید، چت جیپیتی بسیار طبیعی و همچون یک انسان برایتان یک متن آماده میکند و تحویل میدهد.
از نظر فنیتر، اما اگر بخواهیم بگوییم، این ابزار مبتنی بر یک «مدل زبان» است. به این معنی که از مقادیر باورنکردنی از دادههای متنی (نظیر کتابها، مقالات خبری و صفحات وب) تغذیه میکند و از آنها نحوه جملهسازی را میآموزد. وقتی یاد گرفت، آن وقت میتواند همان اطلاعات را دستهبندی کرده و به شما برگرداند (اگر سوال مرتبط بپرسید).
حالا میتوانیم به همان اصطلاح اولیه برگردیم و برای دریافت مفهمومش حتی میتوانیم از خود چت چیپیتی هم سوال بپرسیم. در اصل «ترانسفورمر تولیدگر از پیش آموزشدیده» اصطلاحی است که ویژگیهای کلیدی معماری مدل زبان را توصیف میکند و اگر آن را بشکنیم میتوانیم بهتر مفهومش را درک کنیم:
۱. تولیدگر: در مبحث پردازش زبان طبیعی، تولیدگر به این معنی است که مدل قادر به تولید متن جدیدی است که شبیه به زبان انسان باشد. این متن جدید میتواند شامل جملهها، پاراگرافها و یا عبارتهای طولانیتر منسجم و مناسب باشد.
۲. از پیش آموزشدیده: این عبارت به مرحله اولیه آموزشدهی مدل زبانی اشاره دارد. در طول این پروسه، مدل زبانی با استفاده از مجموعه بزرگی از متون اینترنتی یا منابع دیگری که در اختیار دارد یاد میگیرد کلمه بعدی در یک جمله را بر اساس کلمات قبلی پیشبینی کند. این فرآیند مدل را قادر میسازد تصویرسازی درستی از الگوهای آماری و روابط موجود بین دادهها داشته باشد.
۳. ترانسفورمر: این کلمه اشاره به نوع خاصی از معماری یادگیری عمیق دارد. این معماری با استفاده از سازوکارهایی که از آن برخوردار است مدل را قادر میسازد تا به هنگام تولید خروجی، اهمیت کلمات مختلف در ورودی را بسنجد و در نظر بگیرد. ترانسفورمرها به دلیل تواناییشان در مدیریت داده و و قابلیت موازیسازیشان در پردازش زبان طبیعی محبوب شدهاند.
در حال حاضر چت جیپیتی و شرکت سازندهاش اوپن ایآی شناختهشدهترین نامهای حوزه «ترانسفورمر از پیش آموزشدیده» هستند، با این حال شرکتهای متعددی وجود دارند که وارد گردونه رقابت با آن شدهاند.
انتظار میرود در سالهای آینده شرکتهای تخصصی بیشتری در این زمینه فعال شوند، چرا که به اعتقاد بسیاری این حوزه فناوری آینده را تشکیل میدهد.