ترنج موبایل
کد خبر: ۸۸۶۶۵۲

هوش مصنوعی با مربی تازه‌ وارد می‌شود

هوش مصنوعی با مربی تازه‌ وارد می‌شود

با توجه به ایراداتی که هوش مصنوعی تا به این لحظه در پاسخ به سوال‌های چالش برانگیز داشته است، محققان موسسه فناوری ماساچوست، تمهیداتی اندیشیده‌اند تا این مشکلات را مرتفع کنند.

تبلیغات
تبلیغات

در حالی‌ که مدل‌های زبانی چندوجهی هوش مصنوعی مانند GPT-4 محصول کمپانی «اپن ای آی» در درک متون پیچیده و پاسخ به سؤالات مفهومی بسیار توانمند هستند، اما این مدل‌ها گاه در پاسخ به ساده‌ترین مسائل ریاضی مانند مقایسه اعداد، دچار اشتباه می‌شوند. دلیل اصلی هم تکیه بیش از حد این مدل به استدلال متنی است. برای رفع این مشکل، محققان مؤسسه فناوری ماساچوست (MIT) یک دستیار هوشمند با نام CodeSteer طراحی کرده‌اند که می‌تواند در نقش یک مربی برای مدل‌های زبانی بزرگ (LLMs) نقش‌آفرینی کند و به آنها آموزش دهد که برای حل مسائل پیچیده که نیاز به تفکر بیشتری دارد، چه زمانی باید از متن‌نویسی و چه زمانی از کدنویسی استفاده کنند.

مربیان انسانی الهام‌بخش

به گزارش روزنامه ایران، CodeSteer با الهام از نقش مربی در ورزش و شکل انسانی طراحی شده است. همان‌طور که ممکن است یک مربی از نظر جثه از ورزشکار ضعیف‌تر باشد، اما می‌تواند با پیشنهادهای دقیق، عملکرد ورزشکار خود را بهبود ‌بخشد، این دستیار هوشمند نیز می‌تواند مدل‌های قدرتمند زبانی را به مسیر صحیح راهنمایی کند.
«چوچو فن»، استادیار رشته هوانوردی و فضانوردی در MIT و پژوهشگر اصلی این پروژه می‌گوید: « به‌جای توسعه بی‌وقفه مدل‌هایی که همه‌ کارها را به‌تنهایی انجام می‌دهند، ما یک راه مکمل را برای بهبود توانمندی مدل‌های هوش مصنوعی انتخاب کرده‌ایم. این دستیار هوشمند، در واقع یک مدل زبانی کوچک و سبک‌تر است که در کنار مدل‌های بزرگ عمل می‌کند و پس از بررسی سؤال ورودی، تشخیص می‌دهد که بهتر است پاسخ‌گویی از طریق متن یا کدنویسی باشد. سپس با یک دستور خاص (prompt)، مدل بزرگ زبانی را به سمت روش مناسب هدایت می‌کند.

مدل بزرگ زبانی پس از اجرای دستور، پاسخ را تولید کرده و به این دستیار هوشمند بازمی‌گرداند. اگر پاسخ صحیح نباشد، CodeSteer مرحله به مرحله، راهنمایی جدید ارائه می‌دهد. به عنوان مثال پیشنهاد می‌کند که از الگوریتم جست‌وجو یا محدودیت‌های خاص در کدنویسی استفاده شود. این کار تا زمانی که جواب نهایی درست از آب درآید، ادامه می‌یابد. به اعتقاد این استادیار، مدل‌های بزرگ معمولاً تمایل دارند از کوتاه‌ترین و ساده‌ترین مسیر به جواب برسند که گاه منجر به خطا می‌شود و عملاً CodeSteer برای جلوگیری از این نوع تنبلی طراحی شده است.»

افزایش دقت عملکرد  از ریاضی تا سودوکو

پژوهشگران برای آموزش و ارزیابی CodeSteer، سؤالاتی پیچیده در زمینه استدلال‌های فضایی، ریاضیات و منطق را طرح کردند که در نهایت، نتیجه خیره‌کننده بود و دقت مدل‌های زبانی از ۵۳.۳ درصد به ۸۶.۴ درصد افزایش یافت.

«جین‌سونگ یون»، پژوهشگر ارشد Google Cloud AI و فعال در این پروژه می‌گوید: «موفقیت در آموزش مدل زبانی کوچک که مدل‌های بزرگ‌تر را هدایت کند، گام مهمی به‌سوی هوش مصنوعی انعطاف‌پذیرتر و قابل‌اعتمادتر در دنیای واقعی است و می‌تواند توانایی مدل‌ها را بدون نیاز به آموزش مجدد، ارتقا دهد و دقت مدل‌های زبانی بزرگ را در وظایفی مانند ضرب اعداد، حل سودوکو و پازل‌های چیدمان بلوک‌ها بیش از ۳۰ درصد افزایش دهد. این نوآوری می‌تواند توانایی حل مسأله در مواردی مانند برنامه‌ریزی مسیر روبات‌ها در محیط‌های نامطمئن یا زمان‌بندی حمل‌ونقل در زنجیره تأمین را به‌طور چشمگیری ارتقا دهد.»

«یونگ‌چائو چن»، یکی دیگر از اعضای این تیم تحقیقاتی هم می‌گوید: « ما از انسان‌ها الهام گرفتیم تا دستیار هوشمند، بهترین تصمیم را بگیرد. مدل‌های بزرگ اغلب تمایل دارند از کوتاه‌ترین و ساده‌ترین مسیر بروند حتی اگر اشتباه باشد و CodeSteer برای جلوگیری از این سهل‌انگاری طراحی شده است. این دستیار هوشمند از یک سیستم ارزیابی کد استفاده می‌کند و اگر کد خیلی ساده یا ناکارآمد باشد، سیگنالی برای اصلاح آن ارسال می‌کند. همچنین یک بررسی‌کننده داخلی، به مدل زبانی دستور می‌دهد که با اجرای یک کد جداگانه، صحت پاسخ را تأیید کند.

تبلیغات
تبلیغات
ارسال نظرات
تبلیغات
تبلیغات
خط داغ
تبلیغات
تبلیغات