محققان دانشگاه فناوری کاوناس (KTU) با بهکارگیری سیستمی جدید بهدنبال بهبود تجربه تماشای مسابقات زنده فوتبال، با حذف حواسپرتیهای بصری ناشی از همپوشانی زوایای دوربین هستند.
در سالهای اخیر با بهکارگیری فنّاوری، تجربیات تماشاگران مسابقات ورزشی رو به بهبود است؛ اما دراینبین هنوز مشکلات زیادی هست که حلنشده باقیماندهاند.
به گزارش خبرآنلاین، یکی از دغدغههای تماشاگران فوتبال زمانی است که در پخش زنده، فیلمبرداران بهطور تصادفی در مقابل دوربینهای یکدیگر قرار میگیرند و در عکسها و فیلمهای یکدیگر دیده میشوند؛ بدین ترتیب در بسیاری از مواقع، بینندگان لحظات حساس بازی را از دست میدهند. حالا برای حل این مشکل، محققان دانشگاه فناوری کاوناس (KTU) دستبهکار شدهاند و سیستمی سراسری را برای بهبود تجربه دید با حذف حواسپرتیهای بصری ناشی از همپوشانی زوایای دوربین ایجاد کردهاند.
ریتس ماسکلیوناس، استاد دانشگاه کاوناس و یکی از مبدعان این نوآوری میگوید: «اختراع جدید ما درواقع الگوریتمی است که برای تشخیص اپراتورهای ویدئویی طراحیشده است.» سرهی پستووپایف، یکی دیگر از اعضای این تیم تحقیقاتی به این نکته اشارهکرده که به دلیل ماهیت پیچیده پوشش زنده ورزشی و وجود دوربینهای متعدد در گوشه و کنار استادیوم، حضور فیلمبرداران در قابهای یکدیگر موضوعی تکراری در پخش مسابقات فوتبال است.
او میگوید: « نقاط استقرار دوربینها در تورنمنتهای معتبر، زیاد است که باعث میشود تصاویر باهم تداخل داشته باشند و این به موضوع حواسپرتی بصری دامن میزند. چنین مسائلی تیم فیلمبرداران را با محدودیتهای زیادی روبرو میکند؛ چراکه آنها باید در شرایطی فیلمبرداری را انجام دهند که هرگز در کادر تصویر یکدیگر قرار نگیرند و همین به شکلی بالقوه منجر به از دست رفتن برخی لحظات بازی میشود یا باعث کاهش پویایی پخش خواهد شد.»
برای حل این مشکل در طول پخش زنده مسابقات فوتبال، دانشمندان سیستم end-to-end را طراحی و اجرا کردند که برای اجرای آن از مدل YOLOv8 بهره بردهاند؛ این مدل، سیستم پیشرفتهای برای تشخیص اشیاء است که بهسرعت و دقت بالایش شهرت دارد. YOLOv8 مخفف «You Only Look Once» است، به معنی «شما فقط یکبار نگاه میکنید» و این مدل میتواند اشیای موجود در تصاویر را شناسایی و طبقهبندی کند که این عملکرد ایدهآلی برای رویدادهایی مثل پخش زنده فوتبال است.
پستووپایف فارغالتحصیل کارشناسی ارشد هوش مصنوعی در علوم کامپیوتر دراینباره گفت: «این سیستم با تقسیم تصویر به یک شبکه و پیشبینی جعبههای محدود و احتمالات دستهبندی برای هر سلول شبکه کار میکند و بدین ترتیب این امکان فراهم میشود تا فیلمبرداران شناسایی و بخشبندی شوند.»
برای آموزش مدل YOLOv8 در تشخیص دقیق و بخشبندی فیلمبرداران در طول مسابقات فوتبال، یک مجموعه داده ایجادشده است.
پستووپایف گفت: «من این مجموعه داده را طراحی کردهام که طیف متنوعی از فیلمبرداران و انواع تجهیزات مختلفی را که در شرایط و مراحل مختلف بازی حضور دارند، شامل میشود. حالا YOLOv8 از این مجموعه دادهها برای شناسایی مکان فیلمبرداران در فریمهای ویدیو استفاده میکند.»
برای این فرآیند و حذف اپراتورها، از فناوری inpainting ویدیویی استفاده شده است. طبق توضیح او، اصطلاح inpainting در یادگیری عمیق به فرآیند بازسازی قسمتهای ازدسترفته یا خرابشده تصاویر و ویدیوها اشاره دارد که در این مورد، از آن برای حذف فیلمبرداران از پخش ویدئوهای فوتبال استفاده میشود.
هوش مصنوعی و فناوری مبتنی بر بینایی رایانشی بهقصد شناسایی اشیای ناخواسته مثل فیلمبرداران به تجزیهوتحلیل فریمهای ویدیویی میپردازد و قسمتهای حذفشده را با جزئیات مرتبطی پر میکند. فریمهای اصلاحشده برای تماشاگران به نمایش گذاشته میشود و بدین ترتیب پخش حرفهایتری را شاهد خواهیم بود.
ماسکلیوناس به این نکته اشاره کرد که این الگوریتم میتواند تصویر ضبطشده را قبل از پخش در تلویزیون، با تأخیری چندثانیهای از لحظه ثبت واقعی پردازش کند. او معتقد است که با بهبود تجهیزات، هوش مصنوعی این فاصله زمانی را به حالت ایدهآلی پرخواهد کرد.
با بهرهگیری از این فناوری جدید، کیفیت تماشای مسابقات فوتبال در خانه بهبود چشمگیری خواهد یافت. پستووپایف دراینباره گفت: «پخش مسابقه بدون حضور ناخوشایند فیلمبرداران دیگر در کادر تصویر، حرفهایتر خواهد شد. این پیشرفت باعث کاهش از دست رفتن برخی از لحظات مهم بازی میشود.» او معتقد است که تحقیقات بیشتر در این زمینه، آغازگر دوره جدیدی از پخش مسابقات ورزشی خواهد بود.
او میگوید: «شرکتهای پخش مسابقات میتوانند با بهکارگیری inpainting، زوایا، چشماندازها و جلوههای نوآورانه دوربین را کشف کنند و به شیوههای جدید و هیجانانگیز، به مسابقات جان مضاعفی بدهند.» بهعلاوه، بهکارگیری این روش میتواند فراتر از پخش زنده باشد و در تجزیهوتحلیلهای قبل و بعد از مسابقه نیز مورداستفاده قرار گیرد و حتی جان تازهای به ویدیوهای ضبطشده از مسابقات قدیمی بدهد.
البته این فناوری فقط به فوتبال محدود نمیشود و میتوان آن را در ورزشهای دیگری که با چالشهای پخش مشابهی روبرو هستند، به کار برد؛ ورزشهایی مثل فوتسال و بسکتبال نیز میتوانند از این فناوری بهرهمند شوند.
طبق توضیح ماسکلیوناس، این تصویر دیگری از کاربری برنامههای کاربردی هوش مصنوعی مدرن است. هوش مصنوعی فقط برای کاربری پزشکی نیست و میتوان از آن برای ویرایش و حذف تصاویر ناخوشایند نیز بهره برد. او ادامه داد: «این فناوری در آینده قادر خواهد بود تا مثلاً تبلیغات را حذف کند یا آنها را با تبلیغات دیگری جایگزین کند و میزان دقت آن بهاندازهای است که چشم انسان متوجه آن نخواهد شد.»