فناوری

هوش مصنوعی ویدیوساز Runway Gen-4.5 معرفی شد؛ قدرتمندتر از Sora و Veo [تماشا کنید]

سرانجام مدل هوش مصنوعی ویدیوساز Runway Gen-4.5 معرفی شد. این مدل با درک دقیق قوانین فیزیک، جزئیات بصری خیره‌کننده‌ای به نمایش درآورده و مرز بین واقعیت و خیال را کاهش داده و در بنچمارک‌های مختلف از مدل‌های غول‌های فناوری مانند گوگل و OpenAI جلو زده است.

تمرکز اصلی Gen-4.5 نه تنها بر کیفیت تصویر بلکه بر دقت فیزیکی بوده است. برخلاف مدل‌های پیشین که اشیا شناور به نظر می‌رسیدند یا حرکات غیرطبیعی داشتند، این مدل قادر است وزن، تکانه و نیرو را به‌درستی شبیه‌سازی کند.

مایعات با جریان واقعی حرکت می‌کنند و رفتار طبیعی دارند. همچنین Gen-4.5 پرامپت‌های متنی پیچیده را با دقت بالا اجرا کرده و جزئیات صحنه را نادیده نمی‌گیرد، به طوری که تشخیص واقعی یا تخیلی بودن را دشوار می‌سازد.

run-2.jpg

نتایج بنچمارک مستقل Video Arena که براساس ارزیابی کاربران انجام شده، بسیار قابل توجه است. در این رتبه‌بندی، Gen-4.5 جایگاه اول را به خود اختصاص داده و مدل Veo 3 گوگل در رتبه دوم و مدل Sora 2 Pro از OpenAI در رتبه هفتم قرار گرفته‌اند.

همچنین این مدل با کسب 1,247 امتیاز در صدر بنچمارک Artificial Analysis Text to Video قرار دارد، که در آن کاربران انسانی بدون اطلاع از نام مدل‌ها، خروجی‌ها را ارزیابی می‌کنند.

مدیرعامل Runway در همین رابطه اعلام کرده که با یک تیم 100 نفره توانستیم بر شرکت‌های تریلیون دلاری غلبه کنیم. این مدل که با نام رمز دیوید ساخته شده، نشان می‌دهد تمرکز و پشتکار می‌تواند بر بودجه‌های نامحدود پیروز شود.

با وجود پیشرفت‌های چشمگیر، Gen-4.5 هنوز کامل نیست. این مدل ممکن است دچار خطا شود. برای مثال در برخی ویدیوها ممکن است در پیش از چرخاندن دستگیره باز شود. همچنین مشکل پایداری اشیا هنوز به طور کامل حل نشده، هرچند نسبت به نسخه‌های قبلی بهبود قابل توجهی یافته است.

عرضه این مدل به‌صورت تدریجی آغاز شده و طبق اعلام Runway، طی چند روز آینده از طریق پلتفرم وب و API در دسترس تمام کاربران قرار خواهد گرفت. در انتها می‌توانید ویدیوهای ساخته شده توسط این مدل را مشاهده کنید:

Source link

تیم تحریریه نوین مگ

تیم تحریریه novinmag.ir متشکل از گروهی از نویسندگان و محققان خلاق است که با اشتیاق و دقت، آخرین مطالب و ترندهای روز را در حوزه‌های مختلف گردآوری و ارائه می‌کنند. هدف ما ارائه محتوای کاربردی، آموزنده و جذاب برای خوانندگان است تا تجربه‌ای متفاوت و مفید از دنیای دیجیتال و اطلاعات روز داشته باشند.

نوشته های مشابه

دکمه بازگشت به بالا