هوش مصنوعی Grok ایلان ماسک انگارً بهزودی چندوجهی میشود_اسپایدر

نوشته و ویرایش شده توسط تیم اسپایدر
مطابق اسناد عمومی گسترشدهندگان شرکت هوش مصنوعی xAI، این شرکت درحال افزودن قابلیت پردازش ورودیهای چندوجهی به چتبات Grok خود است. این بدان معناست که بهزودی، کاربران امکان پذیر بتوانند برای Grok عکس بفرستند تا باتوجه به آن با هوش مصنوعی مکالمه داشته باشند.
نزدیک به یک ماه پیش شرکت هوش مصنوعی «ایلان ماسک»، یعنی xAI، نسخه Grok-1.5 Vision را معارفه کرد که برای تعدادی از کاربران محدود در دسترس قرار گرفت. این نسخه از Grok میتواند نمودار، اسکرینشات و تصاویر را پردازش کند. اکنون به نقل از ورج و مطابق آخرین آپدیت اسناد گسترشدهندگان، گسترش این مدل درحال پیشرفت است و به گمان زیادً بهزودی در دسترس قرار میگیرد.

بهطورکلی، باتوجه به پیشرفت هوش مصنوعیهای گوگل و OpenAI که در روزهای قبل کارکرد خیرهکننده آنها را در پردازش بلادرنگ صدا و عکس دیدیم، دور از انتظار نیست که شرکت ایلان ماسک نیز در این رقابت از قابلیتهای چندوجهی هوش مصنوعی خود رونمایی کند.
هوش مصنوعی Grok با ورودیهای چندوجهی
مطابق سند حاضر، یک نمونه از اسکریپت پایتون وجود دارد که مشخص می کند چطور گسترشدهندگان میتوانند از SDK یا کتابخانه کیت گسترش نرمافزار xAI برای تشکیل جواب بر پایه متن و تصاویر منفعت گیری کنند. این اسکریپت بعد از خواندن یک فایل تصویری و پرامپت متنی، به کاربر جواب میدهد.

این قابلیت یک آپدیت بزرگ برای Grok محسوب خواهد شد. شرکت xAI برای اولینبار در نوامبر ۲۰۲۳ این چتبات را رونمایی کرد و کاربران پریمیوم پلاس ایکس میتوانند از آن منفعت گیری کنند. این هوش مصنوعی با دادههای متنی از منبع های عمومی در اینترنت تا سهماهه سوم ۲۰۲۳ آموزش دیده و در فرایند آموزش آن از پستهای شبکه اجتماعی ایکس منفعت گیری نشده است.
شرکت xAI توسط ایلان ماسک در مارس ۲۰۲۳ (اسفند ۱۴۰۱) تأسیس شد، بااینحال در عرصه هوش مصنوعی شرکت نوپایی محسوب میبشود و از رقبایی همانند OpenAI عقبتر است. یقیناً xAI میگوید که مدل Grok 1.5 آنها دارد به GPT-4 در بنچمارکهای گوناگون نزدیک میبشود.
دسته بندی مطالب