علیبابا چین مدل هوش مصنوعی دلایلگر تصویری معارفه کرد_اسپایدر

نوشته و ویرایش شده توسط تیم اسپایدر
Alibaba، غول فناوری چینی، مدل تازه هوش مصنوعی از سری Qwen به نام QVQ-Max را معارفه کرد. این مدل استدلالگر عکس است و میتواند محتوای عکسها و فیلمها را فهمیدن کند و با تحلیل و استدلال، اطلاعاتی درمورد آنها اراعه دهد.
بر پایه گزارش Neowin، علیبابا میگوید با مدل QVQ-Max شکاف مدلهای هوش مصنوعی مبتنیبر متن و اطلاعات دنیای واقعی در تصاویر را پر میکند. این هوش مصنوعی با قابلیت استدلال بصری میتواند حقیقتهای جهان را ببیند، بفهمد و درمورد آنها فکر کند. این شرکت چینی ادعا میکند این مدل در تجزیهوتحلیل تصاویر و شناسایی عناصر کلیدی کارکرد زیاد خوبی دارد و در مواردی میتوان از آن برای تصویرسازی و تشکیل فیلمنامه نیز منفعت گیری کرد.
هوش مصنوعی استدلالگر تصویری Alibaba

همانند دیگر چتباتهای هوش مصنوعی، QVQ-Max نیز میتواند در کارهای گوناگون کمکتان کند و با اضافه شدن این قابلیت تصویری میتوانید کارهای بیشتری را به آن بسپارید؛ برای مثال عکس مسائل ریاضی و فیزیک همراه نمودارها را برایش بفرستید.
علیبابا QVQ-Max را اولین نسخه از مدل استدلالگر تصویری خود نامیده است و بهمرور میخواهد آن را در چندین مرحله بهبود دهد. ابتدا Alibaba میخواهد دقت تشخیص عکس را بهبود ببخشد. سپس مدل را در حل مسائل چندمرحلهای و پیچیده بهتر کند. درنهایت تصمیم دارد این مدل را از تعامل های مبتنیبر متن فراتر برده و آن را به قابلیتهایی همانند تشکیل بصری تجهیزکند.
برای منفعت گیری از QVQ-Max، ابتدا باید به chat.qwen.ai بروید، روی منوی مدلها در بالا سمت چپ کلیک کنید، گزینه «Expand more models» را بزنید و QVQ-Max را انتخاب کنید. برای آنکه بهتر از قابلیتهای این مدل منفعت گیری کنید، بهتر است تصویری را پیوست کنید سپس از مدل درمورد آن سوال کنید.
علیبابا چندی قبل نیز مدل Qwen2.5-Max را انتشار کرد که در بنچمارکهای گوناگون از مدل V3 دیپسیک، GPT-4o و Llama-3.1-405B متا بهتر عمل میکند.
دسته بندی مطالب