تکنولوژی

بهتر از DeepSeek؛ هوش مصنوعی تازه شرکت چینی Alibaba معارفه شد_اسپایدر


نوشته و ویرایش شده توسط تیم اسپایدر

شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد که ادعا می‌کند از مدل تحسین‌شده DeepSeek-V3 بهتر است.

بر پایه اظهار Alibaba، مدل تازه Qwen2.5-Max در بنچمارک‌هایی همانند Arena-Hard، LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل می‌کند. در دیگر بنچمارک‌ها نیز تقریباً هم‌سطح مدل دیپ‌سیک است. این چنین این شرکت می‌گوید که مدلش از GPT-4o و Llama-3.1-405B در قسمت‌های مختلفی کارکرد بهتری دارد.

اکنون می‌توانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. این چنین این مدل قوی در Qwen Chat انتشار شده است که در آن می‌توانید عکس و ویدیو نیز تشکیل کنید.

هوش مصنوعی تازه Alibaba

مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که بر روی بیشتر از ۲۰ تریلیون توکن و با راه حلهای تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE پشتیبانی می‌کند تا هوش مصنوعی بدون خوشه‌های GPU عظیم به دست آید و هزینه‌های زیرساخت را ۴۰ تا ۶۰ درصد نسبت به دیگر رویکردهای مدل‌های زبانی بزرگ افت داد.

Qwen2.5 max instruct

مدل تازه علی‌بابا و یقیناً DeepSeek نشان خواهند داد که به‌جای اندوخته‌گذاری هنگفت در تشکیل مراکز داده و خوشه‌های GPU بزرگ می‌توان با بهینه‌سازی معماری هوش مصنوعی مدل‌هایی کم‌هزینه و کارآمد گسترش داد. کارکرد قوی این مدل در تشکیل کد (با امتیاز ۳۸.۷ درصد در بنچمارک LiveCodeBench) و استدلال (با امتیاز ۸۹.۴ درصد در Arena-Hard) مشخص می کند می‌توان تعداد بسیاری از کاربردهای هوش مصنوعی مولد را با توان پردازشی کمتری مدیریت کرد.

Qwen2.5 Max

یقیناً فقط کارکرد خوب در بنچمارک‌ها کافی نیست تا یک مدل هوش مصنوعی در بین کاربران محبوب بشود. مراعات حریم خصوصی داده‌های کاربران، اراعه API قابل‌مطمعن و حمایتطولانی‌زمان نیز از عوامل اثرگذار می باشند. درکل اکنون باید دید که آیا مدل تازه علی‌بابا می‌تواند در رقابت با دیپ‌سیک و شرکت‌های آمریکایی کارکرد قابل‌قبولی داشته باشد یا خیر.

دسته بندی مطالب

کسب وکار

تکنولوژی

اموزشی

سلامت

نوشته های مشابه

دکمه بازگشت به بالا