بهتر از DeepSeek؛ هوش مصنوعی تازه شرکت چینی Alibaba معارفه شد_اسپایدر
نوشته و ویرایش شده توسط تیم اسپایدر
شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد که ادعا میکند از مدل تحسینشده DeepSeek-V3 بهتر است.
بر پایه اظهار Alibaba، مدل تازه Qwen2.5-Max در بنچمارکهایی همانند Arena-Hard، LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل میکند. در دیگر بنچمارکها نیز تقریباً همسطح مدل دیپسیک است. این چنین این شرکت میگوید که مدلش از GPT-4o و Llama-3.1-405B در قسمتهای مختلفی کارکرد بهتری دارد.
اکنون میتوانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. این چنین این مدل قوی در Qwen Chat انتشار شده است که در آن میتوانید عکس و ویدیو نیز تشکیل کنید.
هوش مصنوعی تازه Alibaba
مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که بر روی بیشتر از ۲۰ تریلیون توکن و با راه حلهای تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE پشتیبانی میکند تا هوش مصنوعی بدون خوشههای GPU عظیم به دست آید و هزینههای زیرساخت را ۴۰ تا ۶۰ درصد نسبت به دیگر رویکردهای مدلهای زبانی بزرگ افت داد.

مدل تازه علیبابا و یقیناً DeepSeek نشان خواهند داد که بهجای اندوختهگذاری هنگفت در تشکیل مراکز داده و خوشههای GPU بزرگ میتوان با بهینهسازی معماری هوش مصنوعی مدلهایی کمهزینه و کارآمد گسترش داد. کارکرد قوی این مدل در تشکیل کد (با امتیاز ۳۸.۷ درصد در بنچمارک LiveCodeBench) و استدلال (با امتیاز ۸۹.۴ درصد در Arena-Hard) مشخص می کند میتوان تعداد بسیاری از کاربردهای هوش مصنوعی مولد را با توان پردازشی کمتری مدیریت کرد.

یقیناً فقط کارکرد خوب در بنچمارکها کافی نیست تا یک مدل هوش مصنوعی در بین کاربران محبوب بشود. مراعات حریم خصوصی دادههای کاربران، اراعه API قابلمطمعن و حمایتطولانیزمان نیز از عوامل اثرگذار می باشند. درکل اکنون باید دید که آیا مدل تازه علیبابا میتواند در رقابت با دیپسیک و شرکتهای آمریکایی کارکرد قابلقبولی داشته باشد یا خیر.
دسته بندی مطالب