ChatGPT اکنون می‌تواند با مدل GPT-4o تصاویر بهتری تشکیل کند_اسپایدر

سارا زمانیمارس 26, 2025

160 خواندن این مطلب 1 دقیقه زمان میبرد

chatgpt introduces new capability for image generation 0

[ad_1]
نوشته و ویرایش شده توسط تیم اسپایدر

OpenAI ویژگی جدیدی با نام «Images in ChatGPT» به چت‌بات خود اضافه کرده و از GPT-4o برای تشکیل عکس در این چت‌بات منفعت گیری می‌کند. این قابلیت دقت رنگ‌های تصاویر و رندر متن در تصاویر را تا حد قابل‌‌توجهی بهبود می‌دهد.

به‌ حرف های «تارا کریستینسن»، سخنگوی OpenAI ویژگی تازه از امروز در دسترس همه کاربران قرار می‌گیرد. او افزود کاربران نسخه عادی ChatGPT باوجود برخی محدودیت‌ها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. یقیناً امکان پذیر این محدودیت‌ها نیز به‌مرور بر پایه تقاضا یا استقبال کاربران تحول کند.

قابلیت تازه ChatGPT تصاویر را یکپارچه‌تر می‌کند

«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در گفتگو با Verge از نتایج مثبت این ویژگی او گفت. او اشاره کرد از مدل «GPT-4o omnimodal» برای پردازش و گسترش این قابلیت منفعت گیری شده است؛ مدلی که توانایی پردازش انواع گوناگون داده‌‌ها را دارد.

او این چنین از بهبود قابل‌دقت ویژگی «Binding» در ساخت تصاویر او گفت: «مدل‌های قدیمی زیاد تر در نگه داری انسجام تصاویر مشکل داشتند، مخصوصاً وقتی که عناصر بیشتری را به عکس‌ها اضافه می‌کردیم.» برای مثالً ممکن می بود مدل هوش مصنوعی به‌جای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.

آخرین مطالب

این مشکل در ChatGPT از بین بردن شده و مدل تازه می‌تواند بین ۱۵ تا ۲۰ عنصر را به‌درستی در عکس قرار دهد اما مدل‌های قدیمی فقط می‌توانستند 5 تا 8 عنصر را بدون نادرست تشکیل کنند.

Cocktails — عکس ساخته‌شده با Images in ChatGPT

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» منفعت گیری می‌کند؛ یعنی ChatGPT همانند نوشتن متون تصاویر را تدریجی از بالا به پایین و از چپ به راست می‌سازد. درحالی‌که مدل‌های قبلی همانند DALL·E بر پایه روش Diffusion model کل عکس را هم‌زمان پردازش و طراحی می‌کردند. همین نوشته به گمان زیادً علتشده تا یکپارچگی تصاویر بهبود یابد.

مدیر تیم تحقیقاتی OpenAI قابلیت تازه ChatGPT را نتیجه تست‌های متعدد و بعضاً تکراری تیمش در ماه‌های تازه می‌داند. یقیناً او او گفت این ویژگی تا این مدت در پردازش متون ریز و کوچک در تصاویر مشکل دارد اما درمجموع کیفیت متن و تصاویر را هم‌زمان نگه داری می‌کند.

دسته بندی مطالب

[ad_2]

برچسب ها