ChatGPT اکنون میتواند با مدل GPT-4o تصاویر بهتری تشکیل کند_اسپایدر

نوشته و ویرایش شده توسط تیم اسپایدر
OpenAI ویژگی جدیدی با نام «Images in ChatGPT» به چتبات خود اضافه کرده و از GPT-4o برای تشکیل عکس در این چتبات منفعت گیری میکند. این قابلیت دقت رنگهای تصاویر و رندر متن در تصاویر را تا حد قابلتوجهی بهبود میدهد.
به حرف های «تارا کریستینسن»، سخنگوی OpenAI ویژگی تازه از امروز در دسترس همه کاربران قرار میگیرد. او افزود کاربران نسخه عادی ChatGPT باوجود برخی محدودیتها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. یقیناً امکان پذیر این محدودیتها نیز بهمرور بر پایه تقاضا یا استقبال کاربران تحول کند.
قابلیت تازه ChatGPT تصاویر را یکپارچهتر میکند
«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در گفتگو با Verge از نتایج مثبت این ویژگی او گفت. او اشاره کرد از مدل «GPT-4o omnimodal» برای پردازش و گسترش این قابلیت منفعت گیری شده است؛ مدلی که توانایی پردازش انواع گوناگون دادهها را دارد.
او این چنین از بهبود قابلدقت ویژگی «Binding» در ساخت تصاویر او گفت: «مدلهای قدیمی زیاد تر در نگه داری انسجام تصاویر مشکل داشتند، مخصوصاً وقتی که عناصر بیشتری را به عکسها اضافه میکردیم.» برای مثالً ممکن می بود مدل هوش مصنوعی بهجای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.
این مشکل در ChatGPT از بین بردن شده و مدل تازه میتواند بین ۱۵ تا ۲۰ عنصر را بهدرستی در عکس قرار دهد اما مدلهای قدیمی فقط میتوانستند ۵ تا ۸ عنصر را بدون نادرست تشکیل کنند.

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» منفعت گیری میکند؛ یعنی ChatGPT همانند نوشتن متون تصاویر را تدریجی از بالا به پایین و از چپ به راست میسازد. درحالیکه مدلهای قبلی همانند DALL·E بر پایه روش Diffusion model کل عکس را همزمان پردازش و طراحی میکردند. همین نوشته به گمان زیادً علتشده تا یکپارچگی تصاویر بهبود یابد.
مدیر تیم تحقیقاتی OpenAI قابلیت تازه ChatGPT را نتیجه تستهای متعدد و بعضاً تکراری تیمش در ماههای تازه میداند. یقیناً او او گفت این ویژگی تا این مدت در پردازش متون ریز و کوچک در تصاویر مشکل دارد اما درمجموع کیفیت متن و تصاویر را همزمان نگه داری میکند.
دسته بندی مطالب