آنچه در این مقاله میخوانید [پنهانسازی]
گوگل بار دیگر با پروژهای نوآورانه نشان داده که درک انسان و هوش مصنوعی میتواند از همیشه نزدیکتر شود. تازهترین دستاورد این شرکت، مدل هوش مصنوعی PASTA (مخفف Preference-Aware STyle Adaptation) است؛ سیستمی که میتواند سلیقهی بصری هر کاربر را درک و با گذر زمان یاد بگیرد.
برخلاف مدلهای تولید تصویر سنتی که بر اساس پرامپتهای دقیق کار میکنند، PASTA از طریق تعامل مداوم با کاربر و تحلیل انتخابهایش، یاد میگیرد چه نوع سبکها، رنگها و ترکیبهایی برای او جذابترند.
سرفصل های مقاله
PASTA چگونه کار میکند؟
در هر مرحلهی تعامل، مدل چهار تصویر مختلف تولید میکند و از کاربر میخواهد که یکی را انتخاب کند. این انتخابها برای PASTA به منزلهی دادهی آموزشی جدید است. مدل سپس الگوی انتخابها را تحلیل کرده و به مرور درک دقیقی از ترجیحات زیباییشناختی کاربر پیدا میکند.
به عبارت سادهتر، اگر شما معمولاً تصاویری با رنگهای ملایم و ترکیبهای مینیمال را انتخاب کنید، PASTA بهصورت خودکار یاد میگیرد همین سبک را در تولیدهای بعدی لحاظ کند — بدون اینکه لازم باشد در هر بار پرامپتهای پیچیده بنویسید.
این فرآیند بر پایهی یادگیری تقویتی تعاملی (Interactive Reinforcement Learning) بنا شده است، جایی که بازخورد انسان نقش کلیدی در بهینهسازی عملکرد مدل دارد.
دادهها و آموزش مدل
پژوهشگران گوگل برای آموزش PASTA از یک مجموعه داده عظیم شامل:
- ۷۰۰۰ جلسه واقعی انسانی (کاربرانی که بهصورت مستقیم در تعامل با مدل بازخورد دادهاند)،
- ۳۰ هزار شبیهسازی کامپیوتری (برای گسترش دامنه سبکها و سناریوهای بصری)،
استفاده کردهاند.
این ترکیب داده انسانی و شبیهسازیشده باعث شده مدل نهتنها از نظر فنی قدرتمند باشد، بلکه به لحاظ زیباشناسی و حس انسانی نیز عملکردی نزدیک به سلیقه واقعی کاربران ارائه دهد.
در آزمایشها، کاربران در ۸۵ درصد موارد خروجیهای PASTA را به مدلهای معمولی ترجیح دادهاند — عددی که نشان میدهد شخصیسازی در تولید تصویر دیگر فقط یک ویژگی جانبی نیست، بلکه میتواند به استاندارد جدید تبدیل شود.
برتری PASTA نسبت به مدلهای سنتی
مدلهای تولید تصویر فعلی (مثل Imagen یا DALL·E) بر اساس متن ورودی (پرامپت) کار میکنند و برای دستیابی به نتیجهی دلخواه، نیازمند توصیف دقیق و طولانی هستند.
اما PASTA مسیر متفاوتی را در پیش گرفته است:
- نیازی به توصیف پیچیده ندارد.
- به مرور زمان سلیقهی کاربر را خودش کشف میکند.
- در تفسیر پرامپتهای مبهم یا خلاقانه (مثل “احساس آرامش در غروب”) عملکرد بهتری دارد.
این یعنی شما بهجای اینکه ساعتها با کلمات بازی کنید تا تصویری مطابق ذهنتان بسازید، کافی است چند بار انتخاب کنید — و PASTA خودش با ذوق و سلیقهی شما هماهنگ میشود.
انتشار متن باز برای پژوهشگران
یکی از بخشهای تحسینبرانگیز این پروژه، تصمیم گوگل برای انتشار متنباز دیتاست و ابزارهای شبیهسازی PASTA است.
به این ترتیب پژوهشگران و توسعهدهندگان دیگر نیز میتوانند از این چارچوب برای ساخت مدلهای شخصیسازیشده استفاده کنند.
گوگل در بیانیه رسمی خود اعلام کرده که هدف از این اقدام، ترویج تحقیقات باز و اخلاقمدار در زمینهی تعامل انسان و هوش مصنوعی است — بهویژه در حوزههایی که سلیقه، احساس و هنر دخیل هستند.
این تصمیم همچنین به اکوسیستم پژوهشی کمک میکند تا به سمت مدلهایی حرکت کند که کاربرمحورتر و انسانیتر باشند، نه صرفاً بر پایه دادههای آماری بزرگ.
کاربردهای احتمالی PASTA
مدل PASTA میتواند در زمینههای گوناگون خلاقیت دیجیتال مورد استفاده قرار گیرد، از جمله:
🎨 طراحی گرافیک و تولید محتوا: یادگیری از سبک طراحی کاربر برای ساخت خودکار طرحهای هماهنگ با برند یا سلیقه شخصی.
📸 عکاسی و ویرایش تصویر: تنظیم رنگ، نور و ترکیب بصری بر اساس ترجیحات احساسی کاربر.
🖼 هنر مولد (Generative Art): ساخت آثار هنری که هر فرد نسخهی منحصربهفرد خود را از آن داشته باشد.
👗 مد و طراحی لباس: تحلیل سبک پوشش و تولید طرحهایی که با زیباییشناسی شخصی کاربر هماهنگ است.
در واقع، PASTA میتواند به پایهای برای ساخت دستیارهای خلاق هوشمند تبدیل شود — ابزارهایی که نهتنها از شما یاد میگیرند، بلکه به مرور بخشی از ذوق و سبک شما را در خود جذب میکنند.
تأثیر PASTA بر آینده تولید تصویر با AI
PASTA گامی بزرگ به سمت شخصیسازی عمیق در تولید محتوای بصری است.
تا امروز بیشتر مدلها بر «کیفیت خروجی» تمرکز داشتند، اما PASTA به سراغ «هماهنگی با سلیقهی انسان» رفته — و این تفاوت، انقلابی است.
در آینده میتوان انتظار داشت کاربران پلتفرمهایی مثل Google Images یا Adobe Firefly مدلهای مخصوص خود را داشته باشند؛ مدلهایی که با گذشت زمان، به شناخت کاملی از ذوق فردیشان میرسند.
جمع بندی
PASTA نه صرفاً یک مدل هوش مصنوعی، بلکه یک همکار هنری دیجیتال است.
مدلی که بهجای تکیه بر دستور، از درک و تعامل انسانی یاد میگیرد.
با دقت ۸۵ درصدی در ترجیحات کاربران و آموزش مبتنی بر تعامل واقعی، PASTA میتواند مسیر آیندهی تولید تصویر را بهسمت زیباشناسی شخصیسازیشده هدایت کند.
با انتشار متنباز این پروژه، گوگل بار دیگر نشان داد که آیندهی هوش مصنوعی نه فقط در قدرت محاسباتی، بلکه در درک عمیقتر انسانها نهفته است. 🎨🤖