گوگل بار دیگر با پروژه‌ای نوآورانه نشان داده که درک انسان و هوش مصنوعی می‌تواند از همیشه نزدیک‌تر شود. تازه‌ترین دستاورد این شرکت، مدل هوش مصنوعی PASTA (مخفف Preference-Aware STyle Adaptation) است؛ سیستمی که می‌تواند سلیقه‌ی بصری هر کاربر را درک و با گذر زمان یاد بگیرد.
برخلاف مدل‌های تولید تصویر سنتی که بر اساس پرامپت‌های دقیق کار می‌کنند، PASTA از طریق تعامل مداوم با کاربر و تحلیل انتخاب‌هایش، یاد می‌گیرد چه نوع سبک‌ها، رنگ‌ها و ترکیب‌هایی برای او جذاب‌ترند.

PASTA چگونه کار می‌کند؟

در هر مرحله‌ی تعامل، مدل چهار تصویر مختلف تولید می‌کند و از کاربر می‌خواهد که یکی را انتخاب کند. این انتخاب‌ها برای PASTA به منزله‌ی داده‌ی آموزشی جدید است. مدل سپس الگوی انتخاب‌ها را تحلیل کرده و به مرور درک دقیقی از ترجیحات زیبایی‌شناختی کاربر پیدا می‌کند.

به عبارت ساده‌تر، اگر شما معمولاً تصاویری با رنگ‌های ملایم و ترکیب‌های مینیمال را انتخاب کنید، PASTA به‌صورت خودکار یاد می‌گیرد همین سبک را در تولید‌های بعدی لحاظ کند — بدون اینکه لازم باشد در هر بار پرامپت‌های پیچیده بنویسید.

این فرآیند بر پایه‌ی یادگیری تقویتی تعاملی (Interactive Reinforcement Learning) بنا شده است، جایی که بازخورد انسان نقش کلیدی در بهینه‌سازی عملکرد مدل دارد.

داده‌ها و آموزش مدل

پژوهشگران گوگل برای آموزش PASTA از یک مجموعه داده عظیم شامل:

  • ۷۰۰۰ جلسه واقعی انسانی (کاربرانی که به‌صورت مستقیم در تعامل با مدل بازخورد داده‌اند)،
  • ۳۰ هزار شبیه‌سازی کامپیوتری (برای گسترش دامنه سبک‌ها و سناریوهای بصری)،
    استفاده کرده‌اند.

این ترکیب داده انسانی و شبیه‌سازی‌شده باعث شده مدل نه‌تنها از نظر فنی قدرتمند باشد، بلکه به لحاظ زیباشناسی و حس انسانی نیز عملکردی نزدیک به سلیقه واقعی کاربران ارائه دهد.

در آزمایش‌ها، کاربران در ۸۵ درصد موارد خروجی‌های PASTA را به مدل‌های معمولی ترجیح داده‌اند — عددی که نشان می‌دهد شخصی‌سازی در تولید تصویر دیگر فقط یک ویژگی جانبی نیست، بلکه می‌تواند به استاندارد جدید تبدیل شود.

برتری PASTA نسبت به مدل‌های سنتی

مدل‌های تولید تصویر فعلی (مثل Imagen یا DALL·E) بر اساس متن ورودی (پرامپت) کار می‌کنند و برای دستیابی به نتیجه‌ی دلخواه، نیازمند توصیف دقیق و طولانی هستند.
اما PASTA مسیر متفاوتی را در پیش گرفته است:

  • نیازی به توصیف پیچیده ندارد.
  • به مرور زمان سلیقه‌ی کاربر را خودش کشف می‌کند.
  • در تفسیر پرامپت‌های مبهم یا خلاقانه (مثل “احساس آرامش در غروب”) عملکرد بهتری دارد.

این یعنی شما به‌جای اینکه ساعت‌ها با کلمات بازی کنید تا تصویری مطابق ذهنتان بسازید، کافی است چند بار انتخاب کنید — و PASTA خودش با ذوق و سلیقه‌ی شما هماهنگ می‌شود.

انتشار متن‌ باز برای پژوهشگران

یکی از بخش‌های تحسین‌برانگیز این پروژه، تصمیم گوگل برای انتشار متن‌باز دیتاست و ابزارهای شبیه‌سازی PASTA است.
به این ترتیب پژوهشگران و توسعه‌دهندگان دیگر نیز می‌توانند از این چارچوب برای ساخت مدل‌های شخصی‌سازی‌شده استفاده کنند.

گوگل در بیانیه رسمی خود اعلام کرده که هدف از این اقدام، ترویج تحقیقات باز و اخلاق‌مدار در زمینه‌ی تعامل انسان و هوش مصنوعی است — به‌ویژه در حوزه‌هایی که سلیقه، احساس و هنر دخیل هستند.

این تصمیم همچنین به اکوسیستم پژوهشی کمک می‌کند تا به سمت مدل‌هایی حرکت کند که کاربرمحورتر و انسانی‌تر باشند، نه صرفاً بر پایه داده‌های آماری بزرگ.

آموزش هوش مصنوعی

کاربردهای احتمالی PASTA

مدل PASTA می‌تواند در زمینه‌های گوناگون خلاقیت دیجیتال مورد استفاده قرار گیرد، از جمله:

🎨 طراحی گرافیک و تولید محتوا: یادگیری از سبک طراحی کاربر برای ساخت خودکار طرح‌های هماهنگ با برند یا سلیقه شخصی.
📸 عکاسی و ویرایش تصویر: تنظیم رنگ، نور و ترکیب بصری بر اساس ترجیحات احساسی کاربر.
🖼 هنر مولد (Generative Art): ساخت آثار هنری که هر فرد نسخه‌ی منحصربه‌فرد خود را از آن داشته باشد.
👗 مد و طراحی لباس: تحلیل سبک پوشش و تولید طرح‌هایی که با زیبایی‌شناسی شخصی کاربر هماهنگ است.

در واقع، PASTA می‌تواند به پایه‌ای برای ساخت دستیارهای خلاق هوشمند تبدیل شود — ابزارهایی که نه‌تنها از شما یاد می‌گیرند، بلکه به مرور بخشی از ذوق و سبک شما را در خود جذب می‌کنند.

تأثیر PASTA بر آینده تولید تصویر با AI

PASTA گامی بزرگ به سمت شخصی‌سازی عمیق در تولید محتوای بصری است.
تا امروز بیشتر مدل‌ها بر «کیفیت خروجی» تمرکز داشتند، اما PASTA به سراغ «هماهنگی با سلیقه‌ی انسان» رفته — و این تفاوت، انقلابی است.

در آینده می‌توان انتظار داشت کاربران پلتفرم‌هایی مثل Google Images یا Adobe Firefly مدل‌های مخصوص خود را داشته باشند؛ مدل‌هایی که با گذشت زمان، به شناخت کاملی از ذوق فردی‌شان می‌رسند.

جمع‌ بندی

PASTA نه صرفاً یک مدل هوش مصنوعی، بلکه یک همکار هنری دیجیتال است.
مدلی که به‌جای تکیه بر دستور، از درک و تعامل انسانی یاد می‌گیرد.
با دقت ۸۵ درصدی در ترجیحات کاربران و آموزش مبتنی بر تعامل واقعی، PASTA می‌تواند مسیر آینده‌ی تولید تصویر را به‌سمت زیباشناسی شخصی‌سازی‌شده هدایت کند.

با انتشار متن‌باز این پروژه، گوگل بار دیگر نشان داد که آینده‌ی هوش مصنوعی نه فقط در قدرت محاسباتی، بلکه در درک عمیق‌تر انسان‌ها نهفته است. 🎨🤖