ویرایش تصویر همیشه یکی از پرچالش‌ترین کارهای گرافیکی بوده است. بسیاری از کاربران برای تغییر جزئی یا ایجاد استایل جدید روی تصاویر مجبور بودند از نرم‌افزارهای سنگین مثل فتوشاپ استفاده کنند. اما اکنون با معرفی Qwen-Image-Edit توسط تیم Qwen (علی‌بابا)، ویرایش حرفه‌ای تصاویر تنها با یک پرامپت متنی ساده امکان‌پذیر شده است. این مدل با ۲۰ میلیارد پارامتر توسعه داده شده و می‌تواند هم تغییرات جزئی پیکسلی و هم بازطراحی کامل تصویر را بدون آسیب به عناصر اصلی انجام دهد، در این مقاله، آموزش Qwen-Image-Edit را مرور می‌کنیم و با مثال‌های عملی نشان می‌دهیم که چگونه می‌توانید تصاویرتان را تنها با متن ساده ویرایش کنید.

ویژگی‌های اصلی Qwen-Image-Edit

  • ویرایش تصویر با دستور متنی ساده
  • قابلیت تغییر رنگ، پس‌زمینه یا اشیای داخل تصویر
  • پشتیبانی از ویرایش ناحیه‌ای (Pixel-Perfect) برای تغییر جزئیات خاص
  • تغییر استایل کل تصویر به سبک‌های هنری مختلف
  • توانایی ویرایش متن‌های داخل تصویر بدون خراب کردن گرافیک
  • امکان اعمال چند ویرایش پیاپی بدون افت کیفیت

آموزش هوش مصنوعی (صفر تا صد کار با ابزارهای هوش مصنوعی)

نصب و راه‌اندازی Qwen-Image-Edit

برای شروع استفاده از این ابزار، ابتدا باید محیط کاری مناسب را آماده کنید.

  1. اطمینان حاصل کنید که Python 3.10+ و CUDA (برای استفاده از GPU) روی سیستم نصب شده است.
  2. مخزن Qwen را کلون کنید:
git clone https://github.com/QwenLM/Qwen-Image-Edit.git
cd Qwen-Image-Edit
pip install -r requirements.txt
  1. مدل مورد نظر (مثلاً نسخه 20B) را دانلود کنید:
ollama pull qwen-image-edit:20b

اجرای مدل و اولین ویرایش

برای شروع ویرایش یک تصویر کافیست دستور زیر را اجرا کنید:

python edit.py --model qwen-image-edit-20b --input image.jpg --prompt "make the sky sunset orange"

🔹 این دستور آسمان تصویر را به رنگ نارنجی غروب تغییر می‌دهد.

ویرایش ناحیه‌ای (Pixel-Perfect Editing)

گاهی نیاز دارید فقط بخشی از تصویر تغییر کند، مثلاً رنگ لباس یک فرد. در این حالت باید یک فایل ماسک آماده کنید:

  • بخش‌های سفید = قابل تغییر
  • بخش‌های سیاه = ثابت باقی می‌مانند

سپس دستور زیر را اجرا کنید:

python edit.py --input photo.jpg --mask mask.png --prompt "change the shirt color to red"

این ویژگی باعث می‌شود تغییرات دقیقاً در ناحیه دلخواه اعمال شوند.

تغییر استایل کل تصویر

Qwen-Image-Edit قادر است استایل کلی یک تصویر را تغییر دهد. برای مثال، تبدیل یک عکس به نقاشی آبرنگ:

python edit.py --input photo.jpg --prompt "turn this image into a watercolor painting"

خروجی نهایی تصویری با ظاهر هنری جدید خواهد بود.

ویرایش متن داخل تصویر

یکی از ویژگی‌های خاص این مدل، توانایی تغییر متن‌های موجود در عکس است. برای مثال، تغییر نوشته روی یک پوستر:

python edit.py --input poster.jpg --prompt "replace the word 'Sale' with '50% Off'"

مدل بدون به‌هم‌ریختگی گرافیک یا فونت، متن را جایگزین می‌کند.

ویرایش‌های پیاپی (Stacked Edits)

شما می‌توانید چندین بار پشت سر هم روی یک تصویر تغییرات ایجاد کنید. مثلاً:

python edit.py --input image.jpg --prompt "add a coffee cup on the table"
python edit.py --input edited.jpg --prompt "make it look like a cyberpunk scene"

در این حالت، ابتدا یک فنجان قهوه به تصویر اضافه می‌شود و سپس کل صحنه به سبک سایبرپانک بازطراحی خواهد شد.

نکاتی برای بهبود نتایج

  • استفاده از GPU با حداقل ۲۴GB VRAM برای سرعت و کیفیت بالاتر توصیه می‌شود.
  • فایل خروجی به طور پیش‌فرض با پسوند _edited ذخیره می‌شود.
  • برای پروژه‌های پیچیده، بهتر است تغییرات را مرحله به مرحله انجام دهید.
  • دقت در انتخاب پرامپت باعث بهبود خروجی می‌شود؛ دستورات کوتاه و شفاف بهترین نتیجه را می‌دهند.

تفاوت Qwen-Image-Edit با ابزارهای مشابه

برخلاف ابزارهای تولید تصویر مثل DALL·E یا Stable Diffusion، این مدل نیازی به خلق تصویر از صفر ندارد. شما می‌توانید تصاویر موجود را اصلاح کنید، از تغییر ساده رنگ گرفته تا بازطراحی کامل پوستر. این موضوع باعث می‌شود Qwen-Image-Edit یک ابزار انعطاف‌پذیر و کاربردی در پروژه‌های واقعی باشد.

جمع‌ بندی

Qwen-Image-Edit علی‌بابا یکی از پیشرفته‌ترین مدل‌های ویرایش تصویر مبتنی بر هوش مصنوعی است که امکان تغییرات جزئی و کلی را تنها با دستورات متنی فراهم می‌کند. از تغییر رنگ ساده گرفته تا بازطراحی کامل یک صحنه، همه‌چیز با چند خط کد قابل انجام است. این ابزار می‌تواند برای طراحان، بازاریابان و تولیدکنندگان محتوا انقلابی بزرگ به شمار بیاید.