پرامپت‌نویسی تصویر: هنری که با تمرین بهتر می‌شود

اگر تا حالا جلوی یک ابزار تولید تصویر نشسته‌ای و با خودت فکر کرده‌ای «چرا خروجی شبیه چیزی که تو ذهنمه نیست؟»، مشکل احتمالاً از پرامپت‌نویسی تصویر است، نه خود مدل. فرق بین یک تصویر معمولی و یک تصویر خیره‌کننده، بیشتر اوقات در چند کلمه‌ای است که تایپ می‌کنی. این راهنما بر اساس تجربه‌ی واقعی کار با ابزارهای مختلف نوشته شده و قرار نیست تئوری خشک باشد.

کدام ابزار برای نوشتن پرامپت تصویر بهتر است؟

خیلی‌ها از چت‌بات‌های هوش مصنوعی برای کمک در نوشتن پرامپت استفاده می‌کنند. جمینای و چت‌جی‌پی‌تی هر دو نتایج خوبی می‌دهند، ولی یک نکته هست: Claude (کلاد) معمولاً شناخت بهتری نسبت به مدل‌های تصویرساز دارد. یعنی وقتی ازش می‌خواهی پرامپت بنویسد، بهتر می‌فهمد هر مدل چه ساختاری را ترجیح می‌دهد و خروجی دقیق‌تری پیشنهاد می‌کند.

البته این به معنای بد بودن بقیه نیست. نکته اینجاست که برای پرامپت‌نویسی حرفه‌ای، صرفاً یک چت‌بات باهوش کافی نیست؛ باید ابزاری انتخاب کنی که زبان مدل تصویرساز مقصد را بشناسد.

وقتی یک پرامپت ساده‌ی فارسی غافلگیرت می‌کند

تصور غالب این است که پرامپت خوب یعنی پاراگراف‌های طولانی انگلیسی پُر از جزئیات فنی. اما تجربه‌ی کار با مدل Nano Banana 2 این باور را زیر سؤال می‌بَرد. اولین باری که با این مدل پرامپت فارسی نوشتم، نتیجه واقعاً اعجاب‌انگیز بود. نه چندین خط توضیح، نه اصطلاحات پیچیده — فقط یک خط پرامپت فارسی و خروجی فوق‌العاده.

نکته‌ی جالب‌تر اینکه با یک اصلاح ساده در پرامپت، تصویر دوم دقیقاً به نتیجه‌ی مطلوب رسید. این یعنی لزوماً نباید از صفر شروع کنی؛ گاهی یک تغییر کوچک — مثلاً عوض کردن زاویه‌ی دوربین یا اضافه کردن یک صفت — کافی است.

درس بزرگ این تجربه: مدل‌های جدید خیلی بهتر از قبل فارسی می‌فهمند. پس لازم نیست حتماً به انگلیسی پرامپت بنویسی تا نتیجه‌ی خوب بگیری.

بزرگ‌ترین اشتباه مبتدی‌ها: پرامپت‌های بیش از حد طولانی

رایج‌ترین اشتباهی که در پرامپت‌نویسی تصویر دیده‌ام، نوشتن پرامپت‌های طولانی و شلوغ است. آدم فکر می‌کند هرچه بیشتر توضیح بدهد، مدل بهتر می‌فهمد. ولی واقعیت برعکس است: پرامپت‌های طولانی معمولاً مدل را گیج می‌کنند و خروجی نهایی از هر بخش کمی می‌گیرد بدون اینکه هیچ‌کدام درست پیاده شود.

راه‌حل؟ به جای پرامپت طولانی، یک عکس مرجع اضافه کن.

مثلاً فرض کن می‌خواهی پرتره‌ای با نور سینمایی و رنگ‌های گرم پاییزی بسازی. به جای نوشتن ده خط درباره‌ی نور و رنگ و کنتراست، یک عکس مرجع که همین حس را دارد آپلود کن و بنویس: «استایلش شبیه این عکس باشد.» نتیجه معمولاً بسیار دقیق‌تر از توصیف متنی است.

ترکیب عکس مرجع و پرامپت کوتاه: فرمول طلایی

بهترین نتایج وقتی حاصل می‌شود که:

  • پرامپت متنی‌ات کوتاه و متمرکز باشد (سوژه + حس کلی + یکی دو جزئیات کلیدی)
  • یک یا چند عکس مرجع برای استایل، ترکیب‌بندی یا رنگ‌بندی ضمیمه کنی
  • در تکرارهای بعدی، فقط یک عنصر را تغییر بدهی تا بفهمی چه چیزی روی خروجی اثر گذاشت

در استودیوی مدهوش امکان ارسال تا ۱۰ عکس مرجع همراه با پرامپت وجود دارد. یعنی می‌توانی یک عکس برای استایل، یکی برای ترکیب‌بندی و یکی برای پالت رنگی بفرستی و پرامپتت را خیلی دقیق‌تر کنی — بدون اینکه مجبور باشی همه‌چیز را با کلمات توضیح بدهی.

چند نکته‌ی سریع برای پرامپت‌نویسی بهتر

  • اول سوژه، بعد جزئیات: «پرتره زن جوان ایرانی، نور طبیعی پنجره، پس‌زمینه مینیمال» بهتر از توضیح یک پاراگرافی است.
  • از صفات حسی استفاده کن: «گرم»، «مه‌آلود»، «کنتراست بالا» — اینها را مدل‌ها خوب می‌فهمند.
  • منفی بنویس اگر لازم شد: اگر مدل چیزی اضافه می‌کند که نمی‌خواهی، در پرامپت منفی (negative prompt) مشخص کن.
  • تکرار کن، ولی هوشمند: هر بار فقط یک چیز تغییر بده تا بفهمی دقیقاً کدام بخش پرامپت روی خروجی اثر دارد.

جمع‌بندی

پرامپت‌نویسی حرفه‌ای نه به طول پرامپت ربط دارد نه به پیچیدگی‌اش. کلید کار دقت، اختصار و استفاده‌ی هوشمند از عکس مرجع است. مدل‌های جدید فارسی را هم خوب می‌فهمند، پس از جایی که راحت‌تری شروع کن. اگر می‌خواهی این تکنیک‌ها را عملی امتحان کنی، مدهوش محیط خوبی برای آزمایش پرامپت‌های مختلف با عکس مرجع است — ببین با یک خط پرامپت فارسی و یک عکس الهام‌بخش، چه خروجی‌ای می‌گیری.