أخطاء أوامر الصور بالذكاء الاصطناعي التي تكلفك مالاً (وكيفية إصلاحها)
أحرقت 200 رصيد Midjourney في ظهيرة واحدة. حصلت على ثلاث صور قابلة للاستخدام ربما.
المشكلة لم تكن حظاً سيئاً. كنت أرتكب نفس الأخطاء المكلفة التي يرتكبها معظم الناس مع أوامر الصور بالذكاء الاصطناعي.
الخطأ 1: تكديس المصطلحات المتناقضة
اعتدت كتابة أوامر مثل "شخصية كرتونية واقعية" أو "منظر طبيعي بسيط مفصل."
الذكاء الاصطناعي لا يعرف أي تعليمة يعطيها الأولوية. يقسم الفرق ويعطيك شيئاً ليس واقعياً ولا كرتونياً، لا بسيطاً ولا مفصلاً.
الحل: اختر اتجاهاً أسلوبياً واحداً والتزم به. "صورة شخصية واقعية، عدسة 85mm، إضاءة استوديو" أو "شخصية كرتونية بتصميم مسطح، خطوط عريضة جريئة، لوحة ألوان محدودة."
كل إعادة توليد تكلف رصيداً. الأوامر المتناقضة تضمن محاولات متعددة.
الخطأ 2: تجاهل نسب العرض إلى الارتفاع
كنت أولد صوراً مربعة، ثم أدرك أنني أحتاج أفقية، ثم أعيد التوليد. هذا ضعف التكلفة لنفس المفهوم.
Midjourney افتراضياً 1:1. Instagram يحتاج 4:5. صور YouTube المصغرة تحتاج 16:9. رؤوس المدونات تحتاج 3:1.
الحل: أضف --ar 16:9 أو نسبتك المستهدفة لكل أمر. قرر قبل التوليد، وليس بعده.
هذا التغيير الواحد قلل توليداتي المهدرة بنسبة 40%.
الخطأ 3: أوصاف الإضاءة الغامضة
"إضاءة جيدة" أو "إضاءة درامية" لا تعني شيئاً محدداً. الذكاء الاصطناعي يخمن. أنت تعيد التوليد عندما يخمن خطأ.
تعلمت هذا بعد الحصول على 12 تفسيراً مختلفاً لـ"درامي" — بعضها كان به ظلال قاسية، بعضها كان به إضاءة حافة، بعضها كان به جل ملون.
الحل: استخدم مصطلحات إضاءة محددة. "إضاءة خلفية للساعة الذهبية"، "ضوء منتشر ناعم غائم"، "إضاءة جانبية قاسية مع ظلال عميقة"، "إعداد استوديو بثلاث نقاط."
تحقق من أداة وصف الصور لترى كيف تصف الصور الاحترافية إضاءتها. انسخ تلك المفردات.
الخطأ 4: عدم وجود أوامر سلبية
استمررت في الحصول على أصابع إضافية، عناصر غريبة، وعناصر غير مرغوب فيها. كل إصلاح تطلب توليداً آخر.
معامل --no في Midjourney يخبر الذكاء بما يجب تجنبه. معظم الناس يتخطونه.
الحل: أضف دائماً --no extra limbs, distorted, blurry, watermark, text للصور الشخصية. للمنتجات، أضف --no shadows, reflections إذا كنت تحتاج قصاصات نظيفة.
هذا يمنع 60% من التوليدات "مثالية تقريباً لكن..." التي تهدر الرصيد.
الخطأ 5: عدم التعلم مما ينجح
الخطأ الأكثر تكلفة: عدم تحليل الصور الناجحة.
كنت أحصل على نتيجة رائعة واحدة، ثم أبدأ من الصفر في الأمر التالي. لا تعرف على الأنماط. لا بناء للمفردات.
الحل: عندما تحصل على فائز، مرره عبر أداة تحويل الصورة إلى أمر. انظر المصطلحات التقنية التي جعلته يعمل. ابنِ مكتبة أوامر شخصية.
بعد القيام بهذا لمدة أسبوعين، ارتفع معدل نجاح محاولتي الأولى من 15% إلى 70%. هذا 4 أضعاف أقل من الرصيد المهدر.
التكلفة الحقيقية
بسعر 10 دولارات لـ200 ساعة Midjourney السريعة (حوالي 1,000 صورة)، كل توليد يكلف حوالي 0.01 دولار. لا يبدو كثيراً.
لكن إذا كنت تعيد التوليد 5 مرات لكل مفهوم بدلاً من 1-2 مرة، فأنت تنفق 0.05 دولار لكل صورة نهائية بدلاً من 0.02 دولار. هذا أغلى بنسبة 150%.
للمستقلين الذين يولدون 100 صورة لكل مشروع، هذا 5 دولارات مقابل 2 دولار. على مدى 20 مشروعاً، أنفقت 60 دولاراً إضافياً.
ابدأ في إصلاح هذا اليوم
اختر آخر 5 أوامر فاشلة لك. حدد الخطأ الذي ارتكبته. أعد كتابتها بالإصلاحات أعلاه.
سترى فوراً توليدات مهدرة ائج محاولة أولى أفضل.
احصل على أوامر دقيقة تعمل من المرة الأولى — توقف عن حرق الرصيد على التجربة والخطأ.