كيفية الحصول على شخصيات متسقة في صور الذكاء الاصطناعي (بدون أن تبدو كرتونية)
قضيت ثلاثة أسابيع في محاولة إنشاء شخصية متسقة عبر صور ذكاء اصطناعي متعددة. كل محاولة بدت وكأنها شخص مختلف.
الدروس كلها قالت نفس الشيء: "استخدم نفس البذرة" أو "حافظ على أمرك متطابقاً." لم ينجح أي منهما.
لماذا تفشل معظم التقنيات
إليك ما لا يخبرك به أحد: Midjourney ومولدات الذكاء الاصطناعي الأخرى لا تفهم "نفس الشخصية." إنها تفهم الأنماط البصرية.
عندما تعيد استخدام بذرة، تحصل على تكوين وإضاءة مماثلين. لكن الوجه يتغير. الملابس تتحول. النسب تنحرف.
الحفاظ على أمرك متطابقاً لا يساعد أيضاً لأن الأوصاف العامة مثل "امرأة شابة بشعر بني" تطابق ملايين الوجوه المحتملة.
التقنية التي تعمل فعلاً
اكتشفت هذا بالصدفة. ولّدت شخصية واحدة أعجبتني، ثم استخدمت أداة وصف الصور لاستخراج كل تفصيلة بصرية.
ليس فقط "شعر بني" بل "شعر بني كستنائي بطول الكتف مع موجة طبيعية، فرق جانبي، إبرازات دقيقة تلتقط الضوء."
ليس فقط "عيون زرقاء" بل "عيون زرقاء رمادية على شكل لوز، طية جفن خفيفة، رموش داكنة."
كلما كان حمضك النووي البصري أكثر تحديداً، كلما بقيت شخصيتك أكثر اتساقاً عبر التوليدات.
مثال حقيقي: قبل وبعد
أمري الأصلي: "امرأة شابة في وضعيات مختلفة، شعر بني، ملابس غير رسمية"
النتيجة: كل صورة كانت شخصاً مختلفاً. لون الشعر تغير. بنية الوجه تحولت. عدم اتساق تام.
بعد استخراج الحمض النووي البصري المفصل: "امرأة، 28-32 سنة، شعر بني كستنائي بطول الكتف مع موجة طبيعية، فرق جانبي، عيون زرقاء رمادية على شكل لوز، شكل وجه بيضاوي، عظام خد محددة، أنف مستقيم، شفاه ممتلئة، بشرة فاتحة بدرجات دافئة، بنية رياضية 5'6"
ثم أضفت تنويعات الوضعية: "واقفة مع ذراعين متقاطعتين"، "جالسة على كرسي تميل للأمام"، "تمشي نحو الكاميرا."
فجأة كان لدي نفس الشخص في وضعيات مختلفة. ليس مثالياً، لكن 80% متسق بدلاً من 0%.
العملية خطوة بخطوة
الخطوة 1: ولّد صورة شخصيتك الأولى بأكبر قدر ممكن من التفاصيل.
الخطوة 2: استخدم أداة تحويل الصورة إلى أمر لاستخراج الوصف البصري الدقيق الذي أنشأه الذكاء الاصطناعي.
الخطوة 3: انسخ قسم الوصف الجسدي (الوجه، الشعر، الجسم، لون البشرة) في ملاحظة منفصلة. هذا هو الحمض النووي لشخصيتك.
الخطوة 4: لكل صورة جديدة، الصق الحمض النووي للشخصية أولاً، ثم أضف وصف الوضعية/المشهد/الملابس الجديد بعده.
الخطوة 5: حافظ على الإضاءة وزاوية الكاميرا متشابهة عبر اللقطات. "ضوء طبيعي ناعم، زاوية كاميرا على مستوى العين" يعمل بشكل جيد.
ما الذي لا يزال يحدث خطأ
هذا ليس سحراً. ستحصل لا تزال على تباينات. أحياناً يتحول طول الشعر قليلاً. أحياناً تغير زاوية الوجه الملامح.
مولدات الذكاء الاصطناعي ليست مصممة لاتساق الشخصية. إنها مصممة للتنوع. أنت تعمل ضد وظيفتها الأساسية.
لكن اتساق 80% يتفوق على 0%. وهو كافٍ لأعمال الفن المفاهيمي أو القصص المصورة أو أعمال التطوير البصري.
القيد الذي لا يذكره أحد
هذه التقنية تعمل بشكل أفضل للشخصيات الواقعية. الشخصيات الأسلوبية أو الكرتونية أصعب لأن الذكاء الاصطناعي لديه مساحة تفسير أكبر.
أيضاً، تغييرات الوضعية الشديدة (من منظر أمامي إلى جانبي) ستظهر تبايناً أكثر من الزوايا المماثلة.
لماذا هذا مهم لعملك
إذا كنت تنشئ قصصاً بصرية أو حملات تسويقية أو مفاهيم شخصيات، فأنت تحتاج إلى الاتساق. العملاء يلاحظون عندما تبدو "نفس الشخصية" وكأنها ثلاثة أشخاص مختلفين.
هذه التقنية تمنحك سيطرة كافية لتقديم عمل احترافي دون توظيف رسام لكل تكرار.
ابدأ في إنشاء شخصيات متسقة
المفتاح هو استخراج الحمض النووي البصري المفصل من توليدك الناجح الأول. أداة وصف الصور بالذكاء الاصطناعي من ImagePrompter تمنحك التفصيل الدقيق الذي تحتاجه.
احصل على شخصيات متسقة في صور الذكاء الاصطناعي الخاصة بك — أول 10 أوصاف مجانية.