أوزان الموجهات ومحلل النصوص الجديد (تجريبي)
محلل الأوزان الجديد، محدّث
تم التحديث في 11 يونيو مع أمثلة أوضح وتمارين واختبار صغير
الأوزان هي خاصية جديدة في واجهة مستخدم الويب وروبوت تيليجرام خاصتنا، أصبحت ممكنة بفضل نظام فرعي يُسمى محلل النص، وهو حرفيًا جزء من شيفرة تحاول فهم الكلمات الأكثر أهمية بالنسبة لك. محلل النص القديم لم يكن يدعم الأوزان، أما الجديد يدعمها. يمكنك التنقل بين الاثنين.
واجهة مستخدم الويب: اضغط على الخيارات المتقدمة وقم بتبديل هذا التبديل لتشغيله:
برقية: إضافة هذا الأمر عند التقديم:
render / / المحلل: جديد موجهك يذهب هنا (كلب:2) إلخ
ما لم يتم استدعاء أحد هذه الأوزان، يتم تجاهل الأوزان. يختفي أمر المحلل التحليلي عند انتهاء الفترة التجريبية.
مقدمة في الأوزان
You’ve probably seen an Stable Diffusion prompt that looks like thing like this: <yae-miko:0.7>. This is a way of adding or subtracting its effect from a prompt, where the default value is 1, too much is 2, and a negative number is bad news. It is similar to negative guidance, where things get eerie.
Side note about syntax: In our system, pointed brackets like <this> means AI model, like a LoRA and round parenthesis (like this) are used for words, also called Tokens. This guide teaches both kinds.
نطاقات الوزن والافتراضات الآمنة
العدد الأكبر من 0، حتى لو كان كسراً، يظل وزناً موجباً. لذا، على الرغم من أن 0.7 يبدو أقل من 1 كامل، فإن تعبيرًا مثل (كلب: 0.7) لا يزال يعني أن صورة ما للكلب ستدخل في الصورة. أقل من 0 هو رقم سالب، والسالب عادةً ما يكون خبرًا سيئًا.
في الأوزان، لا تعمل الأوزان السلبية مثل المطالبات السلبية. ربما تقصد الصفر وليس السالب. الوزن السالب هو منطقة الشفق، تصبح الأمور غريبة مثل السالب Guidance. ممكن، لكن غريب.
الوزن الأكثر استخدامًا هو 0.7
خاصة بالنسبة لـ LoRAs. يعتبر الكثيرون أن 0.7 هو المكان الأكثر أمانًا للبدء، لأنه يعطي حق الطريق بحيث يمكن للنموذج الأساسي أن يضبط الفن style ، ولكنه لا يزال موجودًا للقيام بوظيفته. عند استخدام LoRAs على وجه الخصوص، نادرًا ما ترغب في استخدام وزن 1 أو أكثر إلا إذا كنت تريد تأثيرًا جريئًا للغاية.
الشكل 1: الأوزان مقابل الموجهات الإيجابية
ثلاث طرق للتعبير عن الاهتمام الزائد بكلمة كلب هي:
(كلب:1.1) و (كلب) و ((كلب:1.1))، ولكن لا يُنصح بالأخير بشكل عام لأنه يجعل الأمور أكثر صعوبة control وقد يؤدي إلى نتائج سيئة.
لماذا تعتبر الأوزان مفيدة
المطالبات المرجحة مفيدة للتعبير عن الأفكار النسبية. على سبيل المثال: render صورة كلب له بعض سمات القط، يمكنك المطالبة بـ
/render /parser:new a (cat:2,dog:0.5)
لاحظ كيف أن الأنف والكفوف تشبه الكلاب بعض الشيء، لكنها في الأساس قطة.
ملاحظة جانبية: تذكر أن ترتيب الكلمات مهم أيضًا، أكثر من الأوزان. فإذا بدّلنا ترتيب هاتين الكلمتين البسيطتين، تصبح الصورة مختلفة، على الرغم من بقاء الأوزان كما هي. في حالة المزج بين حيوانين، من الصعب تمييز هذه الفكرة، لذا دعونا blend أكثر concepts التالي.
نطاقات جيدة للتذكر
- الوسط هو 1
- المطالبات الإيجابية مثل هذا
- (good:0.7) <– weaker positive
- (good:1.3) <–stronger positive
- مطالبات سلبية مثل هذه [(شيء:1)، (شيء:1.3)، شيء:0.7)]
- استخدم الأوزان السالبة مع LoRA فقط (على مسؤوليتك الخاصة!)
كلب - محايد
(كلب) - الكلب مهم 1.1 مرة
(الكلب:1) - محايد
(الكلب:1.1) - الكلب مهم 1.1 مرة
يعمل المزج بين التركيب الإيجابي والأوزان الإيجابية (ولكن لا يُنصح به)
((كلب:0.5)) - الكلب هو 0.5x يتم تقويته من خلال بناء الجملة (الموجب)
((كلب: 2.0)) - الكلب 2x) - الكلب 2x تقويها صيغة (موجب) ومن المرجح أن تكسر render لأنها تجعل هذا الموجه الواحد قويًا جدًا
ولكن لا يمكن قول الشيء نفسه بالنسبة للمطالبات السلبية
كلب - محايد
[كلب] - موجه سلبي قياسي، مما يعني أنه 1.1 مرة غير مشجع
[كلب:2] - يتم تجاهل 2x، وهذا يعالج فقط كمطالبة سلبية 1.1x فقط
[[كلب:2]] - يتم تجاهل 2x أيضًا، وتحل محلها صيغة [سالب]
هل حصلت عليه؟ اختبر نفسك
س) هل يمكنك استخدام الأوزان بدون ()؟ على سبيل المثال، هل جيد:1.6 صالح، أم يجب عليك استخدام (جيد:1.6)؟
أ) يجب عليك استخدام (جيد:1.2)
س) كيف يعمل مع السلبيات؟ بنفس الطريقة؟ [سيئة: 1.6]؟
أ) يجب عليك استخدام [(سيء: 1.2)] لكي تعمل بشكل صحيح. أيضًا لا تقلق بشأن () داخل [] مع الوزن المضاف، حيث إن تأثيرها غير موجود.
درجات الدقة
أما بالنسبة للقيم العشرية، فإن درجة أو درجتين أكثر من كافية. في اختبارنا، (الكلب: 0.55) لا يختلف كثيرًا عن (الكلب: 0.55348567) عندما تكون جميع القيم الأخرى مغلقة.
عندما تختبر الأوزان النسبية، تذكر أن نظامنا يعيّن قيمًا عشوائية لـ seed و guidance و sampler. إذا لم يتم تعيين هذه القيم، فستحصل على صور مختلفة جدًا في كل مرة حسب التصميم. لنقم ببعض التمارين حيث تكون هذه القيم هي نفسها دائمًا ونقارن.
تمرين: الأحمر والأزرق والكلب والقط
لدينا هنا بعض القطط التي تشبه الكلاب، بعضها أزرق وبعضها أحمر. استخدم ما تعلمته لمحاولة إزالة لون أو سمة حيوان من الصورة، هل يمكنك فعل ذلك؟ بصرف النظر عن الأوزان، Guidance مهم أيضًا، يمكنك وضع أي مطالبات تريدها ولكن مع انخفاض guidance سيتجاهل الذكاء الاصطناعي معظم طلباتك على أي حال. لذا اضبط guidance على 13 حتى يستمع إليك جيدًا.
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog] <dreamshaper6>
لنبدأ بصورة control . بدون أوزان. الآن دعونا نحاول إزالة اللون الأحمر.
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, (red dog:2)] <dreamshaper6>
لقد رفعنا الوزن السالب لـ "كلب أحمر" تخلصنا من الرمز "كلب" والرمز "أحمر"، لذا فهي الآن تشبه القط بشكل أوضح ولا يوجد حيوان أحمر في الصورة.
لنجرب تمريناً آخر: هل يمكنك التخلص من كل القطط؟
الحل الممكن هو:
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 (blue cat:0.1), (red dog:2), [(blue cat:2), (red dog:0.1)] <dreamshaper6>
كان التخلص من القطة الزرقاء أصعب، ربما لأنها كانت الأولى في الترتيب الفوري. لذا تم تبديل الكثير من الأوزان للتخلص منها.
التمرين 1: لماذا ينتج عن هذا الموجه نفس الصورة تقريبًا مثل الصورة الأولى control ؟
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, red dog:2] <dreamshaper6>
الإجابة: لأن القوس مفقود داخل المطالبة السلبية. ما تمت معالجته لم يكن الأوزان، ولكن تم تجاهل [موجه سالب] ضعيف [موجه سالب] وزن 2 سالب. بدون القوس، يعني حرفياً "رقم 2".
الآن دعنا نجرب الأقواس المربعة المزدوجة كبديل للأقواس، هل ستعمل بنفس طريقة عمل الأقواس داخل علامة سالبة؟
/render /seed:32745 /sampler:ddim /guidance:13 /parser:new /images:1 blue cat, red dog, [blue cat, [red dog:2]] <dreamshaper6>
هنا، ما تتم معالجته هو سالب قوي مزدوج [[هكذا]] وتم تجاهل الأوزان أيضًا. إذن نحن نعلم الآن أن هذا لا يجدي نفعًا، فهو يحتاج إلى أقواس. ولكن إذا أردنا فقط التخلص من الكلاب، فاستخدام السالبة بدلًا من الأوزان هي أيضًا استراتيجية صحيحة. أترى؟ اختفت صفات الكلاب بسبب السالبة الأقوى. إذا كان هذا كل ما أردناه، فلا حاجة للأوزان. السالب البسيط يعمل.
التمرين 2: اكتشف الخطأ
هل ستعمل هذه المطالبة على النحو المطلوب؟
Figure 1 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres:2, blurry:2, worst quality:2, pixelated:2] <sushimix>
أو ربما هذا؟
Figure 2 - /render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [lowres;2, blurry;2, worst quality;2, pixelated;2] <sushimix>
الإجابة الصحيحة هي أن كلاهما لن يعمل بشكل صحيح, فكلاهما خاطئ. فكلاهما ينقصه (قوسان منقوصان) لذا لا توجد أوزان متماسكة. بالإضافة إلى ذلك، يحتوي الشكل رقم 2 على خطأ مطبعي متعمد من الأقواس المنقوطة لإثبات نقطة ما - كلاهما ينتج عنهما نفس الصورة بشكل أساسي. النتائج مبينة أدناه، التغييرات طفيفة جدًا بسبب الاختلاف الرمزي للخطأ؛ حيث تمت معالجتها ككلمات. كونهما نتج عنهما اختلافات طفيفة في التظليل هو أمر اعتباطي، فهذا ليس شيئًا.
يمكننا أن نأخذ نفس seed ونجعل هذه الأوزان تشتعل، وفجأة تصبح نفس المطالبة فجأة صورة مختلفة تمامًا.
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2), (blurry:2), (worst quality:2), (pixelated:2)] <sushimix>
الأمر متروك لك سواء وضعتهم بشكل منفرد بين قوسين أم لا، أو استخدمت الأوزان والفواصل في قوس واحد طويل. كلاهما يعملان وينتج عنهما صورة متشابهة بالنسبة لبعضهما البعض، لكن الأوزان تعمل في كليهما.
/render /parser:new /clipskip:1 /seed:761614 /sampler:ddim /guidance:11.5 1girl [(lowres:2, blurry:2, worst quality:2, pixelated:2)] <sushimix>
من المؤكد أن هاتين الصورتين جميلتين لذا من الصعب اكتشاف الفروق الدقيقة. إذا ضللت طريقك تمامًا، ارجع إلى استراتيجية الأحمر/الأزرق، الكلب/القطة، للتأكد من أن موجهك يفعل ما تعتقد أنه يفعل.
استخدام الأوزان في واجهة مستخدم الويب
إذا كنت تعرف ما تفعله، فما عليك سوى كتابتها وستعمل كما تعمل في إصدار الكمبيوتر الشخصي من Stable Diffusion. لتشغيل المُحلِّل الجديد في واجهة مستخدم الويب:
- انقر فوق متقدم (أسفل اليسار)
- انقر على زر الأوزان في أعلى يمين الشاشة (في الصورة)
ستكشف الأوزان mode بعد ذلك عن أشرطة التمرير، بحيث يمكنك بسهولة أكبر تعيين الكلمات وتجميع أنواع أخرى من العناصر المرئية concepts معًا لإنشاء تركيبة فريدة من نوعها.
دعنا نستعرض جميع العناصر التي يمكنك اللعب بها في هذه الصفحة:
- أعلى اليمين: علامة تبويب الأوزان مفعلة، بحيث يمكنك كتابة كلمات فردية وإضافة وزن لكل كلمة على حدة، باستخدام شريط التمرير. انقر فوق الزر الرمادي "إضافة كلمة مرجحة" لإضافة المزيد، أو اكتب المطالبة الإيجابية بالكامل هناك إذا كان يجب أن يكون لكل هذه الكلمات وزن متساوٍ.
- يُظهر شريط التمرير الأزرق وزن 1.0. إذا قمت بتحريكه إلى اليسار، سيحول المربع إلى اللون الأحمر، مما يشير إلى أنه سيكون له تأثير سلبي.
- اختياريًا، يمكنك تحديد recipe. الوصفات عبارة عن قوالب سريعة تنشئ نتيجة مرئية مشابهة للصورة المعروضة. للوصفات نموذج أساسي خاص بها، ولكن يمكنك تجاوزه.
- Base art style, or base model, is the over-arching visual style and contents model. The base model has the biggest visual impact over the image. Here the model <revani> aka Rev Animated is selected. Base models do not have weights, they are the foundation that everything else sits on top of.
لقد أضفنا هنا كلمة رئيسية جديدة وأعطيناها وزنًا سالبًا قدره 0.49
يتيح لنا النقر فوق الزر "إضافة Concept" تغيير النموذج الأساسي، أو تكديس المزيد من العناصر المرئية concepts ، مثل الشخصيات والتأثيرات والوضعيات وغيرها.
أنا أصمم حيوانًا خياليًا غريبًا، لذا ذهبت إلى فئة المخلوقات واخترت واحدًا. راجع "أفضل الممارسات واستكشاف الأخطاء وإصلاحها" أدناه لمعرفة كيفية تحقيق أقصى استفادة من هذه الميزة.
إذا أخطأت، يمكنك الضغط على زر السجل والتعديل مرة أخرى.
في الجزء السفلي، ستجد أيضًا زر Brew ، والذي يعيدك إلى الزر السهل غير الموزون mode ، بالإضافة إلى قوائم منسدلة لـ guidance (CFG)، ونسبة العرض إلى الارتفاع، و Steps مقابل عدد Images. render.
تجميعها معاً
لقد أضفنا أيضًا لورا بوزن 1.0. ربما ينبغي تعديلها إلى 0.7 لتكون آمنة، tsk tsk tsk. لذا سيصبح المرئي concept "التنين الصيني" موضوع الصورة، مع قالب المطالبة "خيال غير متحول" الذي ربما يضيف رموزًا مثل "تحفة فنية" و"جودة عالية" مع إضافة مطالبات سلبية شائعة مثل "غير متحول"، إلخ.
وها هي قطتي التنين الكلب التنين بنسبة 70%. في الغالب قط التنين، لأكون منصفاً. أعتقد أن الارتباطات الأقوى مع القطط والتنين في الفن الآسيوي تغلبت على كلبي الأكثر وزناً، لذا يمكنني العودة وتقليل القط أكثر، أو إضافة المزيد من الكلمات عن شكل الكلب لتغيير نتيجتي.
عندما ينتهي بك الأمر مع images غير مناسب تمامًا، يمكنك النقر على "أرشيفي " للرجوع إلى سجل المطالبات الخاص بك، ومسح تلك التي لا تريدها.
عند العمل في تيليجرام، يمكنك أيضًا تنفيذ أمر /delete الأمر لمسح صورة من سجلك وأرشيفك عن طريق الرد على الصورة.
أفضل الممارسات واستكشاف الأخطاء وإصلاحها
تنشأ معظم المشاكل عندما تكون الأوزان مرتفعة للغاية، أو عندما تتعارض concepts . إذا قمت بضبط كل شيء بين 0.5 إلى 0.7 يمكنك تجنب معظم المشاكل.
بعض النماذج حساسة جداً. جرب أقل من 0.1 إذا كانت تعاني من خلل. لقد كتبنا قسم منفصل عن إصلاح مشاكل LoRA الشائعة مع أمثلة.
كم عدد concepts المرئي أكثر من اللازم؟
يمكنك إضافة 2-3 أوزان منخفضة من LoRAs بأمان إلى الصورة، على الرغم من التفكير جيدًا في كيفية تداخلها. إذا لم تعد الصورة، فهذا يعني أن ذاكرة الخادم قد نفدت وتعذّر إكمال الصورة. جرّب عددًا أقل من الصور.
اختر مسودة في الجودة settings ، لاختبار فكرتك. لا معنى للانتظار لفترة أطول إذا كان هناك تعارض concepts ، فمن الأفضل أن تبني فكرتك ببطء وتكرر فكرتك.
القطع الأثرية الزرقاء شائعة
عند العمل مع LoRAs والأوزان، ستواجه حتمًا تعارضات. على سبيل المثال، إضافة LoRA لزومبي وإضافة LoRA لخوذة فارس يعني أن كلاهما سيتنازعان للتأثير على الوجه، وستحدث قطع أثرية زرقاء. إذا حدث ذلك فاخفض أوزانك، أو اختر شكل مرئي مختلف concept. اجعل الأمور بسيطة وقم بالبناء ببطء.
تعود الصورة في صورة مربع ملون، بدون موضوع
هناك بعض النماذج (القليلة جدًا) التي لا تتوافق مع نظامنا، ولكن بشكل عام عندما تكون أوزان LoRAs منخفضة، لا ينبغي أن يحدث ذلك. إذا كنت تحصل على مربع أحمر، اخفض أوزانك. إذا كنت لا تزال تحصل على شيء يشبه الجبال الخضراء أو الضوضاء، يرجى إعلامنا بذلك.
نتائج مختلفة عن شيء رأيته على الإنترنت
نحن معك في ذلك. لا ينشر الجميع أفضل أسرارهم المحفوظة بما في ذلك إصلاح images لمدة 3 ساعات باستخدام inpaint وLightroom. إن المنافسة داخل الانتشار المستقر community لابتكار أفضل images شرسة. هناك القليل من الغش. لا تتورط في ذلك.
في حالة موقع Civitai الشهير، اطلع على ما يقوله المستخدمون الآخرون في التعليقات وتأكد من أنك تستخدم نفس concepts. إذا كان ينقصنا نموذج تحتاجه، فقط أخبرنا وسنقوم بإضافته.
نتائج مختلفة تماماً عن نتائج الكمبيوتر الشخصي المحلي
في هذه الحالة، نريد أن نعرف حقًا - يُرجى الاتصال بنا. قد يكون ذلك بسبب إصدارات مختلفة من نماذج الذكاء الاصطناعي، وفي هذه الحالة يمكننا تحديثها على الفور.
تتم معايرة نظامنا أيضًا بشكل مختلف قليلاً بسبب الأجهزة وبرامج التشغيل ومكونات الويب الأخرى، ولكن يجب أن تكون جودة الصورة العامة قابلة للمقارنة.
إذا كنت تعتقد أنك واجهت خطأ ما، يرجى إعلامنا بذلك.