Skip to main content

ความรู้ทั่วไปเกี่ยวกับ Model

Model ถ้าจะจัดหมวดหมู่สามารถจัดได้ง่าย ๆ เป็น 2 ประเภทคือ

  • โมเดลหลักหรือ Checkpoint ตัวอย่างง่าย ๆ ก็คือ Stable Diffusion เองที่มี prompt หลายกหลายไว้ทำได้ทุกอย่างแต่ไม่เก่งสักอย่าง โดยเวลาใช้งานจะต้องมีโมเดลประเภทนี้เป็นฐานในการสร้างภาพ
  • โมเดลเสริมหรือ Finetune คือไว้จูนโมเดลหลักให้มีความเฉพาะตัวมากขึ้น โมเดลพวกนี้ที่นียมจะแบ่งย่อยเป็น 2 ตัวคือ
    • Embedding (Textual Inversion,TI) - มีหลักการทำงานคือเมื่อสั่ง generate ภาพแล้วมีการเรียกใช้ ตัว TI จะทำการแทรก prompt ของตัวโมเดลเองเขาไปใน prompt หลักที่เรากรอกพร้อมแทรกภาพของ TI เข้าไปในการ gen แต่ละ step
    • LoRA - มีหลักการทำงานคือเมื่อสั่ง generate แล้วจะอ่าน prompt หลักที่เรากรอกและส่งภาพแทรกเข้าไปในตัวโมเดลเลยทันที
  • ปัญหาของ Finetune กับ Checkpoint สามารถพบเจอได้เสมอ เช่นบางตัวใช้ด้วยกันไม่ได้ ใส่คำสั่งแล้วไม่ Tune ตาม Finetune ที่เราใส่ ไม่ก็ภาพเละภาพพัง ของพวกนี้ขึ้กับการลองผิดลองถูกไปเรื่อย ๆ บางตัวอาจปรับไปปรับมาก็อาจใช้ได้ อะไรทำนองนั้น
โมเดลแต่ละตัวมีวิธีใช้งานที่ไม่เหมือนกัน และ prompt ก็ไม่เหมือนกัน บางตัวมี prompt เฉพาะทางต่างหากอีก ก่อนที่จะโหลดมาใช้งานควรอ่านและทำความเข้าใจหลักการของ Model แต่ละตัว เพื่อให้งานออกมาดีที่สุด

Model ที่แนะนำ

Checkpoint
  • ChilloutMix - สำหรับทำภาพแนว photorealistic, 3D
  • HassanBlend - สำหรับทำภาพแนว photorealistic, 3D

  • Realistic Vision- สำหรับทำภาพแนว realistic และ photorealistic

  • DreamShaper - สำหรับทำภาพแนว 3D และ Anime
LoRA

ส่วนมากจะเป็นโมเดลหน้าตาหรือ art style บางอย่างที่เฉพาะเจาะจง

Textual Inversion

ส่วนมากจะเป็นโมเดลหน้าตาหรือ art style บางอย่างที่เฉพาะเจาะจง

  • Ulzzang-6500 (Korean doll aesthetic) - ออลจัง พูดง่าย ๆ คือโมเดลรวมหน้าสาวเกาหลีหน้าตาดี
  • Pure Eros Face - รวมหน้าตาแนว kpop idol หรือสาวหน้าตาดีใน IG
  • Deep Negative - ใส่ใน Negative Prompt เพื่อป้องกันภาพประหลาด ๆ คน 3 ขา 4 แขน และอื่น ๆ โผล่ออกมา
  • EasyNegative - ใส่ใน Negative Prompt เพื่อป้องกันภาพประหลาด ๆ คน 3 ขา 4 แขน และอื่น ๆ โผล่ออกมา

แหล่งหา Models

ด้านล่าง คือร่างเฉย ๆ ยังทำไม่เสร็จ

Model Training


Embedding, Textual Inversion

อ่านต่อได้ที่ ฝึกโมเดลโดย Embedding Model Training

LoRA

GUI

 https://github.com/bmaltais/kohya_ss.git


Colab

https://github.com/cloneofsimo/lora