
By gerogero
Updated: February 7, 2026
Dokumen ini menyediakan pengantar yang komprehensif, lengkap dan terkini kepada model NoobAI-XL .
NoobAI-XL adalah model penggubahan Teks-ke-Gambar yang dibangunkan oleh Laxhar Dream Lab dan ditaja oleh Lanyun.
Sijil model diwarisi daripada fair-ai-public-license-1.0-sd dan mempunyai beberapa sekatan (lihat sijil model NoobAI-XL). Model ini berdasarkan seni bina model SDXL. Model asasnya adalah Illustrious-xl-early-release-v0 . Ia dilatih menggunakan dataset lengkap Danbooru dan e621 (kira-kira 13 juta imej) untuk sejumlah besar pusingan, dengan pengetahuan yang kaya dan prestasi yang cemerlang.
NoobAI-XL mempunyai jumlah pengetahuan yang besar, yang dapat memulihkan gaya puluhan ribu watak 2D dan artis, mengenali sejumlah besar konsep khas dalam 2D, dan mempunyai pengetahuan furry yang kaya.
NoobAI-XL menyediakan versi ramalan bunyi (atau katakan ramalan epsilon) dan ramalan V. Secara ringkas, versi ramalan bunyi menghasilkan imej yang lebih pelbagai dan kreatif, manakala versi ramalan V mengikuti arahan dengan lebih tepat dan menghasilkan imej dengan julat warna yang lebih luas dan pencahayaan yang lebih kuat.
NoobAI-XL mempunyai sokongan komuniti ekosistem yang semakin kaya, termasuk pelbagai LoRA, ControlNet , IP-Adapter dan sebagainya.
NoobAI-XL merangkumi satu siri model, terutamanya ramalan bunyi dan ramalan V, yang akan diterangkan secara terperinci kemudian .
Sebelum membaca bahagian ini, pembaca perlu sudah memahami penggunaan asas mana-mana jenis UI imej mentah seperti WebUI , ComfyUI , forge atau reForge . Jika tidak, pembaca perlu belajar dari sini atau dari Internet (seperti Bilibili, dan lain-lain).
Jika anda tidak tahu model mana yang perlu dimuat turun, anda boleh melayari sini .
Model NoobAI-XL dibahagikan kepada dua kategori: ramalan bunyi ( ramalan epsilon , atau disingkat sebagai eps-pred ) model dan ramalan V ( ramalan v , atau disingkat sebagai v-pred ) model. Model yang mempunyai perkataan “eps”, “ramalan-epsilon”, atau “eps-pred” dalam nama mereka adalah model ramalan bunyi, yang tidak banyak berbeza daripada model lain. Jika anda menggunakannya, anda boleh teruskan ke bahagian ini. Model yang mempunyai perkataan “v” atau “v-pred” dalam nama mereka adalah model ramalan V, yang berbeza daripada kebanyakan model konvensional. Sila baca panduan pemasangan dalam bahagian ini dengan teliti! Prinsip model ramalan V boleh didapati dalam artikel ini .
Ramalan V adalah teknik Latihan Model yang agak jarang. Model yang dilatih menggunakan teknik ini dipanggil model ramalan V. Berbanding dengan ramalan bunyi, model ramalan V dikenali kerana kepatuhan yang lebih tinggi kepada petunjuk, julat warna yang lebih komprehensif, dan cahaya dan bayang yang lebih kuat, diwakili oleh NovelAI Diffusion V3 dan COSXL . Oleh kerana kemunculannya yang lewat dan model jenis ini yang lebih sedikit, beberapa projek grafik utama dan UI tidak menyokongnya secara langsung. Oleh itu, jika anda merancang untuk menggunakan model ramalan V, anda memerlukan beberapa operasi tambahan. Bahagian ini akan memperkenalkan penggunaannya yang khusus. Jika anda menghadapi sebarang kesulitan semasa penggunaan, anda juga boleh terus menghubungi mana-mana pengarang model untuk mendapatkan bantuan.
Forge dan reForge adalah dua UI penghasilan imej AI yang dibangunkan oleh lllyasviel dan Panchovix masing-masing, kedua-duanya adalah versi yang diperluas dari WebUI. Cawangan utama mereka menyokong model ramalan V, dan mod operasi hampir sama dengan WebUI, jadi mereka disyorkan. Jika anda telah memasang salah satu daripada mereka, anda hanya perlu menjalankan git pull untuk mengemas kini di direktori pemasangannya dan mulakan semula; jika anda belum memasangnya, anda boleh merujuk kepada tutorial dalam talian untuk pemasangan dan penggunaan.
ComfyUI adalah UI penghasilan imej yang dibangunkan oleh comfyanonymous , membolehkan pengguna mengendalikan nod dengan bebas, dinamakan kerana fleksibiliti dan profesionalismenya. Menggunakan model ramalan V hanya memerlukan penambahan nod tambahan.
WebUI adalah projek stable-diffusion-webui yang dibangunkan oleh AUTOMATIC1111 . Pada masa ini, cawangan utama WebUI, yang merupakan cawangan utama, tidak menyokong model ramalan V dan perlu beralih ke dev. Sila ambil perhatian bahawa kaedah ini tidak stabil dan mungkin mempunyai pepijat. Penggunaan yang tidak betul boleh menyebabkan kerosakan yang tidak dapat dipulihkan kepada WebUI. Oleh itu, sila buat salinan sandaran WebUI anda terlebih dahulu. Kaedah khusus adalah seperti berikut:
git checkout dev dan tekan Enter.Diffusers adalah perpustakaan model penggubahan Python yang dikhaskan. Penggunaan ini memerlukan pengguna mempunyai asas kod tertentu, dan disyorkan untuk digunakan oleh pemaju dan penyelidik. Contoh kod:
import torch
from diffusers import StableDiffusionXLPipeline, EulerDiscreteScheduler
ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(
ckpt_path,
use_safetensors=True,
torch_dtype=torch.float16,
)
scheduler_args = {"prediction_type": "v_prediction", "rescale_betas_zero_snr": True}
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, **scheduler_args)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")
prompt = """masterpiece, best quality, john_kafka, nixeu, quasarcake, chromatic aberration, film grain, horror \(theme\), limited palette, x-shaped pupils, high contrast, color contrast, cold colors, arlecchino \(genshin impact\), black theme, gritty, graphite \(medium\)"""
negative_prompt = "nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
num_inference_steps=28,
guidance_scale=5,
generator=torch.Generator().manual_seed(42),
).images[0]
image.save("output.png")
NoobAI-XL tidak mempunyai keperluan keras untuk perkataan prompt, dan tindakan yang disyorkan dalam artikel ini adalah tambahan yang baik.
NoobAI-XL mengesyorkan agar pengguna menggunakan tag sebagai prompt untuk menambah kandungan yang diingini. Setiap tag adalah perkataan atau frasa dalam bahasa Inggeris yang dipisahkan oleh koma dalam bahasa Inggeris “,”, dan tag yang diambil terus dari Danbooru dan e621 mempunyai kesan yang lebih kuat. Untuk penambahbaikan lanjut, lihat spesifikasi prompt kemudian.
Kami mencadangkan agar sentiasa menambah tag estetik “very awa” dan tag kualiti “masterpiece” kepada prompt anda.
NoobAI-XL menyokong penghasilan watak dan gaya artis yang berkualiti tinggi, kedua-duanya diaktifkan oleh tag, yang kami panggil “kata pemicu“. Antara mereka, kata pemicu untuk watak adalah nama watak mereka; kata pemicu untuk gaya artis adalah nama artis. Jadual kata pemicu lengkap boleh dimuat turun dari noob-wiki . Penjelasan terperinci tentang kata pemicu boleh didapati di bawah .
Serupa dengan NovelAI, NoobAI-XL menyokong tag khas seperti kualiti, estetika, tahun penciptaan, tempoh penciptaan, dan penilaian keselamatan untuk tujuan tambahan. Pembaca yang berminat boleh melihat pengenalan terperinci dalam teks berikut .
Jadual berikut mencadangkan tiga parameter penghasilan: sampler , langkah pengambilan , dan CFG Scale . Bold amat disyorkan; bold dalam merah adalah keperluan keras. Menggunakan nilai parameter lain daripada ini akan membawa kesan yang tidak dijangka.
| Nombor versi | Semua versi ramalan bunyi | Versi Ramalan V 1.0 | Versi Ramalan V 0.9r | Versi Ramalan V 0.75s | Versi Ramalan V 0.65s | Versi Ramalan V 0.6 | Versi Ramalan V 0.5 | Versi Ramalan V Beta |
| Parameter yang Disyorkan | Sampler: Euler A CFG: 5~ 7 Langkah pengambilan: 28~ 35 | Sampler: Euler CFG: 3.5 ~ 5.5 Langkah pengambilan: 32~ 40Sampler: Euler A CFG: 3 ~ 5 Langkah pengambilan: 28~ 40 | Sampler: Euler CFG: 3.5 ~ 5.5 Langkah pengambilan: 32~ 40Sampler: Euler A CFG: 3 ~ 5 Langkah pengambilan: 28~ 40 | Sampler: Euler A CFG: 3 ~ 5 Langkah pengambilan: 28~ 40 | Sampler: Euler A atau Euler CFG: 3.5 ~ 5.5 Langkah pengambilan: 32~ 40Sampler: Euler A CFG: 5 ~ 7 Langkah pengambilan: 28~ 40 | Sampler: Euler CFG: 3.5~ 5.5 Langkah pengambilan: 28~ 35 | Sampler: Euler CFG: 3.5~ 5.5 Langkah pengambilan: 28~ 40 | Sampler: Euler A CFG: 5~ 7 Langkah pengambilan: 28~ 35 |
Bagi model ramalan V, parameter berikut disyorkan untuk (i) mengoptimumkan warna, pencahayaan, dan butiran; (ii) menghapuskan kesan kelebihan saturasi dan pendedahan berlebihan; dan (iii) meningkatkan pemahaman semantik.
resolusi (lebar x tinggi) imej yang dihasilkan adalah parameter penting. Secara amnya, atas sebab seni bina, semua model SDXL termasuk NoobAI-XL perlu menggunakan resolusi tertentu untuk mencapai kesan terbaik. Tiada lebih atau kurang piksel dibenarkan, jika tidak kualiti imej yang dihasilkan akan terjejas. Resolusi yang disyorkan untuk NoobAI-XL ditunjukkan dalam jadual di bawah:
| Resolusi (W x H) | 768×1344 | 832×1216 | 896×1152 | 1024×1024 | 1152×896 | 1216×832 | 1344×768 |
| Peratusan | 9:16 | 2:3 | 3:4 | 1:1 | 4:3 | 3:2 | 16:9 |
Anda juga boleh menggunakan resolusi kawasan yang lebih besar, walaupun ini tidak stabil. (Menurut penyelidikan SD3, apabila kawasan yang dihasilkan menjadi $$$$kali ganda daripada asal, ketidakpastian model akan menjadi kali ganda daripada asal $$k^$$.) Kami mencadangkan agar kawasan imej yang dihasilkan tidak melebihi 1.5 kali ganda asal. Sebagai contoh, 1024×1536.
Jika anda berminat dengan model ini dan ingin mengetahui lebih lanjut mengenainya, bahagian ini menyediakan panduan terperinci untuk menggunakan model tersebut.
NoobAI-XL merangkumi beberapa versi berbeza dari model asas untuk satu siri. Jadual berikut merumuskan ciri-ciri setiap versi.
| Nombor versi | Jenis ramalan | Link muat turun | Iterasi sejak | Ciri versi |
| Akses Awal | Ramalan bunyi | CivitAIHuggingface | Illustrious-xl-early-release-v0 | Versi terawal, tetapi sudah mempunyai latihan yang mencukupi. |
| Epsilon-pred 0.5 | Ramalan bunyi | CivitAIHuggingface | Akses Awal | (Disyorkan) Versi yang paling stabil, satu-satunya kelemahan adalah kekurangan pengetahuan tentang konsep yang tidak jelas. |
| Epsilon-pred 0.6 | Ramalan bunyi | Huggingface | Akses Awal 0.5 | (Disyorkan) Versi terakhir latihan UNet sahaja mempunyai kesan konvergensi yang cemerlang. Pasukan ujian dipanggil “178000”, yang disukai oleh ramai orang. |
| Epsilon-pred 0.75 | Ramalan bunyi | CivitAIHuggingface | Epsilon-pred 0.6 | Pemencoder teks (TTE) dilatih untuk mempelajari lebih banyak pengetahuan yang tidak jelas, tetapi prestasi kualiti merosot. |
| Epsilon-pred 0.77 | Ramalan bunyi | Huggingface | Epsilon-pred 0.75 | Dilatih dua epoch lagi berdasarkan Epsilon-pred 0.75, meningkatkan penurunan prestasi. |
| Epsilon-pred 1.0 | Ramalan bunyi | CivitAIHuggingface | Epsilon-pred 0.77 | (Disyorkan) 10 pusingan latihan tambahan untuk mengukuhkan pengetahuan baru tte, keseimbangan prestasi. |
| Uji Pra | Ramalan V | CivitAIHuggingface | Epsilon-pred 0.5 | (Tidak disyorkan) Versi eksperimen awal ramalan V. |
| V-pred 0.5 | Ramalan V | CivitAIHuggingface | Epsilon-pred 1.0 | (Tidak disyorkan) Terdapat masalah kelebihan saturasi. |
| V-pred 0.6 | Ramalan V | CivitAIHuggingface | V-pred 0.5 | (Tidak disyorkan) Berdasarkan keputusan penilaian awal, V-pred0.6 menunjukkan prestasi yang baik dalam liputan pengetahuan yang jarang, mencapai tahap tertinggi di antara model yang diterbitkan sekarang. Pada masa yang sama, model ini secara signifikan meningkatkan masalah penurunan kualiti. |
| V-pred 0.65 | Ramalan V | Huggingface | V-pred 0.6 | (Tidak disyorkan) Terdapat masalah kelebihan saturasi. |
| V-pred 0.65s | Ramalan V | CivitAIHuggingface | V-pred 0.6 | Masalah kelebihan saturasi hampir diselesaikan! Tetapi ia mempunyai masalah artefak, yang akan diselesaikan dalam versi seterusnya. |
| Epsilon-pred 1.1 | Ramalan bunyi | CivitAIHuggingface | Epsilon-pred 1.0 | (Disyorkan) Masalah kecerahan purata telah diselesaikan, dan semua aspek telah meningkat. |
| V-pred 0.75 | Ramalan V | Huggingface | V-pred 0.65 | (Tidak disyorkan) Terdapat masalah kelebihan saturasi. |
| V-pred 0.75s | Ramalan V | CivitAIHuggingface | V-pred 0.65 | (Disyorkan) Menyelesaikan masalah kelebihan saturasi dalam situasi ekstrem, bunyi residual, dan masalah artefak. |
| V-pred 0.9r | Ramalan V | CivitAI | V-pred 0.75 | Dilatih dengan data realisme ~10%. Mempunyai penurunan. |
| V-pred 1.0 | Ramalan V | CivitAI | V-pred 0.75 | (Disyorkan) Kualiti/performance/color yang paling seimbang. |
| Jenis ramalan | Jenis ControlNet | Link | Jenis pemproses awal | Catatan |
| Ramalan bunyi | Hed soft edge | CivitAIHuggingface | softedge_hed | |
| Ramalan bunyi | Anime lineart | CivitAIHuggingface | lineart_anime | |
| Ramalan bunyi | Midas normal map | CivitAIHuggingface | normal_midas | |
| Ramalan bunyi | Midas depth map | CivitAIHuggingface | depth_midas | |
| Ramalan bunyi | Canny contour | CivitAIHuggingface | canny | |
| Ramalan bunyi | Openpose human skeleton | CivitAIHuggingface | openpose | |
| Ramalan bunyi | Manga line | CivitAIHuggingface | manga_line / lineart_anime / lineart_realistic | |
| Ramalan bunyi | Realistic lineart | CivitAIHuggingface | lineart_realistic | |
| Ramalan bunyi | Midas depth map | CivitAIHuggingface | depth_midas | Versi baru |
| Ramalan bunyi | HED scribble | CivitAIHuggingface | scribble_hed | |
| Ramalan bunyi | Pidinet scribble | CivitAIHuggingface | scribble_pidinet | |
| Ramalan bunyi | Tile | CivitAIHuggingface | tile |
Perhatikan bahawa semasa menggunakan ControlNet, anda HARUS padankan jenis pemproses awal yang anda gunakan dengan jenis pemproses awal yang diperlukan oleh ControlNet. Selain itu, anda TIDAK PERLU padankan jenis ramalan model asas dengan jenis ramalan ControlNet.
Akan datang.
Kebanyakan LoRA boleh digunakan untuk kedua-dua versi ramalan bunyi dan ramalan V, dan sebaliknya.
Pertama sekali, kita perlu menjelaskan bahawa peranan prompt adalah untuk membimbing. Prompt yang baik boleh melepaskan potensi model, tetapi prompt yang buruk atau bahkan tidak betul mungkin tidak semestinya menjadikan hasil lebih teruk. Model yang berbeza mempunyai penggunaan prompt yang optimum yang berbeza, dan kesan penyalahgunaan sering kali tidak jelas, dan dalam beberapa kes, ia bahkan boleh meningkatkan. Panduan prompt ini merekodkan teori penghantaran prompt terbaik model, dan pembaca yang berkemampuan juga boleh menggunakannya dengan bebas.
Bahagian ini akan menyediakan panduan terperinci untuk menulis prompt, termasuk standard penulisan prompt, penggunaan khusus kata pemicu peranan dan gaya, penggunaan tag khas, dan sebagainya. Pembaca yang berminat dalam kejuruteraan prompt boleh memilih untuk membaca secara selektif.
NoobAI-XL mempunyai spesifikasi prompt yang sama seperti model asas lain yang menyerupai anime. Bahagian ini akan memperkenalkan secara sistematik spesifikasi penulisan asas prompt dan membantu pembaca menghapuskan salah faham yang biasa dalam komuniti.
Menurut format yang berbeza, prompt boleh dibahagikan kepada dua kategori: tag dan bahasa semula jadi. Yang pertama kebanyakannya digunakan untuk model anime, dan yang kedua kebanyakannya digunakan untuk model kehidupan sebenar. Tanpa mengira prompt mana, kecuali model menyatakan sebaliknya, ia hanya boleh mengandungi huruf, nombor, dan simbol dalam bahasa Inggeris.
Tag terdiri daripada huruf kecil perkataan atau frasa dalam bahasa Inggeris yang dipisahkan oleh koma dalam bahasa Inggeris “,” sebagai contoh, “1girl, solo, blue hair” mengandungi tiga tag, “1girl”, “solo” dan “blue hair”.
Ruang tambahan dan watak baru dalam prompt tidak akan mempengaruhi kesan penghasilan sebenar. Dengan kata lain, “1girl, solo, blue hair” dan “1girl, solo, blue hair” mempunyai kesan yang sama.
Prompt tidak boleh mengandungi sebarang garis bawah “_”. Dipengaruhi oleh laman web seperti Danbooru, penggunaan garis bawah “_” sebagai ganti ruang antara perkataan sebagai tag telah tersebar, yang sebenarnya adalah penyalahgunaan dan akan menyebabkan hasil yang dihasilkan berbeza daripada menggunakan ruang. Kebanyakan model, termasuk NoobAI-XL, tidak mengesyorkan menyertakan sebarang garis bawah dalam prompt. Penyalahgunaan ini boleh mempengaruhi kualiti penghasilan pada tahap terbaik, dan bahkan menjadikan kata pemicu menjadi tidak sah pada tahap terburuk.
Escape kurungan jika perlu. Kurungan, termasuk kurungan bulat (), kurungan persegi [], dan kurungan kerinting {}, adalah simbol yang sangat khas dalam prompt. Tidak seperti simbol umum, dalam kebanyakan UI penghasilan imej, kurungan ditafsirkan sebagai penimbangan kandungan tertentu, dan kurungan yang terlibat dalam penimbangan tidak akan memainkan makna asalnya. Namun, bagaimana jika prompt asal perlu menyertakan kurungan, seperti beberapa kata pemicu? Jawapannya adalah fungsi penimbangan kurungan boleh dihapuskan dengan menambah garis miring terbalik “\” sebelum kurungan. Operasi mengubah makna asal watak dipanggil escape, dan garis miring terbalik juga dipanggil watak escape. Sebagai contoh, jika anda tidak menggunakan garis miring terbalik untuk mengescape, prompt “1girl, ganyu ( genshin impact ) ” akan ditafsirkan secara salah sebagai “1girl, ganyu genshin impact”, di mana “genshin impact” ditimbang dan kurungan hilang. Dengan menambah watak escape, prompt menjadi “1girl, ganyu \ ( genshin impact \) “, seperti yang diharapkan.
Secara ringkas, standardisasi tag dibahagikan kepada dua langkah: (i) menggantikan garis bawah dengan ruang dalam setiap tag, dan (ii) menambah garis miring terbalik “\” sebelum kurungan.
Tag yang diambil terus dari Danbooru dan e621 mempunyai kesan ekspresif yang lebih kuat. Oleh itu, daripada mencipta tag anda sendiri, kami mengesyorkan agar pembaca mencari tag secara langsung di kedua-dua laman web ini. Perlu diingat bahawa tag yang diperoleh secara langsung dengan cara ini dipisahkan dengan garis bawah “_” dan kurungan tidak diescape. Oleh itu, sebelum menambah petunjuk kepada tag dari mereka, anda perlu mengeluarkan ruang dalam tag dan mengescape kurungan. Sebagai contoh, tangani tag dari Danbooru ” ganyu_ (genshin_impact) ” sebagai “ganyu\ (genshin impact\) ” sebelum digunakan.
Jangan gunakan tag meta yang tidak sah. Tag meta ( tag meta ) adalah jenis tag khas di Danbooru yang digunakan untuk menunjukkan ciri-ciri fail imej atau karya itu sendiri. Sebagai contoh, ” highres ” menunjukkan bahawa imej mempunyai resolusi tinggi, ” oil_painting_ (medium) ” menunjukkan bahawa imej dalam gaya lukisan minyak. Namun, tidak semua tag meta berkaitan dengan kandungan atau bentuk imej. Sebagai contoh, ” commentary_request ” menunjukkan bahawa pos Danbooru mempunyai permintaan terjemahan untuk karya tersebut, yang tidak mempunyai hubungan langsung dengan karya itu sendiri dan oleh itu tidak mempunyai kesan.
Kata petunjuk berturutan adalah lebih baik. NoobAI-XL mengesyorkan menulis prompt dalam urutan logik, dari utama ke sekunder. Satu urutan penulisan yang mungkin adalah seperti berikut, untuk rujukan sahaja:
< 1girl/1boy/1other/female/male/… >, < watak >, < siri >, < artis (s) >, < tag umum >, < tag lain >, < tag kualiti & estetik >
Antara mereka, < tag kualiti & estetik > boleh diawal.
Prompt bahasa semula jadi terdiri daripada ayat, setiap satu bermula dengan huruf besar dan diakhiri dengan noktah “.”. Kebanyakan model anime, termasuk NoobAI-XL, mempunyai pemahaman yang lebih baik tentang tag, jadi bahasa semula jadi sering digunakan sebagai tambahan dan bukan komponen utama dalam prompt.
NoobAI-XL menyokong penghasilan langsung sejumlah besar watak buatan peminat dan gaya artis. Watak dan gaya diaktifkan oleh nama, yang juga merupakan tag yang dipanggil kata pemicu. Anda boleh mencari secara langsung di Danbooru atau e621 , dan standardkan tag yang dihasilkan sebagai prompt.
Terdapat beberapa perbezaan dalam cara watak dan artis diaktifkan.
Jadual berikut menunjukkan beberapa kes yang betul dan salah dalam pemicu watak dan gaya:
| Jenis | Perkataan prompt | Betul atau salah | Alasan |
| Peranan | Rei Ayanami | Salah | Nama watak sepatutnya ” ayanami rei “.Tiada tag siri ” neon genesis evangelion ” ditambah. |
| Peranan | watak:ganyu \(genshin impact\), genshin impact | Salah | Menambah awalan “watak:” secara dangkal. |
| Peranan | ganyu_\(genshin impact\) | Salah | Tiada tag yang sepenuhnya dinormalisasi: tidak sepatutnya mengandungi garis bawah.Tiada tag siri ditambah. |
| Peranan | ganyu (genshin impact), genshin impact | Salah | Tiada tag yang sepenuhnya dinormalisasi: kurungan tidak diescape. |
| Peranan | ganyu (genshin impact\), genshin impact | Salah | Tiada tag yang sepenuhnya dinormalisasi: kurungan kiri tidak diescape. |
| Peranan | ganyu \(genshin impact\),genshin impact | Salah | Memisahkan dua tag dengan koma Cina |
| Peranan | ganyu \(genshin impact\), genshin impact | Betul | |
| Gaya artis | oleh wlop | Salah | Menambah awalan “oleh” secara dangkal. |
| Gaya artis | artis:wlop | Salah | Menambah awalan “artis:” secara dangkal. |
| Gaya artis | dino | Salah | Nama artis adalah salah, nama artis aidxl/artiwaifu tidak sepatutnya digunakan, tetapi harus mengikuti Danbooru, jadi ia adalah ” dino\ (dinoartforame\) “ |
| Gaya artis | wlop | Betul |
Untuk kemudahan anda, kami juga menyediakan borang lengkap kata pemicu dalam noob-wiki untuk rujukan anda:
| Jenis jadual | Link muat turun |
| Watak Danbooru | Klik sini |
| Gaya Artis Danbooru | Klik sini |
| Watak E621 | Klik sini |
| Gaya Artis E621 | Klik sini |
Setiap borang ini mengandungi jadual kata pemicu dari salah satu pangkalan data Danbooru dan e621. Setiap baris dalam jadual mewakili watak atau gaya artis. Anda hanya perlu mencari baris yang sepadan dengan watak atau gaya artis yang diingini, salin bahagian ” pemicu ” dan tampalkannya ke dalam perkataan prompt seperti sedia ada. Jika anda tidak pasti tentang watak atau gaya artis, anda juga boleh mengklik pautan dalam lajur “url” untuk melihat gambar contoh di laman web. Jadual berikut menerangkan makna setiap lajur. Tidak setiap jadual mengandungi semua lajur.
| Senarai | Makna | Catatan |
| watak | Nama tag peranan di laman web yang sepadan. | |
| artis | Gaya artis dalam nama tag di laman web yang sepadan. | |
| pemicu | Kata pemicu selepas standardisasi. | Salin dan tampal ke dalam perkataan prompt seperti sedia ada dan gunakan. |
| kira | Bilangan imej dengan tag ini. | Sebagai jangkaan tahap pemulihan konsep ini. Untuk watak, kiraan lebih tinggi daripada 200 boleh dipulihkan dengan lebih baik. Untuk gaya, kiraan lebih tinggi daripada 100 boleh dipulihkan dengan lebih baik. |
| url | Halaman tag di laman web asal. | |
| solo_count | Bilangan imej dalam dataset dengan tag ini dan hanya satu watak dalam imej. | Jadual peranan sahaja. Untuk peranan, solo_count di atas 50 boleh dipulihkan dengan lebih baik. Apabila tahap pengurangan dinilai berdasarkan kiraan, penyimpangan lajur kiraan adalah besar dan ketepatan rendah, manakala solo_count adalah penunjuk yang lebih tepat. |
| core_tags | Tag ciri teras watak termasuk penampilan, jantina, dan pakaian. Dipisahkan oleh koma dalam bahasa Inggeris, setiap tag telah dinormalisasi. | Hanya senarai watak Danbooru. Apabila watak yang tidak popular diaktifkan dan tahap pemulihannya tidak mencukupi, beberapa tag ciri teras boleh ditambah untuk meningkatkan tahap pemulihan. |
Label khas adalah sejenis label dengan makna dan kesan khas yang berfungsi sebagai fungsi tambahan.
Tag kualiti sebenarnya adalah tag populariti yang diperoleh daripada data statistik berdasarkan pilihan pengguna Danbooru dan e621. Dalam urutan kualiti dari tinggi ke rendah:
masterpiece > best quality > high quality / good quality > normal quality > low quality / bad quality > worst quality
Tag estetik dinilai berdasarkan model penilaian estetik. Setakat ini hanya ada dua, ” very awa ” dan ” worst aesthetic “. Yang pertama adalah data dengan waifu-scorer-v3 dan waifu-scorer-v4-beta skor yang tertimbang dalam 5% teratas, dan yang terakhir adalah data dengan 5% terendah. Ia dinamakan very awa kerana standard estetiknya serupa dengan model A rti Wa ifu Diffusion . Selain itu, tag estetik yang masih dalam latihan dan tidak mempunyai kesan yang jelas adalah “very as2″, yang merupakan data dengan ” aesthetic-shadow-v2-5 skor dalam 5% teratas.
Perbandingan kesan label estetik
Terdapat empat tag keselamatan/penilaian: umum , sensitif , nsfw dan explicit .
Kami berharap pengguna akan secara sedar menambah “nsfw” dalam prompt negatif untuk menapis kandungan yang tidak sesuai. 😀
Tag tahun digunakan untuk menunjukkan tahun penciptaan karya, secara tidak langsung mempengaruhi kualiti, gaya, tahap pemulihan watak , dan lain-lain. Formatnya adalah ” tahun xxxx “, di mana “xxxx” adalah tahun tertentu, seperti “>tahun 2024”.
Tag tempoh adalah tag tahun yang juga mempunyai kesan yang ketara terhadap kualiti imej. Persamaan antara tag dan tahun ditunjukkan dalam jadual di bawah.
| Julat tahun | 2021~2024 | 2018~2020 | 2014~2017 | 2011~2013 | 2005~2010 |
| Label tempoh | terbaru | terkini | pertengahan | awal | lama |
Bahagian ini menyediakan contoh penggunaan prompt yang disyorkan untuk rujukan sahaja.
Titk permulaan yang disyorkan berikut menggunakan tag khas, yang mempunyai korelasi tertinggi dengan kualiti imej.
very awa, masterpiece, best quality, year 2024, newest, highres, absurdres
Jadual berikut memperkenalkan tag negatif yang biasa dan sumbernya. Tidak semua tag negatif semestinya buruk, dan menggunakannya dengan betul boleh memberikan kesan yang tidak dijangka.
| Tag | Terjemahan | Catatan | Sumber |
| Label Kualiti | |||
| worst aesthetic | Estetik terburuk | Mengandungi konsep estetik rendah seperti kualiti rendah, watermark, komik, pandangan berganda, dan lakaran yang tidak lengkap | Estetik |
| worst quality | Kualiti terburuk | Kualiti | |
| low quality | Kualiti rendah | Kualiti rendah dari Danbooru | Kualiti |
| bad quality | Kualiti rendah | Kualiti rendah dari e621 | Kualiti |
| lowres | Resolusi rendah | Danbooru | |
| scan artifacts | Artefak pengimbasan | Danbooru | |
| jpeg artifacts | Artefak pemampatan imej JPEG | Danbooru | |
| lossy-lossless | – | Imej yang telah ditukar dari format imej lossy ke format imej lossless biasanya penuh dengan artefak. | Danbooru |
| Label Komposisi dan bentuk seni | |||
| ai-generated | Dihasilkan oleh AI | Dihasilkan oleh AI, ia sering mempunyai rasa berminyak yang dihasilkan oleh AI. | Danbooru |
| abstract | Abstrak | Menghapuskan garis yang berselerak | Danbooru |
| official art | Seni rasmi | Ilustrasi yang dibuat oleh syarikat/artis rasmi siri atau watak. hak cipta , syarikat atau nama artis , dan notis hak cipta mungkin dicetak di suatu tempat pada imej. | Danbooru |
| old | Imej awal | Tempoh | |
| 4koma | Komik empat panel | Danbooru | |
| multiple views | Pandangan berganda | Danbooru | |
| reference sheet | Reka bentuk personaliti | Danbooru | |
| dakimakura \(medium\) | Gambar bantal peluk | Danbooru | |
| turnaround | Pandangan tiga badan penuh | Danbooru | |
| comic | Kartun | Danbooru | |
| greyscale | Peta pelepasan canary | Gambar hitam dan putih | Danbooru |
| monochrome | Monokrom | Gambar hitam dan putih | Danbooru |
| sketch | Lakaran garis | Danbooru | |
| unfinished | Karya yang tidak lengkap | Danbooru | |
| Label E621 | |||
| furry | Furry | e621 | |
| anthro | Furry Personified | e621 | |
| feral | Furry | e621 | |
| semi-anthro | Furry Semi-anthropomorphic | e621 | |
| mammal | Mammalia (Furry) | e621 | |
| Label Watermark | |||
| watermark | Watermark | Danbooru | |
| logo | LOGO | Danbooru | |
| signature | Tandatangan artis | Danbooru | |
| text | Teks | Danbooru | |
| artist name | Nama artis | Danbooru | |
| dated | Tarikh | DanboRelated Posts![]() Guide to Prompting with Illustrious ModelsComplicated desired outputs = Complex prompts with mix of natural language and tags [postcard=89ntmto] Complex prompt... ![]() Guide to AI Pose Prompting (NSFW)This guide was created to bring inspiration to this visual vocabulary. There is a short description for each pose so ... ![]() Can Chatgpt GPT-4o image generation do NSFW/nudity? GPT-4o massive nerf and other findingsGPT-4o, released on March 25, 2025 went viral soon after release, bolstered by the Studio Ghibli animation style tren... ![]() Automatic1111 Stable Diffusion WebUI for Hentai Generation (SD1.5 Tutorial)This guide is intended to get you generating quality NSFW images as quickly as possible with Automatic1111 Stable Dif... | |