
By gerogero
Updated: February 7, 2026
Tài liệu này cung cấp một giới thiệu toàn diện, đầy đủ và cập nhật về mô hình NoobAI-XL .
NoobAI-XL là một mô hình khuếch tán Text-to-Image được phát triển bởi Laxhar Dream Lab và được tài trợ bởi Lanyun.
Chứng nhận mô hình được kế thừa từ fair-ai-public-license-1.0-sd và có một số hạn chế (xem chứng nhận mô hình NoobAI-XL). Mô hình dựa trên kiến trúc mô hình của SDXL. Mô hình cơ sở của nó là Illustrious-xl-early-release-v0 . Nó đã được đào tạo trên bộ dữ liệu hoàn chỉnh Danbooru và e621 (khoảng 13 triệu hình ảnh) trong một số vòng lớn, với kiến thức phong phú và hiệu suất xuất sắc.
NoobAI-XL có một lượng kiến thức khổng lồ, có thể phục hồi phong cách của hàng chục ngàn nhân vật 2D và nghệ sĩ, nhận diện một số lượng lớn các khái niệm đặc biệt trong 2D, và có kiến thức phong phú về furry.
NoobAI-XL cung cấp cả phiên bản dự đoán nhiễu (hay nói cách khác là dự đoán epsilon) và dự đoán V. Tóm lại, phiên bản dự đoán nhiễu tạo ra hình ảnh đa dạng và sáng tạo hơn, trong khi phiên bản dự đoán V tuân theo các prompt nhiều hơn và tạo ra hình ảnh với dải màu rộng hơn và ánh sáng mạnh hơn.
NoobAI-XL có một cộng đồng hỗ trợ hệ sinh thái ngày càng phong phú, bao gồm nhiều LoRA, ControlNet , IP-Adapter và nhiều thứ khác.
NoobAI-XL bao gồm một loạt các mô hình, chủ yếu là dự đoán nhiễu và dự đoán V, sẽ được mô tả chi tiết sau này .
Trước khi đọc phần này, độc giả cần phải hiểu rõ cách sử dụng cơ bản của bất kỳ loại giao diện hình ảnh thô nào như WebUI , ComfyUI , forge hoặc reForge . Nếu không, độc giả cần phải học từ đây hoặc từ Internet (như Bilibili, v.v.).
| Trang web | Liên kết |
| CivitAI | Nhấn vào đây |
| LiblibAI | Nhấn vào đây |
| Huggingface | Nhấn vào đây |
Nếu bạn không biết mô hình nào để tải xuống, bạn có thể duyệt ở đây .
Các mô hình NoobAI-XL được chia thành hai loại: mô hình dự đoán nhiễu (dự đoán epsilon , hoặc viết tắt là eps-pred ) và mô hình dự đoán V (dự đoán v , hoặc viết tắt là v-pred ). Các mô hình có từ “eps”, “epsilon-pred” hoặc “eps-pred” trong tên của chúng là mô hình dự đoán nhiễu, không khác nhiều so với các mô hình khác. Nếu bạn sử dụng chúng, bạn có thể bỏ qua phần này. Các mô hình có từ “v” hoặc “v-pred” trong tên của chúng là mô hình dự đoán V, khác với hầu hết các mô hình thông thường. Vui lòng đọc kỹ hướng dẫn cài đặt trong phần này! Nguyên lý của mô hình dự đoán V có thể được tìm thấy trong bài viết này .
Dự đoán V là một kỹ thuật đào tạo mô hình tương đối hiếm. Các mô hình được đào tạo bằng kỹ thuật này được gọi là mô hình dự đoán V. So với dự đoán nhiễu, các mô hình dự đoán V nổi tiếng với sự tuân thủ cao hơn đối với các gợi ý, dải màu toàn diện hơn và ánh sáng và bóng mạnh hơn, được đại diện bởi NovelAI Diffusion V3 và COSXL . Do xuất hiện muộn và ít mô hình loại này, một số dự án đồ họa chính thống và giao diện không hỗ trợ trực tiếp nó. Do đó, nếu bạn dự định sử dụng các mô hình dự đoán V, bạn cần một số thao tác bổ sung. Phần này sẽ giới thiệu cách sử dụng cụ thể của nó. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình sử dụng, bạn cũng có thể trực tiếp liên hệ với bất kỳ tác giả mô hình nào để được giúp đỡ.
Forge và reForge là hai giao diện tạo hình ảnh AI được phát triển bởi lllyasviel và Panchovix tương ứng, cả hai đều là phiên bản mở rộng của WebUI. Nhánh chính của chúng hỗ trợ mô hình dự đoán V, và chế độ hoạt động gần như giống với WebUI, vì vậy chúng được khuyến nghị. Nếu bạn đã cài đặt một trong số chúng, bạn chỉ cần chạy git pull để cập nhật trong thư mục cài đặt của nó và khởi động lại; nếu bạn chưa cài đặt, bạn có thể tham khảo hướng dẫn trực tuyến để cài đặt và sử dụng.
ComfyUI là một giao diện tạo hình ảnh được phát triển bởi comfyanonymous , cho phép người dùng tự do thao tác các nút, được đặt tên vì tính linh hoạt và chuyên nghiệp của nó. Việc sử dụng mô hình dự đoán V chỉ cần thêm các nút bổ sung.
WebUI là một dự án stable-diffusion-webui do AUTOMATIC1111 phát triển. Hiện tại, nhánh chính của WebUI, là nhánh chính, không hỗ trợ mô hình dự đoán V và cần chuyển sang dev. Xin lưu ý rằng phương pháp này không ổn định và có thể có lỗi. Việc sử dụng không đúng cách thậm chí có thể gây hư hại không thể khôi phục cho WebUI. Do đó, hãy sao lưu WebUI của bạn trước. Phương pháp cụ thể như sau:
git checkout dev và nhấn Enter.Diffusers là một thư viện mô hình khuếch tán Python chuyên dụng. Việc sử dụng này yêu cầu người dùng có một nền tảng mã nhất định, và được khuyến nghị cho các nhà phát triển và nhà nghiên cứu sử dụng. Ví dụ mã:
import torch
from diffusers import StableDiffusionXLPipeline, EulerDiscreteScheduler
ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(
ckpt_path,
use_safetensors=True,
torch_dtype=torch.float16,
)
scheduler_args = {"prediction_type": "v_prediction", "rescale_betas_zero_snr": True}
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, **scheduler_args)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")
prompt = """masterpiece, best quality, john_kafka, nixeu, quasarcake, chromatic aberration, film grain, horror \(theme\), limited palette, x-shaped pupils, high contrast, color contrast, cold colors, arlecchino \(genshin impact\), black theme, gritty, graphite \(medium\)"""
negative_prompt = "nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
num_inference_steps=28,
guidance_scale=5,
generator=torch.Generator().manual_seed(42),
).images[0]
image.save("output.png")
NoobAI-XL không có yêu cầu cứng nhắc về từ prompt, và các hành động được khuyến nghị trong bài viết này chỉ là thêm phần.
NoobAI-XL khuyến nghị người dùng sử dụng các thẻ làm prompt để thêm nội dung mong muốn. Mỗi thẻ là một từ hoặc cụm từ tiếng Anh được phân tách bằng dấu phẩy tiếng Anh “,”, và các thẻ trực tiếp từ Danbooru và e621 có hiệu ứng mạnh hơn. Để cải thiện thêm, xem các thông số prompt sau này.
Chúng tôi đề xuất luôn thêm thẻ thẩm mỹ “very awa” và thẻ chất lượng “masterpiece” vào prompt của bạn.
NoobAI-XL hỗ trợ tạo ra các nhân vật và phong cách nghệ sĩ có độ trung thực cao, cả hai đều được kích hoạt bởi các thẻ, mà chúng tôi gọi là “từ kích hoạt”. Trong số đó, các từ kích hoạt cho nhân vật là tên của họ; các từ kích hoạt cho phong cách nghệ sĩ là tên của nghệ sĩ. Bảng từ kích hoạt hoàn chỉnh có thể được tải xuống từ noob-wiki . Các giải thích chi tiết về từ kích hoạt có thể được tìm thấy dưới đây .
Tương tự như NovelAI, NoobAI-XL hỗ trợ các thẻ đặc biệt như chất lượng, thẩm mỹ, năm sáng tạo, thời kỳ sáng tạo và xếp hạng an toàn cho các mục đích hỗ trợ. Các độc giả quan tâm có thể xem phần giới thiệu chi tiết trong văn bản tiếp theo .
Bảng dưới đây khuyến nghị ba tham số tạo ra: sampler , số bước lấy mẫu , và CFG Scale . Đậm là được khuyến nghị mạnh mẽ; đậm màu đỏ là yêu cầu cứng. Việc sử dụng các giá trị tham số khác ngoài những giá trị này sẽ mang lại hiệu ứng không mong muốn.
| Số phiên bản | Tất cả các phiên bản dự đoán nhiễu | Phiên bản Dự đoán V 1.0 | Phiên bản Dự đoán V 0.9r | Phiên bản Dự đoán V 0.75s | Phiên bản Dự đoán V 0.65s | Phiên bản Dự đoán V 0.6 | Phiên bản Dự đoán V 0.5 | Phiên bản Dự đoán V Beta |
| Tham số được khuyến nghị | Sampler: Euler A CFG: 5~ 7 Số bước lấy mẫu: 28~ 35 | Sampler: Euler CFG: 3.5 ~ 5.5 Số bước lấy mẫu: 32~ 40Sampler: Euler A CFG: 3 ~ 5 Số bước lấy mẫu: 28~ 40 | Sampler: Euler CFG: 3.5 ~ 5.5 Số bước lấy mẫu: 32~ 40Sampler: Euler A CFG: 3 ~ 5 Số bước lấy mẫu: 28~ 40 | Sampler: Euler A CFG: 3 ~ 5 Số bước lấy mẫu: 28~ 40 | Sampler: Euler A hoặc Euler CFG: 3.5 ~ 5.5 Số bước lấy mẫu: 32~ 40Sampler: Euler A CFG: 5 ~ 7 Số bước lấy mẫu: 28~ 40 | Sampler: Euler CFG: 3.5~ 5.5 Số bước lấy mẫu: 28~ 35 | Sampler: Euler CFG: 3.5~ 5.5 Số bước lấy mẫu: 28~ 40 | Sampler: Euler A CFG: 5~ 7 Số bước lấy mẫu: 28~ 35 |
Đối với mô hình dự đoán V, các tham số sau được khuyến nghị để (i) tối ưu hóa màu sắc, ánh sáng và chi tiết; (ii) loại bỏ các hiệu ứng quá bão hòa và quá phơi sáng; và (iii) nâng cao sự hiểu biết ngữ nghĩa.
Độ phân giải (chiều rộng x chiều cao) của hình ảnh được tạo ra là một tham số quan trọng. Nói chung, vì lý do kiến trúc, tất cả các mô hình SDXL bao gồm NoobAI-XL cần sử dụng một độ phân giải cụ thể để đạt được hiệu quả tốt nhất. Không được phép nhiều hơn hoặc ít hơn pixel, nếu không chất lượng của hình ảnh được tạo ra sẽ bị suy giảm. Độ phân giải được khuyến nghị của NoobAI-XL được hiển thị trong bảng dưới đây:
| Độ phân giải (W x H) | 768×1344 | 832×1216 | 896×1152 | 1024×1024 | 1152×896 | 1216×832 | 1344×768 |
| Tỷ lệ | 9:16 | 2:3 | 3:4 | 1:1 | 4:3 | 3:2 | 16:9 |
Bạn cũng có thể sử dụng độ phân giải khu vực lớn hơn, mặc dù điều này không ổn định. (Theo nghiên cứu SD3, khi khu vực được tạo ra trở thành một $$$$bội số của ban đầu, độ không chắc chắn của mô hình sẽ trở thành một bội số của ban đầu $$k^$$.) Chúng tôi khuyến nghị rằng khu vực hình ảnh được tạo ra không vượt quá 1.5 lần khu vực ban đầu. Ví dụ, 1024×1536.
Nếu bạn quan tâm đến mô hình và muốn tìm hiểu thêm về nó, phần này cung cấp hướng dẫn chi tiết về cách sử dụng mô hình.
NoobAI-XL bao gồm nhiều phiên bản khác nhau của mô hình cơ sở cho một loạt. Bảng dưới đây tóm tắt các đặc điểm của từng phiên bản.
| Số phiên bản | Loại dự đoán | Liên kết tải xuống | Vòng lặp từ | Đặc điểm phiên bản |
| Early-Access | Dự đoán nhiễu | CivitAIHuggingface | Illustrious-xl-early-release-v0 | Phiên bản sớm nhất, nhưng đã có đủ đào tạo. |
| Epsilon-pred 0.5 | Dự đoán nhiễu | CivitAIHuggingface | Early-Access | (Khuyến nghị) Phiên bản ổn định nhất, nhược điểm duy nhất là thiếu kiến thức về các khái niệm mơ hồ. |
| Epsilon-pred 0.6 | Dự đoán nhiễu | Huggingface | Early-Access 0.5 | (Khuyến nghị) Phiên bản cuối cùng của đào tạo chỉ UNet có hiệu ứng hội tụ xuất sắc. Nhóm thử nghiệm được gọi là “178000”, được nhiều người yêu thích. |
| Epsilon-pred 0.75 | Dự đoán nhiễu | CivitAIHuggingface | Epsilon-pred 0.6 | Encoder văn bản (TTE) đã được đào tạo để học nhiều kiến thức mơ hồ hơn, nhưng hiệu suất chất lượng giảm. |
| Epsilon-pred 0.77 | Dự đoán nhiễu | Huggingface | Epsilon-pred 0.75 | Được đào tạo thêm hai vòng trên cơ sở Epsilon-pred 0.75, cải thiện sự suy giảm hiệu suất. |
| Epsilon-pred 1.0 | Dự đoán nhiễu | CivitAIHuggingface | Epsilon-pred 0.77 | (Khuyến nghị) Thêm 10 vòng đào tạo để củng cố kiến thức mới của tte, cân bằng hiệu suất. |
| Pre-test | Dự đoán V | CivitAIHuggingface | Epsilon-pred 0.5 | (Không khuyến nghị) Phiên bản thử nghiệm ban đầu của dự đoán V. |
| V-pred 0.5 | Dự đoán V | CivitAIHuggingface | Epsilon-pred 1.0 | (Không khuyến nghị) Có vấn đề về độ bão hòa cao. |
| V-pred 0.6 | Dự đoán V | CivitAIHuggingface | V-pred 0.5 | (Không khuyến nghị) Dựa trên kết quả đánh giá sơ bộ, V-pred0.6 hoạt động tốt trong việc bao phủ kiến thức hiếm, đạt mức cao nhất trong số các mô hình hiện đang được phát hành. Đồng thời, mô hình cải thiện đáng kể vấn đề suy giảm chất lượng. |
| V-pred 0.65 | Dự đoán V | Huggingface | V-pred 0.6 | (Không khuyến nghị) Có vấn đề về độ bão hòa. |
| V-pred 0.65s | Dự đoán V | CivitAIHuggingface | V-pred 0.6 | Vấn đề độ bão hòa gần như đã được giải quyết! Nhưng nó có vấn đề về hiện tượng, sẽ được giải quyết trong phiên bản tiếp theo. |
| Epsilon-pred 1.1 | Dự đoán nhiễu | CivitAIHuggingface | Epsilon-pred 1.0 | (Khuyến nghị) Vấn đề độ sáng trung bình đã được giải quyết, và tất cả các khía cạnh đã được cải thiện. |
| V-pred 0.75 | Dự đoán V | Huggingface | V-pred 0.65 | (Không khuyến nghị) Có vấn đề về độ bão hòa. |
| V-pred 0.75s | Dự đoán V | CivitAIHuggingface | V-pred 0.65 | (Khuyến nghị) Giải quyết độ bão hòa trong các tình huống cực đoan, tiếng ồn dư và vấn đề hiện tượng. |
| V-pred 0.9r | Dự đoán V | CivitAI | V-pred 0.75 | Được đào tạo với ~10% dữ liệu thực tế. Có sự suy giảm. |
| V-pred 1.0 | Dự đoán V | CivitAI | V-pred 0.75 | (Khuyến nghị) Cân bằng chất lượng/performance/màu sắc tốt nhất. |
| Loại dự đoán | Loại ControlNet | Liên kết | Loại bộ tiền xử lý | Ghi chú |
| Dự đoán nhiễu | Hed soft edge | CivitAIHuggingface | softedge_hed | |
| Dự đoán nhiễu | Anime lineart | CivitAIHuggingface | lineart_anime | |
| Dự đoán nhiễu | Midas normal map | CivitAIHuggingface | normal_midas | |
| Dự đoán nhiễu | Midas depth map | CivitAIHuggingface | depth_midas | |
| Dự đoán nhiễu | Canny contour | CivitAIHuggingface | canny | |
| Dự đoán nhiễu | Openpose human skeleton | CivitAIHuggingface | openpose | |
| Dự đoán nhiễu | Manga line | CivitAIHuggingface | manga_line / lineart_anime / lineart_realistic | |
| Dự đoán nhiễu | Realistic lineart | CivitAIHuggingface | lineart_realistic | |
| Dự đoán nhiễu | Midas depth map | CivitAIHuggingface | depth_midas | Phiên bản mới |
| Dự đoán nhiễu | HED scribble | CivitAIHuggingface | scribble_hed | |
| Dự đoán nhiễu | Pidinet scribble | CivitAIHuggingface | scribble_pidinet | |
| Dự đoán nhiễu | Tile | CivitAIHuggingface | tile |
Lưu ý rằng khi sử dụng ControlNet, bạn PHẢI khớp loại bộ tiền xử lý mà bạn đang sử dụng với loại bộ tiền xử lý mà ControlNet yêu cầu. Ngoài ra, bạn CÓ THỂ KHÔNG CẦN khớp loại dự đoán của mô hình cơ sở với loại dự đoán của ControlNet.
Sẽ sớm có.
Hầu hết các LoRA có thể được sử dụng cho cả phiên bản dự đoán nhiễu và phiên bản dự đoán V, và ngược lại.
Trước tiên, chúng ta cần làm rõ rằng vai trò của các prompt là để hướng dẫn. Các prompt tốt có thể giải phóng tiềm năng của mô hình, nhưng các prompt xấu hoặc thậm chí không chính xác có thể không nhất thiết làm cho kết quả tệ hơn. Các mô hình khác nhau có cách sử dụng prompt tối ưu khác nhau, và hiệu ứng của việc sử dụng sai thường không rõ ràng, và trong một số trường hợp, nó thậm chí có thể cải thiện. Hướng dẫn prompt này ghi lại kỹ thuật tốt nhất lý thuyết của mô hình, và những độc giả có khả năng cũng có thể tự do sử dụng nó.
Phần này sẽ cung cấp hướng dẫn chi tiết về cách viết prompt, bao gồm tiêu chuẩn viết prompt, cách sử dụng cụ thể của các từ kích hoạt vai trò và phong cách, cách sử dụng các thẻ đặc biệt, và nhiều thứ khác. Những độc giả quan tâm đến kỹ thuật prompt có thể chọn đọc một cách chọn lọc.
NoobAI-XL có cùng thông số prompt như các mô hình cơ sở giống anime khác. Phần này sẽ giới thiệu hệ thống các thông số viết cơ bản của prompt và giúp độc giả loại bỏ những hiểu lầm phổ biến trong cộng đồng.
Theo các định dạng khác nhau, các prompt có thể được chia thành hai loại: thẻ và ngôn ngữ tự nhiên. Loại trước thường được sử dụng cho các mô hình anime, và loại sau thường được sử dụng cho các mô hình đời thực. Bất kể loại prompt nào, trừ khi mô hình quy định khác, nó chỉ nên chứa các chữ cái tiếng Anh, số và ký hiệu.
Các thẻ được tạo thành từ các từ tiếng Anh viết thường hoặc cụm từ được phân tách bằng dấu phẩy tiếng Anh “,”, ví dụ, “1girl, solo, blue hair” chứa ba thẻ, “1girl”, “solo” và “blue hair”.
Các khoảng trắng và ký tự xuống dòng trong prompt sẽ không ảnh hưởng đến hiệu ứng tạo ra thực tế. Nói cách khác, “1girl, solo, blue hair” và “1girl, solo, blue hair” có hiệu ứng hoàn toàn giống nhau.
Các prompt không nên chứa bất kỳ dấu gạch dưới nào “_”. Bị ảnh hưởng bởi các trang web như Danbooru, việc sử dụng dấu gạch dưới “_” thay vì khoảng trắng giữa các từ như các thẻ đã được lưu truyền, điều này thực sự là một sự sử dụng sai và sẽ gây ra kết quả tạo ra khác với việc sử dụng khoảng trắng. Hầu hết các mô hình, bao gồm NoobAI-XL, không khuyến nghị bao gồm bất kỳ dấu gạch dưới nào trong các prompt. Sự sử dụng sai này có thể ảnh hưởng đến chất lượng tạo ra ở mức tốt nhất, và thậm chí làm cho các từ kích hoạt hoàn toàn không hợp lệ ở mức tệ nhất.
Escape dấu ngoặc nếu cần thiết. Dấu ngoặc, bao gồm dấu ngoặc tròn (), dấu ngoặc vuông [], và dấu ngoặc nhọn {}, là những ký hiệu rất đặc biệt trong các prompt. Khác với các ký hiệu thông thường, trong hầu hết các giao diện tạo hình ảnh, dấu ngoặc được hiểu là trọng số nội dung cụ thể, và các dấu ngoặc tham gia vào trọng số sẽ không giữ ý nghĩa ban đầu của chúng. Nhưng nếu prompt ban đầu cần bao gồm dấu ngoặc, chẳng hạn như một số từ kích hoạt? Câu trả lời là chức năng trọng số của dấu ngoặc có thể được loại bỏ bằng cách thêm một dấu gạch chéo ngược “\” trước dấu ngoặc. Hành động thay đổi ý nghĩa ban đầu của một ký tự được gọi là escape, và dấu gạch chéo ngược cũng được gọi là ký tự escape. Ví dụ, nếu bạn không sử dụng dấu gạch chéo ngược để escape, prompt “1girl, ganyu ( genshin impact ) ” sẽ bị hiểu sai là “1girl, ganyu genshin impact”, trong đó “genshin impact” được trọng số và dấu ngoặc biến mất. Bằng cách thêm một ký tự escape, prompt trở thành “1girl, ganyu \ ( genshin impact \) “, như mong đợi.
Tóm lại, tiêu chuẩn hóa thẻ được chia thành hai bước: (i) thay thế dấu gạch dưới bằng khoảng trắng trong từng thẻ, và (ii) thêm một dấu gạch chéo ngược “\” trước dấu ngoặc.
Các thẻ trực tiếp từ Danbooru và e621 có hiệu ứng biểu đạt mạnh hơn. Do đó, thay vì tạo thẻ của riêng bạn, chúng tôi khuyến nghị rằng độc giả tìm kiếm thẻ trực tiếp trên hai trang web này. Cần lưu ý rằng các thẻ thu được trực tiếp theo cách này được phân tách bằng dấu gạch dưới “_” và các dấu ngoặc không được escape. Do đó, trước khi thêm gợi ý vào các thẻ từ chúng, bạn cần loại bỏ các khoảng trắng trong các thẻ và escape các dấu ngoặc. Ví dụ, hãy xử lý các thẻ từ Danbooru “ ganyu_ (genshin_impact) ” thành “ganyu\ (genshin impact\) ” trước khi sử dụng.
Không sử dụng các thẻ meta không hợp lệ. Các thẻ meta (thẻ meta ) là một loại thẻ đặc biệt trên Danbooru được sử dụng để chỉ định các đặc điểm của tệp hình ảnh hoặc tác phẩm tự nó. Ví dụ, “ highres ” chỉ ra rằng hình ảnh có độ phân giải cao, “ oil_painting_ (medium) ” chỉ ra rằng hình ảnh có phong cách tranh dầu. Tuy nhiên, không phải tất cả các thẻ meta đều liên quan đến nội dung hoặc hình thức của hình ảnh. Ví dụ, “ commentary_request ” chỉ ra rằng bài đăng của Danbooru có yêu cầu dịch tác phẩm, điều này không có mối quan hệ trực tiếp với tác phẩm tự nó và do đó không có hiệu ứng.
Các từ gợi ý tuần tự thì tốt hơn. NoobAI-XL khuyến nghị viết các prompt theo thứ tự logic, từ chính đến phụ. Một thứ tự viết có thể là như sau, chỉ để tham khảo:
< 1girl/1boy/1other/nữ/nam/... >, < nhân vật >, < loạt >, < nghệ sĩ (s) >, < thẻ chung >, < thẻ khác >, < thẻ chất lượng & thẩm mỹ >
Trong số đó, < thẻ chất lượng & thẩm mỹ > có thể được đặt ở đầu.
Các prompt ngôn ngữ tự nhiên được tạo thành từ các câu, mỗi câu bắt đầu bằng chữ cái viết hoa và kết thúc bằng dấu chấm “.”. Hầu hết các mô hình anime, bao gồm NoobAI-XL, có sự hiểu biết tốt hơn về các thẻ, vì vậy ngôn ngữ tự nhiên thường được sử dụng như một phần phụ trợ hơn là một thành phần chính trong các prompt.
NoobAI-XL hỗ trợ tạo trực tiếp một số lượng lớn các nhân vật và phong cách nghệ sĩ do người hâm mộ tạo ra. Các nhân vật và phong cách được kích hoạt bởi tên, cũng là các thẻ gọi là từ kích hoạt. Bạn có thể tìm kiếm trực tiếp trên Danbooru hoặc e621 , và chuẩn hóa các thẻ thu được thành các prompt.
Có một số khác biệt trong cách kích hoạt các nhân vật và nghệ sĩ.
Bảng dưới đây minh họa một số trường hợp đúng và sai trong việc kích hoạt nhân vật và phong cách:
| Loại | Từ prompt | Đúng hay sai | Lý do |
| Nhân vật | Rei Ayanami | Sai | Tên nhân vật nên là “ ayanami rei ”.Không có thẻ loạt “ neon genesis evangelion ” được thêm vào. |
| Nhân vật | nhân vật:ganyu \(genshin impact\), genshin impact | Sai | Thêm tiền tố “nhân vật:” một cách hình thức. |
| Nhân vật | ganyu_\(genshin impact\) | Sai | Không có thẻ được chuẩn hóa hoàn toàn: không nên chứa dấu gạch dưới.Không có thẻ loạt nào được thêm vào. |
| Nhân vật | ganyu (genshin impact), genshin impact | Sai | Không có thẻ được chuẩn hóa hoàn toàn: dấu ngoặc không được escape. |
| Nhân vật | ganyu (genshin impact\), genshin impact | Sai | Không có thẻ được chuẩn hóa hoàn toàn: dấu ngoặc trái không được escape. |
| Nhân vật | ganyu \(genshin impact\),genshin impact | Sai | Phân tách hai thẻ bằng dấu phẩy tiếng Trung |
| Nhân vật | ganyu \(genshin impact\), genshin impact | Đúng | |
| Phong cách nghệ sĩ | bởi wlop | Sai | Thêm tiền tố “bởi” một cách hình thức. |
| Phong cách nghệ sĩ | nghệ sĩ:wlop | Sai | Thêm tiền tố “nghệ sĩ:” một cách hình thức. |
| Phong cách nghệ sĩ | dino | Sai | Tên nghệ sĩ là sai, tên nghệ sĩ của aidxl/artiwaifu không nên được sử dụng, mà nên theo Danbooru, vì vậy là “ dino\ (dinoartforame\) ” |
| Phong cách nghệ sĩ | wlop | Đúng |
Để thuận tiện cho bạn, chúng tôi cũng cung cấp một biểu mẫu từ kích hoạt hoàn chỉnh trong noob-wiki để bạn tham khảo:
| Loại bảng | Liên kết tải xuống |
| Nhân vật Danbooru | Nhấn vào đây |
| Phong cách Nghệ sĩ Danbooru | Nhấn vào đây |
| Nhân vật E621 | Nhấn vào đây |
| Phong cách Nghệ sĩ E621 | Nhấn vào đây |
Mỗi biểu mẫu này chứa một bảng từ kích hoạt từ một trong các cơ sở dữ liệu Danbooru và e621. Mỗi hàng của bảng đại diện cho một nhân vật hoặc phong cách nghệ sĩ. Bạn chỉ cần tìm hàng tương ứng với nhân vật hoặc phong cách nghệ sĩ mong muốn, sao chép phần “trigger ” và dán nó vào từ prompt như nó là. Nếu bạn không chắc chắn về một nhân vật hoặc phong cách nghệ sĩ, bạn cũng có thể nhấp vào liên kết trong cột “url” để xem hình minh họa trên trang web. Bảng dưới đây giải thích ý nghĩa của mỗi cột. Không phải mọi bảng đều chứa tất cả các cột.
| Được liệt kê | Ý nghĩa | Ghi chú |
| nhân vật | Tên thẻ của vai trò trên trang web tương ứng. | |
| nghệ sĩ | Phong cách nghệ sĩ trong tên thẻ của trang web tương ứng. | |
| trigger | Các từ kích hoạt sau khi chuẩn hóa. | Sao chép và dán nó vào từ prompt như nó là và sử dụng nó. |
| count | Số lượng hình ảnh có thẻ này. | Như một kỳ vọng về mức độ phục hồi của khái niệm này. Đối với các nhân vật, một count cao hơn 200 có thể phục hồi tốt hơn. Đối với phong cách, một count cao hơn 100 có thể phục hồi tốt hơn. |
| url | Trang thẻ trên trang web gốc. | |
| solo_count | Số lượng hình ảnh trong bộ dữ liệu có thẻ này và chỉ có một nhân vật trong hình ảnh. | Bảng vai trò chỉ. Đối với các vai trò, solo_count trên 50 có thể phục hồi tốt hơn.Khi mức độ giảm được đánh giá bằng count, độ lệch của cột count lớn và độ chính xác thấp, trong khi solo_count là một chỉ số chính xác hơn. |
| core_tags | Các thẻ đặc trưng cốt lõi của nhân vật bao gồm ngoại hình, giới tính và trang phục. Phân tách bằng dấu phẩy tiếng Anh, mỗi thẻ đã được chuẩn hóa. | Chỉ danh sách nhân vật Danbooru. Khi các nhân vật không phổ biến được kích hoạt và mức độ phục hồi của chúng không đủ, một số thẻ đặc trưng cốt lõi có thể được thêm vào để nâng cao mức độ phục hồi. |
Các thẻ đặc biệt là một loại thẻ có ý nghĩa và hiệu ứng đặc biệt phục vụ như một chức năng hỗ trợ.
Các thẻ chất lượng thực sự là các thẻ phổ biến thu được từ dữ liệu thống kê dựa trên sở thích của người dùng Danbooru và e621. Theo thứ tự chất lượng từ cao đến thấp:
kiệt tác > chất lượng tốt nhất > chất lượng cao / chất lượng tốt > chất lượng bình thường > chất lượng thấp / chất lượng kém > chất lượng tệ nhất
Các thẻ thẩm mỹ được chấm điểm theo mô hình chấm điểm thẩm mỹ. Hiện tại chỉ có hai, “ very awa ” và “ worst aesthetic ”. Cái trước là dữ liệu có waifu-scorer-v3 và waifu-scorer-v4-beta được trọng số trong top 5%, và cái sau là dữ liệu với 5% dưới cùng. Nó được đặt tên là very awa vì các tiêu chuẩn thẩm mỹ của nó tương tự như Mô hình A rti Wa ifu Diffusion . Ngoài ra, một thẻ thẩm mỹ vẫn đang trong quá trình đào tạo và chưa có hiệu ứng rõ ràng là “very as2”, đó là dữ liệu với “ aesthetic-shadow-v2-5 ” được trọng số trong top 5%.
So sánh hiệu ứng của các nhãn thẩm mỹ
Có bốn thẻ an toàn/xếp hạng: chung , nhạy cảm , nsfw và explicit .
Chúng tôi hy vọng rằng người dùng sẽ tự giác thêm “nsfw” vào các prompt tiêu cực để lọc ra nội dung không phù hợp. 😀
Thẻ năm được sử dụng để chỉ ra năm sáng tạo của tác phẩm, gián tiếp ảnh hưởng đến chất lượng, phong cách, mức độ phục hồi nhân vật , v.v. Định dạng của nó là “ năm xxxx ”, trong đó “xxxx” là một năm cụ thể, chẳng hạn như “năm 2024”.
Các thẻ thời kỳ là các thẻ năm cũng có ảnh hưởng đáng kể đến chất lượng hình ảnh. Sự tương ứng giữa các thẻ và năm được hiển thị trong bảng dưới đây.
| Khoảng thời gian | 2021~2024 | 2018~2020 | 2014~2017 | 2011~2013 | 2005~2010 |
| Thẻ thời kỳ | mới nhất | gần đây | giữa | sớm | cũ |
Phần này cung cấp các ví dụ về cách sử dụng các prompt được khuyến nghị chỉ để tham khảo.
Điểm khởi đầu được khuyến nghị dưới đây sử dụng các thẻ đặc biệt, đó là những thẻ có mối tương quan cao nhất với chất lượng hình ảnh.
very awa, masterpiece, best quality, year 2024, newest, highres, absurdres
Bảng dưới đây giới thiệu các thẻ tiêu cực phổ biến và nguồn gốc của chúng. Không phải tất cả các thẻ tiêu cực đều nhất thiết xấu, và việc sử dụng chúng đúng cách có thể mang lại hiệu ứng không mong đợi.
| Thẻ | Dịch nghĩa | Ghi chú | Nguồn |
| Thẻ chất lượng | |||
| worst aesthetic | Thẩm mỹ tệ nhất | Chứa các khái niệm thẩm mỹ thấp như chất lượng thấp, watermark, truyện tranh, nhiều góc nhìn, và phác thảo chưa hoàn thành | Thẩm mỹ |
| worst quality | Chất lượng tệ nhất | Chất lượng | |
| low quality | Chất lượng thấp | Chất lượng thấp của Danbooru | Chất lượng |
| bad quality | Chất lượng kém | Chất lượng thấp của e621 | Chất lượng |
| lowres | Độ phân giải thấp | Danbooru | |
| scan artifacts | Hiện tượng quét | Danbooru | |
| jpeg artifacts | Hiện tượng nén hình ảnh JPEG | Danbooru | |
| lossy-lossless | – | Các hình ảnh đã được chuyển đổi từ định dạng hình ảnh nén sang định dạng hình ảnh không nén thường đầy hiện tượng. | Danbooru |
| Các thẻ hình thức và nghệ thuật | |||
| ai-generated | Được tạo bởi AI | Được tạo bởi AI, thường có cảm giác nhờn do AI tạo ra. | Danbooru |
| abstract | Trừu tượng | Loại bỏ các đường nét lộn xộn | Danbooru |
| official art | Nghệ thuật chính thức | Các hình minh họa được thực hiện bởi công ty/nghệ sĩ chính thức của loạt hoặc nhân vật. Bản quyền , công ty hoặc tên nghệ sĩ , và thông báo bản quyền có thể được in ở đâu đó trên hình ảnh. | Danbooru |
| old | Các hình ảnh cũ | Thời kỳ | |
| 4koma | Truyện tranh bốn khung | Danbooru | |
| multiple views | Nhiều góc nhìn | Danbooru | |
| reference sheet | Thiết kế tính cách | Danbooru | |
| dakimakura \(medium\) | Sơ đồ gối ôm | Danbooru | |
| turnaround | Toàn thân ba góc nhìn | DanbooruRelated Posts![]() Guide to Prompting with Illustrious ModelsComplicated desired outputs = Complex prompts with mix of natural language and tags [postcard=89ntmto] Complex prompt... ![]() Guide to AI Pose Prompting (NSFW)This guide was created to bring inspiration to this visual vocabulary. There is a short description for each pose so ... ![]() Can Chatgpt GPT-4o image generation do NSFW/nudity? GPT-4o massive nerf and other findingsGPT-4o, released on March 25, 2025 went viral soon after release, bolstered by the Studio Ghibli animation style tren... ![]() Automatic1111 Stable Diffusion WebUI for Hentai Generation (SD1.5 Tutorial)This guide is intended to get you generating quality NSFW images as quickly as possible with Automatic1111 Stable Dif... | |