AI 生成器非常簡單:你輸入提示然後點擊「生成」來獲得你的圖像。
人們在開始時的問題不是「我該如何生成」,而是「我該如何生成更好的圖像」。
本指南旨在回答這個問題。它是持續實驗和從 BetterWaifu 網站學習的結果,該網站每天生成數十萬張圖像。
一切都從 Danbooru 開始
對於任何想要改善其提示的人,我們的 Discord 伺服器 中的第一個建議通常是瀏覽 Danbooru 。
但對於第一次使用者來說,Danbooru 確實讓人感到困惑。它看起來就像是一堆雜亂的圖像和標籤。那么它實際上如何幫助我們生成更好的 waifus?
Danbooru 是世界上最大的動漫圖像板。毫無例外,所有 動漫 AI 生成器都使用其圖像進行訓練。有許多「booru」網站使用相同的佈局,例如 Rule34 和 Gelbooru ,但 Danbooru 是最大的。
在 Danbooru 上,志願者會根據內容全面標記所有圖像。這些標籤涵蓋了從物理特徵「large_breasts 」、「red_hair 」到物體「book 」再到動作「fellatio 」的各種標籤。
你可以在你的提示中直接使用這些標籤。(在提示中下劃線和空格沒有區別)
關鍵思想: 如果一個標籤有很多圖像,這意味著有很多內容可以用來訓練 AI。因此,BetterWaifu 和其他 AI 生成器通常可以生成它。
因此,有效的提示是一個從尋找好的標籤開始的過程,並將它們直接用於你的提示中。
標籤的基本知識
標籤擁有的圖像越多,力量就越強。 AI 只能生成它所知道的,而它所知道的則取決於它所訓練的圖像。因此,Danbooru 上一個圖像擁有的標籤數量通常是 AI 是否能夠生成它的良好估計。一個非常粗略的經驗法則:標籤應該至少有 1k 圖像,AI 才能識別它。如果至少有 3k,則 AI 能夠準確生成它的可能性非常高。
這同樣適用於角色標籤。 使用 Danbooru 的命名方式非常重要,因此「yor briar 」可以生成正確的角色,而「yor forger」則不行。然而,「標籤越多越好」的規則對於角色來說有一些注意事項。如果一個系列不太受歡迎,生成器不太可能生成其中的角色。此外,AI 模型的創建者可能因各種原因選擇排除某些系列/角色。
做一個精確的極簡主義者。 許多人喜歡在他們的提示中使用許多填充詞。這是來自 2022 年 AI 生成的舊技術。我們不再需要這樣做。過多的標籤會造成噪音並導致較低的質量結果。保持簡潔,僅寫下你絕對想要看到的內容。例如,當場景顯然已經是明確的時候,不要在提示中放入「nsfw」。
提示你所看到的,而不是你所知道的。 不要在你的提示中使用最終圖像中不可見的東西的標籤。例如,一個角色通常被稱為「怪物獵人」,但這與你想生成的圖像無關。因此要排除這一點。
好吧,我信服了,但我實際上在哪裡找到好的標籤?
從大型 標籤組列表 開始。在這裡,我將介紹一些特別有趣的組。
最佳標籤以指定胸部大小、可見性、胸部焦點的服裝
各種性行為的長列表
包括束縛姿勢的性姿勢
裸體類型、部分裸體、泳裝。
背景顏色
光照類型,對你的結果有很大影響
角度、透視、構圖
面部表情、情感(包括性情感)、面部特徵
將標籤組合在一起:讓我們開始提示吧!
不知道從何開始?去看看 標籤組 ,思考在你夢想中的圖像中,視覺上最重要的是什麼。
我通常喜歡使用 5 組單詞的格式,裡面有子類別。
我試著用換行來分隔這些概念,這有助於我快速進行調整。換行不會影響生成。
請記住,這是一個非常粗略的指導。混合這個順序是可以的,特別是在一個類別內。
風格(寫實、色彩調色板等)
視角
光線、一天中的時間(白天、夜晚、日落等)
2. 主題
主要主題(1boy、1girl、物體、風景等) (1girl 只是 Danbooru 的方式表示「1 girl」,並將其與 2girls 和 3girls 等分開)
3. 動作
性行為
性姿勢
姿勢
主要特徵(大小、重量、身體類型、體脂肪、膚色等)
身體元素(胸部大小 、乳頭、臀部等)
面部相關(眼睛顏色、髮型等)
表情(快樂、驚訝、嚴肅、堅定等)
衣服
5. 背景
主要環境(室內、室外等)
天氣(風、雨、雪等)
物體(家具、車輛等)
等等,這不是很長且複雜嗎?
是的,確實如此!但你不必有你不想要的任何類別,單個詞就可以滿足一個類別。這真的取決於你想要的控制程度。讓我們看看一些例子。
我在想一個從下方拍攝的黑色女僕裝。背景無所謂,但我想要酷炫的電影效果。為了獲得靈感,我會點擊我感興趣的每個類別和子類別上方的鏈接。
構圖:from_below,主題:
關於提示的長度
提示是通過單詞(或單詞的塊)來拆分的,以將其轉換為稱為標記的數字表示。根據使用的模型和標記的標準化方式,提示的某些部分將獲得更多或更少的關注。我的經驗法則是:提示越長,你對整個提示的控制就越多。
如果你想進一步了解這個問題,這裡有一些資源:
使用 SDXL 和 SD15 模型的標記 – Alen Knight
標記標準化 & 權重解釋 – BlenderNeko (Github)
示例
這裡是一個遵循結構的示例。我通常會放一些換行,以便更好地查看提示的主要區域。
sidelighting, light particles,
1girl, ginger, solo, smirk
sweat, freckles, small breasts,
ginger hair, long hair, straight hair,
blue eyes, glowing eyes, glasses, looking at viewer,
smile, smirk, grin, frown,
white tank top,
indoor, library,
sunset, sunny, daylight,
desk, chair,
如你所見,換行並不完美地劃分結構的 5 個字段。根據你想生成的內容,視覺上分隔較小和較長的部分可能更有意義。在這裡,主題 、動作 和姿勢 的身體被分組在一起:將它們分開會造成視覺上的混亂。
使用案例
這裡有一些使用案例和喜愛的關鍵字。我試著按邏輯組織,從最一般到更具體。我建議根據你的需要挑選,而不是複製整行。
你還會發現我在結構中放置它的位置的參考。我將使用格式為 [xx.yy] 的 ID,使用類別及其子類別的縮寫。
請記住,其中一些也可以在出現順序中更高或更低(例如,倒立 可以放在 [compos.pov] 或 [body.posture])。
通用
這是我在幾乎所有提示中使用的,以影響圖像的整體質量。我通常會添加額外的負面關鍵字,如果出現我不喜歡的東西,但不會在之前。再次強調,我喜歡保持簡短和簡單。
以下列表涵蓋了一些經典案例,詳細說明了正面 和負面 提示。
質量(SD1.5) (absurdres ,最佳質量,傑作:1.4), (最差質量,低質量,lowres ,正常質量:1.4)
質量(Pony) score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, score_6, score_5, score_4,
細節 詳細,詳細的身體,詳細的面部
負面+ 文字,標誌,水印,數字,多視圖, 單色, 不良比例, 解剖學無意義, 不良手部, 不良面部
注意:負面+ 是一個額外的列表,我根據情況挑選。在我的經驗中,與解剖學相關的負面關鍵字不一定會改善結果,所以我只是將它們放在一邊以備不時之需。
場景
動作 [compos.style]: 運動線 強調線 速度線, 殘影, 運動模糊 彈跳 (+頭髮 胸部 臀部 等), 臀部波紋 汗珠, 顫抖, 搖晃, 抽搐, 音效, 閃亮的汗水
光照 [compos.light]: 背光, 微弱的光,邊緣光, 黃昏, 日落, 黎明, 日出, 光粒子, 光線, 陽光, 斑駁的陽光, 樹蔭, 光裂縫
熱 [body.posture]: 汗水, 出汗, 非常出汗, 大量出汗 , 汗珠, 濕 (+衣服 ,頭髮 , 等), 汗濕的衣服 , 熱 , 中暑 , 臉紅 , 全臉臉紅 , 身體臉紅 , 呼吸 , 重呼吸 , 冒蒸汽的身體 ,
群交 [subject]: 多個男孩 /女孩 , 群交, 群交, 狂歡, 狗堆, 愛的列車, 三人行, 注意:精確的數量用 x 男孩/ x 女孩。
主題
多色頭髮 [subject],[hair]: 多色頭髮 , 漸變頭髮 , 有色髮尖 , <color-1> 頭髮, <color-2> 頭髮
微笑臉 [body.express]: 微笑 , 得意 , 皺眉 , 得意的臉 ,
黑道 [subject],[body]: 黑道 , 刺青 (入墨 , 全身 , 等), 穿孔 (鼻子, 肚臍, 乳頭 , 等), 化妝
惡魔 [subject],[body]: 惡魔 , 惡魔女孩 , 角 (惡魔, 龍, 捲曲的, 牛角, 等), 尾巴 (惡魔, 抬起, 等), 有色皮膚 (紅色, 黑色, 等)
哥布林 [subject],[body]: 哥布林 , 女性哥布林 , 綠色皮膚 , 尖耳朵 , 獠牙
毛茸茸 [subject]: 毛茸茸 , 毛茸茸女性 , 毛茸茸與 [毛茸茸 /非毛茸茸 ], <color> 毛, 獠牙 (s )