AI 美甲生成器|训练笔记

 AI 美甲生成器|训练笔记(图1)


by: 周末 & 海辛


和@周末 基于 Stable Diffusion 进行训练,做出了一款由文字生成美甲图案的 AI 美甲生成器,以下是一些生成成果。


AI 美甲生成器|训练笔记(图2)

Fine tune 模型的训练其实并不难,目前有很多基于 Stable Diffusion fine tune pipeline,也多半会提供一个 end-to-end 的 notebook 给用户使用。


理论上只需要指向自己的数据集就可以点运行运行运行,然后高枕无忧地等着模型训练好上传到 Hugging Face。但天下哪有不出 bug 的 e2e pipepline,更遑论各种环境都装的完美顺畅的便宜云服务器。碰上报错只能勉勉强强查查,正所谓 Stack Overflow 是我的(社区)大学,GitHub issues 是我的售后热线(x


AI 美甲生成器|训练笔记(图3)


在整个训练的过程中,最重要的还是准备数据集,在美甲的数据集中,需要对抓取的图片进行预处理去除无关信息并保证统一的版式,这是最耗费精力也是对训练影响最大的部分


其次是图片的描述,因为 SD 是监督学习,所以必须给每张图片打上准确合适的标签,提供给SD来理解语义与图像之间的关联。


AI 美甲生成器|训练笔记(图4)


我们借助了另一个机器学习模型 BLIP 来给图片打 label,BLIP 感觉是一个一周工作 100 小时的社畜,经常在描述语里自言自语和咆哮,比如:

a bunch of fake nails with flowers on them, inspired by Louis Comfort Tiffany, cloisonnism, ffxiv heavensward, is this loss?, ebay listing thumbnail, presenting magic gem, earth tones, vases and bottles, the last guardian skinny towers, aesthetic!!!!!!!!!!

以及,

black and white stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil stil, an airbrush painting, cobra, nail art, the dress's lower, pale white detailed reptile skin, posable pvc, talons, panels


(这种醉汉模式的标注力真的让人一言难尽,如果重来一次我会选择 Clip Interrogator)

AI 美甲生成器|训练笔记(图5)
我们对 Blip 标注的内容进行了人工的清理和修正后,就都丢给 stable diffusion 开始学习了。
进度条往前跑,每训练一些步数,模型就会 dump 出效果图,一开始它做出来的图是这样的:

AI 美甲生成器|训练笔记(图6)
努力学习之后它做出来的图就变成了:
AI 美甲生成器|训练笔记(图7)

看着效果图从莫名其妙到走上正轨还挺有趣的,是一种不断有正反馈的体验,意外地很有成就感。
等到最终训练完成,我们会得到一个 14GB 的 checkpoint,记录所有模型的参数。下载存储都很费时间和空间。好在可以将其转换为 HF 的 diffusers,所需的储存空间会大大降低,并且可以直接调用 diffusers 的 API 来测试生成图片,比 SD 自带的 text2img 脚本要方便很多。

最终模型和 Demo 在 Hugging Face 上发布,并且在 Twitter 上得到了 Hugging Face 官号的转发。


AI 美甲生成器|训练笔记(图8)

Hugging Face 是机器学习届的 GitHub , 有非常良好的社区氛围,在制作美甲模型的过程中,Hugging Face 的 Stuff - AK 和 Patrick von Platen,都有帮助我们。(直到发布许久后还会提意见,多少有一些被暖  juan 到。)


除此以外 Hugging Face 上有 无限的存储空间 用于上传模型;Database, 模型和 Space 之间的互相索引也做得很好;还可以使用 GradioStreamlit 很方便地制作前端 demo 的 UI;最近还上线了 Tasks 帮助用户进行实用机器学习入门。 


我觉得 Hugging Face 是 showcase 自己的 AI 模型以及向 AI 界其他人学习的最好的场合。


AI 美甲生成器|训练笔记(图9)
上传好模型后,我 Duplicate Space 了 Hugging face 上 text to pokemon Space,在此基础上改为调用 Nail Set Diffuser 的模型,从而快速地做出了 AI 美甲生成器的 UI 界面。


这样其他用户皆可通过该界面快速生成美甲,GPU 也是使用的 Hugging Face 提供的云端 GPU. (有免费的 GPU 可供选择,但越贵的 GPU 速度会越快)


AI 美甲生成器|训练笔记(图10)

>> 模型下载地址:
https://huggingface.co/ringhyacinth/nail-set-diffuser


>> Hugging Face Space:https://huggingface.co/spaces/ringhyacinth/Nail-Diffuser


最后分享几张其他用户的测试成果:


AI 美甲生成器|训练笔记(图11)


AI 美甲生成器|训练笔记(图12)

AI 美甲生成器|训练笔记(图13)


AI 美甲生成器|训练笔记(图14)

AI 美甲生成器|训练笔记(图15)


AI 美甲生成器|训练笔记(图16)

AI 美甲生成器|训练笔记(图17)

收藏

没有啦!

相关文章

最新网址
pika
pika

Pika是一款文字生成视频的AI模型

gamma
gamma

​gamma AI一键生成-AI在线PPT编辑平台

灵喵相机
灵喵相机

只需上传一张你的自拍,完全满足你的个性需求。

Plasmo
Plasmo

将草图转为3D模型

Ponzu
Ponzu

AI生成3D无缝贴图纹理

人生若只如初见
  • 用户登录