Rebalance Qwen v1.0 亚洲女性模型

Rebalance Qwen v1.0 亚洲女性模型是一款基于 Qwen 大模型底座深度优化训练的专属模型，精准捕捉亚洲女性的面部特征、发型纹理与体态气质，支持二次元、写实等多元风格生成，兼具细节表现力与风格适配性，能高效满足图像创作、虚拟形象设计等场景需求。

Rebalance 的主要目标是制作逼真的输出，克服常见的 AI 伪影（例如油性、塑料或过于平坦的外观），提供具有自然纹理、深度和视觉真实性的图像。

下载包含工作流，包含3个lora，lora是基于rebalance和官方模型差异提取的，三个区别是rank的区别，大的rank会比较接近rebalance。

培训策略

培训分多个阶段进行，大致分为两个阶段：

字幕和元数据

该模型使用两种互补的字幕格式进行训练：纯文本和结构化 JSON。每个数据子集都采用定制的 JSON 模式来指导生成过程中的细粒度控制。

对于 cosplay 图像，JSON 包括：
- {"caption": "...","image_type": "...","image_style": "...","lighting_environment": "...","tags_list": [...],"brightness": number,"brightness_name": "...","hpsv3_score": score,"aesthetics": "...","cosplayer": "anonymous_id"}

注意：Cosplayer 的名字是匿名的（使用占位符 ID），只是为了帮助模型在训练期间关联同一主题的多张图像 - 不保留任何真实身份。

对于高质量的照片， JSON结构强调场景构图：
- {"subject": "...","foreground": "...","midground": "...","background": "...","composition": "...","visual_guidance": "...","color_tone": "...","lighting_mood": "...","caption": "..."}

除了结构化 JSON 之外，所有图像还使用了纯文本字幕和随机字幕丢弃（即某些训练步骤不使用字幕或使用部分元数据）进行训练。这种双重方法增强了可控性和泛化能力。

推理指导

技术细节

所有训练均使用lrzjason/T2ITrainer进行，这是 Hugging Face Diffusers DreamBooth 训练脚本的定制扩展。该框架支持高级文本转图像架构，包括 Qwen 和 Qwen-Edit (2509)。

先前的工作

该项目建立在先前开发的几种工具的基础上，旨在增强基于扩散的图像生成和编辑的可控性和效率：

ComfyUI-QwenEditUtils ：ComfyUI 中基于 Qwen 的图像编辑实用程序节点集合，支持多参考图像调节、灵活调整大小以及用于高级编辑工作流程的精确提示编码。
https://github.com/lrzjason/Comfyui-QwenEditUtils
ComfyUI-LoraUtils：ComfyUI 中用于高级 LoRA 操作的一组节点，支持对 LoRA 加载的细粒度控制、逐层修改（通过正则表达式和索引范围）以及对扩散或 CLIP 模型的选择性应用。
https://github.com/lrzjason/Comfyui-LoraUtils
T2ITrainer：一个轻量级的、基于 Diffusers 的训练框架，旨在跨多个架构（包括 Qwen Image、Qwen Edit、Flux、SD3.5 和 Kolors）进行高效的 LoRA（和 LoKr）训练，并支持单图像、配对和多参考训练范式。
https://github.com/lrzjason/T2ITrainer

这些工具共同建立了一个强大的生态系统，用于训练、编辑和部署具有高精度和灵活性的个性化传播模型。

资源下载

下载价格VIP专享

仅限VIP下载升级VIP