所有分类
  • 所有分类
  • Civitai
  • LoRA

Rebalance Qwen v1.0 亚洲女性模型

Rebalance Qwen v1.0 亚洲女性模型是一款基于 Qwen 大模型底座深度优化训练的专属模型,精准捕捉亚洲女性的面部特征、发型纹理与体态气质,支持二次元、写实等多元风格生成,兼具细节表现力与风格适配性,能高效满足图像创作、虚拟形象设计等场景需求。

Rebalance 的主要目标是制作逼真的输出,克服常见的 AI 伪影(例如油性、塑料或过于平坦的外观),提供具有自然纹理、深度和视觉真实性的图像。

下载包含工作流,包含3个lora,lora是基于rebalance和官方模型差异提取的,三个区别是rank的区别,大的rank会比较接近rebalance。

培训策略

培训分多个阶段进行,大致分为两个阶段:

  1. 角色扮演摄影训练
    专注于改善面部表情、姿势动态和整体人体真实感——特别是针对女性对象。
  2. 高质量照片增强
    旨在通过利用专业策划的摄影参考来提升大气深度、构图平衡和美学精致度。

字幕和元数据

该模型使用两种互补的字幕格式进行训练:纯文本和结构化 JSON。每个数据子集都采用定制的 JSON 模式来指导生成过程中的细粒度控制。

  • 对于 cosplay 图像,JSON 包括:
    • {"caption": "...","image_type": "...","image_style": "...","lighting_environment": "...","tags_list": [...],"brightness": number,"brightness_name": "...","hpsv3_score": score,"aesthetics": "...","cosplayer": "anonymous_id"}

注意:Cosplayer 的名字是匿名的(使用占位符 ID),只是为了帮助模型在训练期间关联同一主题的多张图像 - 不保留任何真实身份。

  • 对于高质量的照片, JSON结构强调场景构图
    • {"subject": "...","foreground": "...","midground": "...","background": "...","composition": "...","visual_guidance": "...","color_tone": "...","lighting_mood": "...","caption": "..."}

除了结构化 JSON 之外,所有图像还使用了纯文本字幕和随机字幕丢弃(即某些训练步骤不使用字幕或使用部分元数据)进行训练。这种双重方法增强了可控性和泛化能力。

推理指导

  • 为了获得最大的美学精度和风格控制,请在推理期间使用完整的 JSON 格式。
  • 为了更广泛的概括或更简单的提示,建议使用纯文本字幕。

技术细节

所有训练均使用lrzjason/T2ITrainer进行,这是 Hugging Face Diffusers DreamBooth 训练脚本的定制扩展。该框架支持高级文本转图像架构,包括 Qwen 和 Qwen-Edit (2509)。

先前的工作

该项目建立在先前开发的几种工具的基础上,旨在增强基于扩散的图像生成和编辑的可控性和效率:

  • ComfyUI-QwenEditUtils :ComfyUI 中基于 Qwen 的图像编辑实用程序节点集合,支持多参考图像调节、灵活调整大小以及用于高级编辑工作流程的精确提示编码。
    https://github.com/lrzjason/Comfyui-QwenEditUtils
  • ComfyUI-LoraUtils:ComfyUI 中用于高级 LoRA 操作的一组节点,支持对 LoRA 加载的细粒度控制、逐层修改(通过正则表达式和索引范围)以及对扩散或 CLIP 模型的选择性应用。
    https://github.com/lrzjason/Comfyui-LoraUtils
  • T2ITrainer:一个轻量级的、基于 Diffusers 的训练框架,旨在跨多个架构(包括 Qwen Image、Qwen Edit、Flux、SD3.5 和 Kolors)进行高效的 LoRA(和 LoKr)训练,并支持单图像、配对和多参考训练范式。
    https://github.com/lrzjason/T2ITrainer

这些工具共同建立了一个强大的生态系统,用于训练、编辑和部署具有高精度和灵活性的个性化传播模型。

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
0
显示验证码
没有账号?注册  忘记密码?