哈希游戏- 哈希游戏平台- 哈希游戏官方网站
模型的核心架构由三大模块支撑:生图编辑、统一模型能力,以及生图编辑后的训练流程。基于SD3.5-Medium架构的Skywork UniPic2.0,实现了从文本输入向文本与图像双重输入的跨越,将单纯的生图能力拓展至兼具生成与编辑的双重功能。通过冻结生图编辑模块,结合多模态模型Qwen2.5-VL-7B与Pre-Train连接器,模型进一步整合了理解、生成与编辑的一体化能力。经由连接器与编辑模块的联合微调,最终成就了这一全面而强大的模型。
昆仑万维集团的此番开源,不仅向开发者与研究人员敞开了全面合作的大门,提供了包括模型权重、推理代码及强化策略在内的丰富资源。尤为Skywork UniPic2.0的生成模块基于2B参数的SD3.5-Medium架构训练,其在生图和编辑方面的性能指标,甚至超越了参数规模更大的同类模型。模型还融入了强化学习策略,借助Flow-GRPO首创的渐进式双任务强化策略,显著提升了模型对复杂指令的解析能力,以及图像生成与编辑的一致性。