Spaces:

RioShiina
/

ImageGen

Running on Zero

App Files Files Community

RioShiina commited on 6 days ago

Commit

8dc4426

verified ·

1 Parent(s): dc0cea5

Upload folder using huggingface_hub

Browse files

Files changed (11) hide show

README.md +1 -0
core/pipelines/sd_image_pipeline.py +3 -0
core/pipelines/workflow_recipes/_partials/conditioning/ideogram-4.yaml +114 -0
requirements.txt +2 -2
yaml/constants.yaml +8 -0
yaml/file_list.yaml +14 -0
yaml/image_gen_features.yaml +5 -0
yaml/model_architectures.yaml +4 -0
yaml/model_defaults.yaml +11 -9
yaml/model_list.yaml +9 -0
yaml/pid.yaml +1 -1

README.md CHANGED Viewed

@@ -41,6 +41,7 @@ models:
   - Comfy-Org/HiDream-I1_ComfyUI
   - Comfy-Org/HiDream-O1-Image
   - Comfy-Org/HunyuanImage_2.1_ComfyUI
   - Comfy-Org/Lens
   - Comfy-Org/LongCat-Image
   - Comfy-Org/Lumina_Image_2.0_Repackaged

   - Comfy-Org/HiDream-I1_ComfyUI
   - Comfy-Org/HiDream-O1-Image
   - Comfy-Org/HunyuanImage_2.1_ComfyUI
+  - Comfy-Org/Ideogram-4
   - Comfy-Org/Lens
   - Comfy-Org/LongCat-Image
   - Comfy-Org/Lumina_Image_2.0_Repackaged

core/pipelines/sd_image_pipeline.py CHANGED Viewed

@@ -173,11 +173,14 @@ class SdImagePipeline(BasePipeline):
                 "vae_chain": [ui_inputs.get('vae_name')] if ui_inputs.get('vae_name') else [],
                 "hidream_o1_smoothing_chain": hidream_o1_smoothing_data,
                 "pid_chain": [ui_inputs.get('pid_settings', 'OFF')] if is_pid_enabled else [],
             }
             if isinstance(path_or_components, dict):
                 workflow_inputs.update({
                     'unet_name': path_or_components.get('unet'),
                     'vae_name': ui_inputs.get('vae_name') or path_or_components.get('vae'),
                     'clip_name': path_or_components.get('clip'),
                     'clip1_name': path_or_components.get('clip1'),

                 "vae_chain": [ui_inputs.get('vae_name')] if ui_inputs.get('vae_name') else [],
                 "hidream_o1_smoothing_chain": hidream_o1_smoothing_data,
                 "pid_chain": [ui_inputs.get('pid_settings', 'OFF')] if is_pid_enabled else [],
+                "scheduler_width": ui_inputs.get('width', 1024),
+                "scheduler_height": ui_inputs.get('height', 1024),
             }
             if isinstance(path_or_components, dict):
                 workflow_inputs.update({
                     'unet_name': path_or_components.get('unet'),
+                    'unet_uncond_name': path_or_components.get('unet_uncond'),
                     'vae_name': ui_inputs.get('vae_name') or path_or_components.get('vae'),
                     'clip_name': path_or_components.get('clip'),
                     'clip1_name': path_or_components.get('clip1'),

core/pipelines/workflow_recipes/_partials/conditioning/ideogram-4.yaml ADDED Viewed

	@@ -0,0 +1,114 @@

+nodes:
+  unet_loader:
+    class_type: UNETLoader
+    title: "Load Diffusion Model"
+    params:
+      weight_dtype: "default"
+  cfg_override:
+    class_type: CFGOverride
+    title: "CFG Override"
+    params:
+      start_percent: 0.9
+      end_percent: 1.0
+  unet_uncond_loader:
+    class_type: UNETLoader
+    title: "Load Unconditional Model"
+    params:
+      weight_dtype: "default"
+  guider:
+    class_type: DualModelGuider
+    title: "Dual Model CFG Guider"
+  clip_loader:
+    class_type: CLIPLoader
+    title: "Load CLIP"
+    params:
+      type: "ideogram4"
+      device: "default"
+  ksampler_select:
+    class_type: KSamplerSelect
+  scheduler_node:
+    class_type: Ideogram4Scheduler
+    params:
+      mu: 0.5
+      std: 1.75
+  random_noise:
+    class_type: RandomNoise
+  ksampler:
+    class_type: SamplerCustomAdvanced
+  vae_loader:
+    class_type: VAELoader
+    title: "Load VAE"
+connections:
+  - from: "unet_loader:0"
+    to: "cfg_override:model"
+  - from: "cfg_override:0"
+    to: "guider:model"
+  - from: "unet_uncond_loader:0"
+    to: "guider:model_negative"
+  - from: "clip_loader:0"
+    to: "pos_prompt:clip"
+  - from: "clip_loader:0"
+    to: "neg_prompt:clip"
+  - from: "pos_prompt:0"
+    to: "guider:positive"
+  - from: "neg_prompt:0"
+    to: "guider:negative"
+  - from: "guider:0"
+    to: "ksampler:guider"
+  - from: "ksampler_select:0"
+    to: "ksampler:sampler"
+  - from: "scheduler_node:0"
+    to: "ksampler:sigmas"
+  - from: "random_noise:0"
+    to: "ksampler:noise"
+  - from: "vae_loader:0"
+    to: "vae_decode:vae"
+  - from: "vae_loader:0"
+    to: "vae_encode:vae"
+dynamic_lora_chains:
+  lora_chain:
+    template: "LoraLoader"
+    output_map:
+      "unet_loader:0": "model"
+      "clip_loader:0": "clip"
+    input_map:
+      "model": "model"
+      "clip": "clip"
+    end_input_map:
+      "model": ["cfg_override:model"]
+      "clip": ["pos_prompt:clip", "neg_prompt:clip"]
+dynamic_conditioning_chains:
+  conditioning_chain:
+    guider_node: "guider"
+    guider_target_inputs: ["positive"]
+    clip_source: "clip_loader:0"
+dynamic_pid_chains:
+  pid_chain:
+    ksampler_node: "ksampler"
+ui_map:
+  unet_name: "unet_loader:unet_name"
+  unet_uncond_name: "unet_uncond_loader:unet_name"
+  clip_name: "clip_loader:clip_name"
+  vae_name: "vae_loader:vae_name"
+  scheduler_width: "scheduler_node:width"
+  scheduler_height: "scheduler_node:height"
+  seed: "random_noise:noise_seed"
+  steps: "scheduler_node:steps"
+  cfg:
+    - "guider:cfg"
+    - "cfg_override:cfg"
+  sampler_name: "ksampler_select:sampler_name"
+  scheduler: "dummy:scheduler"
+  denoise: "dummy:denoise"

requirements.txt CHANGED Viewed

@@ -1,6 +1,6 @@
 comfyui-frontend-package==1.45.15
 comfyui-workflow-templates==0.9.98
-comfyui-embedded-docs==0.5.2
 torch
 torchsde
 torchvision
@@ -23,7 +23,7 @@ SQLAlchemy>=2.0.0
 filelock
 av>=16.0.0
 comfy-kitchen==0.2.10
-comfy-aimdo==0.4.8
 requests
 simpleeval>=1.0.0
 blake3

 comfyui-frontend-package==1.45.15
 comfyui-workflow-templates==0.9.98
+comfyui-embedded-docs==0.5.3
 torch
 torchsde
 torchvision
 filelock
 av>=16.0.0
 comfy-kitchen==0.2.10
+comfy-aimdo==0.4.9
 requests
 simpleeval>=1.0.0
 blake3

yaml/constants.yaml CHANGED Viewed

@@ -7,6 +7,14 @@ MAX_REFERENCE_LATENTS: 10
 LORA_SOURCE_CHOICES: ["Civitai", "File"]
 RESOLUTION_MAP:
   pixeldit:
     "1:1 (Square)": [1024, 1024]
     "16:9 (Landscape)": [1344, 768]

 LORA_SOURCE_CHOICES: ["Civitai", "File"]
 RESOLUTION_MAP:
+  ideogram-4:
+    "1:1 (Square)": [1024, 1024]
+    "16:9 (Landscape)": [1344, 768]
+    "9:16 (Portrait)": [768, 1344]
+    "4:3 (Classic)": [1152, 896]
+    "3:4 (Classic Portrait)": [896, 1152]
+    "3:2 (Photography)": [1216, 832]
+    "2:3 (Photography Portrait)": [832, 1216]
   pixeldit:
     "1:1 (Square)": [1024, 1024]
     "16:9 (Landscape)": [1344, 768]

yaml/file_list.yaml CHANGED Viewed

@@ -403,6 +403,15 @@ file:
       repo_id: "comfyanonymous/ControlNet-v1-1_fp16_safetensors"
       repository_file_path: "control_v11u_sd15_tile_fp16.safetensors"
   diffusion_models:
     # PixelDiT
     - filename: "pixeldit_1300m_1024px_mxfp8.safetensors"
       source: "hf"
@@ -708,6 +717,11 @@ file:
       repo_id: "alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union-2.1"
       repository_file_path: "Z-Image-Turbo-Fun-Controlnet-Tile-2.1-8steps.safetensors"
   text_encoders:
     # PixelDiT
     - filename: "gemma_2_2b_it_elm_fp8_scaled.safetensors"
       source: "hf"

       repo_id: "comfyanonymous/ControlNet-v1-1_fp16_safetensors"
       repository_file_path: "control_v11u_sd15_tile_fp16.safetensors"
   diffusion_models:
+    # Ideogram-4
+    - filename: "ideogram4_nvfp4_mixed.safetensors"
+      source: "hf"
+      repo_id: "Comfy-Org/Ideogram-4"
+      repository_file_path: "diffusion_models/ideogram4_nvfp4_mixed.safetensors"
+    - filename: "ideogram4_unconditional_nvfp4_mixed.safetensors"
+      source: "hf"
+      repo_id: "Comfy-Org/Ideogram-4"
+      repository_file_path: "diffusion_models/ideogram4_unconditional_nvfp4_mixed.safetensors"
     # PixelDiT
     - filename: "pixeldit_1300m_1024px_mxfp8.safetensors"
       source: "hf"
       repo_id: "alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union-2.1"
       repository_file_path: "Z-Image-Turbo-Fun-Controlnet-Tile-2.1-8steps.safetensors"
   text_encoders:
+    # Ideogram-4
+    - filename: "qwen3vl_8b_nvfp4.safetensors"
+      source: "hf"
+      repo_id: "Comfy-Org/Ideogram-4"
+      repository_file_path: "text_encoders/qwen3vl_8b_nvfp4.safetensors"
     # PixelDiT
     - filename: "gemma_2_2b_it_elm_fp8_scaled.safetensors"
       source: "hf"

yaml/image_gen_features.yaml CHANGED Viewed

@@ -8,6 +8,11 @@ default:
   - conditioning
   - vae
 pixeldit:
   enabled_chains:
   - conditioning

   - conditioning
   - vae
+ideogram-4:
+  enabled_chains:
+  - vae
+  - pid
 pixeldit:
   enabled_chains:
   - conditioning

yaml/model_architectures.yaml CHANGED Viewed

@@ -1,5 +1,6 @@
 architecture_order:
   - "PixelDiT"
   - "Lens"
   - "FLUX.2-KV"
   - "FLUX.2"
@@ -26,6 +27,9 @@ architectures:
   "PixelDiT":
     model_type: "pixeldit"
     controlnet_key: "PixelDiT"
   "Lens":
     model_type: "lens"
     controlnet_key: "Lens"

 architecture_order:
   - "PixelDiT"
+  - "Ideogram-4"
   - "Lens"
   - "FLUX.2-KV"
   - "FLUX.2"
   "PixelDiT":
     model_type: "pixeldit"
     controlnet_key: "PixelDiT"
+  "Ideogram-4":
+    model_type: "ideogram-4"
+    controlnet_key: "Ideogram-4"
   "Lens":
     model_type: "lens"
     controlnet_key: "Lens"

yaml/model_defaults.yaml CHANGED Viewed

@@ -6,12 +6,21 @@ Default:
   positive_prompt: ""
   negative_prompt: ""
 PixelDiT:
   _defaults:
     steps: 30
     cfg: 4.0
     sampler_name: "er_sde"
     scheduler: "simple"
 Lens:
   _defaults:
@@ -32,8 +41,6 @@ ERNIE-Image:
   "baidu/ERNIE-Image-Turbo":
     steps: 8
     cfg: 1.0
-    sampler_name: "euler"
-    scheduler: "simple"
 FLUX.2:
   _defaults:
@@ -50,13 +57,10 @@ FLUX.2:
 FLUX.2-KV:
   _defaults:
-    steps: 20
-    cfg: 4.0
-    sampler_name: "euler"
-    scheduler: "simple"
-  "black-forest-labs/FLUX.2-klein-9B-KV":
     steps: 4
     cfg: 1.0
 Z-Image:
   _defaults:
@@ -67,8 +71,6 @@ Z-Image:
   "Tongyi-MAI/Z Image Turbo":
     steps: 9
     cfg: 1.0
-    sampler_name: "euler"
-    scheduler: "simple"
 Qwen-Image:
   _defaults:

   positive_prompt: ""
   negative_prompt: ""
+Ideogram-4:
+  _defaults:
+    steps: 20
+    cfg: 7.0
+    sampler_name: "res_multistep"
+    scheduler: "simple"
+    positive_prompt: "NOTE: If you see \"Image blocked by safety filter\" it is because of safety training in the model itself, ImageGen does not have any safety filter."
 PixelDiT:
   _defaults:
     steps: 30
     cfg: 4.0
     sampler_name: "er_sde"
     scheduler: "simple"
+    negative_prompt: "low quality, worst quality, over-saturated, blurry, deformed, watermark"
 Lens:
   _defaults:
   "baidu/ERNIE-Image-Turbo":
     steps: 8
     cfg: 1.0
 FLUX.2:
   _defaults:
 FLUX.2-KV:
   _defaults:
     steps: 4
     cfg: 1.0
+    sampler_name: "euler"
+    scheduler: "simple"
 Z-Image:
   _defaults:
   "Tongyi-MAI/Z Image Turbo":
     steps: 9
     cfg: 1.0
 Qwen-Image:
   _defaults:

yaml/model_list.yaml CHANGED Viewed

@@ -7,6 +7,15 @@ Checkpoint:
           unet: "pixeldit_1300m_1024px_mxfp8.safetensors"
           clip: "gemma_2_2b_it_elm_fp8_scaled.safetensors"
           vae: "pixel_space"
   Lens:
     latent_type: flux2_latent
     models:

           unet: "pixeldit_1300m_1024px_mxfp8.safetensors"
           clip: "gemma_2_2b_it_elm_fp8_scaled.safetensors"
           vae: "pixel_space"
+  Ideogram-4:
+    latent_type: flux2_latent
+    models:
+      - display_name: "ideogram-ai/ideogram-4"
+        components:
+          unet: "ideogram4_nvfp4_mixed.safetensors"
+          unet_uncond: "ideogram4_unconditional_nvfp4_mixed.safetensors"
+          clip: "qwen3vl_8b_nvfp4.safetensors"
+          vae: "flux2-vae.safetensors"
   Lens:
     latent_type: flux2_latent
     models:

yaml/pid.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 PiD:
   - filepath: "pid_flux2_1024_to_4096_4step_mxfp8.safetensors"
     latent_format: "flux"
-    architectures: ["flux2", "flux2-kv", "lens", "ernie-image"]
   - filepath: "pid_qwenimage_1024_to_4096_4step_bf16.safetensors"
     latent_format: "qwenimage"
     architectures: ["anima", "qwen-image"]

 PiD:
   - filepath: "pid_flux2_1024_to_4096_4step_mxfp8.safetensors"
     latent_format: "flux"
+    architectures: ["flux2", "flux2-kv", "ideogram-4", "lens", "ernie-image"]
   - filepath: "pid_qwenimage_1024_to_4096_4step_bf16.safetensors"
     latent_format: "qwenimage"
     architectures: ["anima", "qwen-image"]