【ComfyUI】神クオリティ、Ideogram 4.0の導入と使い方

サイバーパンクな背景に、神クオリティ、Ideogram 4.0、ComfyUIと書いてある

文字崩れのない完璧なポスターやデザインが作れることで話題の「Ideogram 4.0」を、ComfyUIの導入と、その仕組みを解説します。

【ComfyUI】AIエージェントに丸投げでインストールから画像生成まで
パソコン初心者や非エンジニアの方でも、Aエージェント(Codex、Claude Code、 Antigravity等)に指示を丸投げするだけで、PC環境を一切汚さずにComfyUIの環境構築からAI動画生成までを数分で終わらせる方法をご紹介します。

Ideogram 4.0導入手順

Ideogram 4.0の公式ワークフローを正常に動作させるには、ComfyUIが最新の状態(v0.24.0以降)である必要があります。まずは環境の更新とテンプレートの準備を行います。

ComfyUIのバージョンアップ

  • ポータブル版(Portable)を使用している場合は、ComfyUIのメインフォルダ内にある update_comfyui.bat を実行します。
  • これにより、Ideogram 4.0のカスタムノードや各種機能に対応した最新バージョンへ自動的にアップデートされます。

公式テンプレートの読み込み

  • ComfyUIを起動後、画面左メニューのテンプレートから 「Ideogram v4: Text to Image」 をクリック。
  • 画面上に「Text to Image (Ideogram v4)」のワークフローが展開されます。

必要ファイルをダウンロード

テンプレートを読み込んだ初期状態では、画面に「Missing Models」という不足モデルの警告が表示されますので、それを開いて必要なファイルをダウンロード。

ファイル名保存先フォルダ役割
qwen3vl_8b_fp8_scaled.safetensorsmodels/text_encoders/ 入力された指示(プロンプト)を読み解く頭脳。
ideogram4_fp8_scaled.safetensorsmodels/diffusion_models/(ポジティブ) 文字やデザインを実際に組み立てて描くメインモデル。
ideogram4_unconditional_fp8_scaled.safetensorsmodels/diffusion_models/(ネガティブ) 余計なノイズを消し、純粋に画質を美しく整える専用モデル。
flux2-vae.safetensorsmodels/vae/計算されたデータを、目で見られる「画像」に変換するファイル。

ダウンロードがすべて完了したら、一度そのまま 「Run」 をクリックしてください。初期値として埋め込まれているスケートボーダーのポスター画像が一発で正常に生成されれば、ローカル環境の構築はすべて完了です。

使い方

  1. 「Text to Image (Ideogram v4)」ノードと「Save Image」ノードをctrl + Bでバイパス化
  2. 「Ideogram4 Caption Prompt Template」ノードに自然文でプロンプトを入力して「Run」
  3. 「Preview as Text」ノードに出力されたテキストをChatGPT等にコピペして「JSON形式のプロンプトを作って」と指示
  4. 出力されたJSON形式のプロンプトを「Text to Image (Ideogram v4)」ノードに貼り付ける
  5. バイパスを解除して「Run」→画像出力

上記2つは日本語も綺麗に生成できています。

これはさすがに崩れましたが、アイキャッチ画像を生成する程度なら実用に耐えうるという印象です。

2つのモデルを同時に走らせる「デュアル構造」

通常の画像生成AI(FLUXやSDXLなど)は、1つのモデルファイル(脳みそ)の中で「プロンプト通りの計算」と「画質を高める計算(ネガティブ)」を同時に行います。

しかしIdeogram 4.0は、役割ごとにモデルが2つに完全分離されています。

  • ポジティブ(指示の組み立て) ideogram4_fp8_scaled.safetensors
  • ネガティブ(画質の補正) ideogram4_unconditional_fp8_scaled.safetensors

この2つの独立したモデルファイルを同時に読み込み、「DualModelGuider」というノードで強力にハイブリッド合成しています。これが、他のモデルを圧倒する「文字が崩れない」デザイン力の秘密です。

Text to Image (Ideogram v4)

実際に画像を出力するメインのノードです。このノードの prompt 欄に入力されている、{ } で囲まれたデザイン指示書のようなデータ形式が「構造化されたJSON形式」です。背景、オブジェクト、配置する場所の数値(座標:bbox)、カラーコードなどが完璧にデータ化されているため、AIが迷わず狙い通りの画像を生成できます。

Ideogram4 Caption Prompt Template

自分では難しいJSONデータや座標を書けない時に使う、外部AI(ChatGPTやClaudeなど)向けの「命令書(プロンプトテンプレート)」を作成するノードです。

Bounding-box (BBox) でレイアウト

Bounding-boxとは、画像やデザイン、地図データなどで特定のオブジェクトを完全に囲む最小限の長方形(四角い枠)のことです。このBBoxを使えば座標を指定してテキストや人物を配置できます。

カスタムノードのKJNodes「Ideogram 4 Prompt Builder KJ」なら視覚的に設定可能です。JSON形式のプロンプトを自動で生成してくれるので、ChatGPT等にチャットする手間が省けます。