如何本地安裝 FLUX.2：完整安裝指南

大约 6 分鐘

如何本地安裝 FLUX.2：完整安裝指南

FLUX.2 是 Black Forest Labs 具有突破性的第二代 AI 影像生成與編輯模型。擁有 320 億參數，這款先進模型在 AI 影像技術方面代表重大飛躍，提供比前代更優秀的文字轉影像生成、影像編輯功能以及提示詞升級。

什麼是 FLUX.2？

FLUX.2 是一款擁有 320 億參數的 flow matching transformer 模型，擅長同時生成和編輯多張影像。由同一團隊 Black Forest Labs 開發，他們同時打造了頗受好評的 FLUX.1 系列。FLUX.2 提供更強性能、更佳影像品質與更精細的編輯功能。

FLUX.2 主要特色

文字轉影像生成：從簡單文字描述產生驚人且細緻的影像
影像編輯：利用自然語言提示詞，修改並增強現有影像
影像轉影像：將影像轉換為不同風格或變化版本
提示詞升級：強化並優化文字提示以得到更佳效果
多影像處理：同時處理多張影像
浮水印功能：內建隱形浮水印及 C2PA 元資料標記以確保真實性

系統需求

在本地安裝 FLUX.2 之前，請確認您的系統符合以下需求：

最低硬體需求

GPU：H100 等級或更高 GPU（用於完整模型）
VRAM：完整 FLUX.2-dev 模型需 80GB 以上
RAM：建議系統記憶體 64GB 以上
儲存空間：100GB 以上可用空間，用於模型權重
Python：3.10 或 3.12（視 CUDA 版本而定）

消費級硬體選項

針對擁有 RTX 4090 或相似消費級 GPU 的使用者：

提供 4-bit 量化模型
遠端文本編碼器 減少 VRAM 需求
支援 CPU 卸載 以管理記憶體

安裝方式

方式一：直接安裝（H100 GPU）

# 克隆程式庫
git clone https://github.com/black-forest-labs/flux2.git
cd flux2

# 建立虛擬環境
python3.10 -m venv .venv
source .venv/bin/activate

# 安裝相依套件（CUDA 12.6）
pip install -e . --extra-index-url https://download.pytorch.org/whl/cu126 --no-cache-dir

# 設定環境變數
export FLUX2_MODEL_PATH="<flux2_path>"
export AE_MODEL_PATH="<ae_path>"

# 啟用 CPU 卸載以降低 VRAM 消耗
python scripts/cli.py --cpu_offloading True

方式二：GB200 設置

# 建立虛擬環境
python3.12 -m venv .venv
source .venv/bin/activate

# 安裝相依套件（CUDA 12.9）
pip install -e . --extra-index-url https://download.pytorch.org/whl/cu129 --no-cache-dir

# 使用 GB200 配置執行
export FLUX2_MODEL_PATH="<flux2_path>"
export AE_MODEL_PATH="<ae_path>"
export PYTHONPATH=src
python scripts/cli.py

方式三：Diffusers 整合（低 VRAM）

適合 RTX 4090 使用者或 VRAM 限制較多者：

import torch
from transformers import Flux2Pipeline
from bitsandbytes import quantization_config

# 設定 4-bit 量化
quantization_config = quantization_config.QuantizationConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=torch.bfloat16
)

# 載入量化後的管線
pipe = Flux2Pipeline.from_pretrained(
    "black-forest-labs/FLUX.2-dev",
    torch_dtype=torch.bfloat16,
    quantization_config=quantization_config
)

# 使用遠端文本編碼器（如可用）
# pipe.text_encoder = remote_text_encoder

# 生成影像
prompt = "A cinematic shot of a mountain landscape at sunset"
image = pipe(
    prompt,
    num_inference_steps=50,
    guidance_scale=4.0
).images[0]

image.save("flux2_output.png")

模型下載

您可從以下管道取得 FLUX.2 模型：

Hugging Face：black-forest-labs/FLUX.2-dev
GitHub：克隆官方程式庫以獲得最新更新
商業授權：生產應用請聯繫 Black Forest Labs

FLUX.2 與前版本比較

FLUX.2 vs FLUX.1

功能	FLUX.1	FLUX.2
參數	120 億（FLUX.1 Kontext）	320 億
影像品質	高	非常高
編輯能力	進階	優越
VRAM需求	40GB 以上	80GB 以上
速度	快	已優化
多影像支援	限制	支援

FLUX.2 主要改進：

參數提升 2.5 倍：從 120 億增至 320 億，提升影像品質
強化編輯功能：更精準且可控的影像編輯
多影像處理能力：能於單次推論中處理多張影像
更佳提示詞理解：增強複雜提示詞的辨識
先進浮水印技術：提升真實性驗證標準

與競品比較

FLUX.2 vs DALL-E 3

面向	FLUX.2	DALL-E 3
開源	是（開發版）	否
本地部署	是	否
成本	免費（僅硬體成本）	$0.04/張影像
影像品質	優秀	非常好
客製化	完全控制	有限
商業使用	需授權	API 訂閱制

FLUX.2 vs Midjourney

面向	FLUX.2	Midjourney
部署方式	本地／雲端	僅雲端
成本	一次性硬體投入	$10-$120/月
隱私權	完全掌控	有限
控制權	完全掌握	需審核
影像解析度	可配置	固定等級
速度	依硬體而定	約 1 分鐘

FLUX.2 vs Stable Diffusion

面向	FLUX.2	Stable Diffusion XL
品質	優越	非常好
易用性	中等	容易
模型大小	320 億	69 億
社群規模	持續成長	大型
客製化能力	高	非常高

本地部署與雲端定價比較

本地部署成本（一次性）

硬體	價格	FLUX.2 功能概述
RTX 4090（量化版）	$1,600	搭配技巧可實現完整功能
H100（80GB）	$30,000+	原生性能
GB200	$100,000+	企業級性能
雲端 H100	$4-8/小時	彈性租用

雲端 API 成本（持續性）

服務	價格
FLUX.2 API	請聯繫 Black Forest Labs
DALL-E 3	$0.04/張（1024×1024）
Midjourney	$10-$120/月
Stable Diffusion	免費（開源）

何時選擇本地部署

如果您需要：

每月處理數千張影像
完全資料隱私保護
完整模型自訂控制
穩定高量需求
避免 API 限流

建議選擇本地 FLUX.2

如您：

使用頻率不固定或低量
期望免維護操作
無硬體預算
需要保證正常運行時間
偏好按使用付費

建議選擇雲端 API

損益平衡分析

針對常規使用量：

DALL-E 3：約 3,000 張/月時損益平衡（$0.04/張）
Midjourney：基本方案約 4,000 張/月損益平衡
本地 FLUX.2：超過 1,000 張/月適合硬體投資

進階設定

性能優化

# 啟用優化
pipe.to("cuda")
pipe.enable_attention_slicing()  # 降低 VRAM 用量
pipe.enable_vae_slicing()       # 進一步減少 VRAM

# 使用 Flash Attention（如可用）
pipe.enable_flash_attention()

# 自訂生成設定
image = pipe(
    prompt="專業產品攝影",
    negative_prompt="模糊、低質量、扭曲",
    num_inference_steps=50,
    guidance_scale=3.5,
    max_sequence_length=256
).images[0]

批次處理

prompts = [
    "寧靜的山景",
    "未來城市景觀",
    "舒適的咖啡店內部"
]

# 處理多個提示詞
for i, prompt in enumerate(prompts):
    image = pipe(prompt, num_inference_steps=50).images[0]
    image.save(f"output_{i}.png")

常見問題排除

VRAM 報錯

解決方案：使用 --cpu_offloading True 參數
替代方案：使用 4-bit 量化模型
升級建議：考慮升級 GPU 或使用雲端實例

執行緩慢

啟用：PyTorch 編譯優化
使用：FP16/BF16 精度
檢查：GPU 溫度與節流狀況

匯入錯誤

確保 CUDA 與 PyTorch 版本相容
清潔虛擬環境中重新安裝相依套件
確認 Python 版本（3.10 / 3.12）符合需求

結語

在本地安裝 FLUX.2 讓您享有前所未有的 AI 影像生成與編輯控制力。雖然硬體要求不低，但對於重度使用者而言，隱私、客製化及成本節省的優勢令人難以抗拒。

有企業級 GPU 可使用者，FLUX.2 是目前開源影像生成技術的巔峰，能力媲美甚至超越多數商業 API。消費硬體用戶則可以透過量化版本以最少畫質損失輕鬆入門。

無論您是研究人員、開發者或創意專業人士，FLUX.2 的本地部署功能都打開了 AI 驅動影像創作的新可能，且完整掌控您的資料與工作流程。

準備開始了嗎？ 從 GitHub 或 Hugging Face 下載 FLUX.2 模型，踏出您使用尖端 AI 影像生成技術的第一步！