FLUX.2'yi Yerel Olarak Nasıl Kurulur: Tam Kurulum Rehberi
FLUX.2'yi Yerel Olarak Nasıl Kurulur: Tam Kurulum Rehberi
FLUX.2, Black Forest Labs'in çığır açan ikinci nesil AI görüntü oluşturma ve düzenleme modelidir. 32 milyar parametreye sahip bu son teknoloji model, AI görüntü teknolojisinde önemli bir ilerlemeyi temsil eder ve seleflerine kıyasla üstün metinden görüntü oluşturma, görüntü düzenleme yetenekleri ve prompt yükseltme sunar.
FLUX.2 Nedir?
FLUX.2, çoklu görüntü oluşturma ve düzenlemede mükemmel performans gösteren 32 milyar parametreli bir flow matching transformer modelidir. Övgü toplayan FLUX.1 serisinin arkasındaki ekip olan Black Forest Labs tarafından geliştirilmiş olan FLUX.2, geliştirilmiş performans, daha yüksek görüntü kalitesi ve daha gelişmiş düzenleme yetenekleri sunar.
FLUX.2’nin Ana Özellikleri
- Metinden Görüntü Oluşturma: Basit metin tanımlarından çarpıcı ve detaylı görüntüler yaratın
- Görüntü Düzenleme: Mevcut görüntüleri doğal dil promptları ile değiştirin ve geliştirin
- Görüntüden Görüntüye Dönüşüm: Görüntüleri farklı stillere veya varyasyonlara dönüştürün
- Prompt Yükseltme: Metin promptlarını iyileştirip detaylandırarak daha iyi sonuçlar alın
- Çoklu Görüntü İşleme: Aynı anda birden fazla görüntüyle çalışabilme
- Filigranlama: Yerleşik görünmez filigran ve C2PA meta veri işaretlemesi ile özgünlük garantisi
Sistem Gereksinimleri
FLUX.2'yi yerel olarak kurmadan önce, sisteminizin aşağıdaki gereksinimleri karşıladığından emin olun:
Asgari Donanım Gereksinimleri
- GPU: H100 eşdeğeri GPU veya daha iyisi (tam model için)
- VRAM: Tam FLUX.2-dev modeli için 80GB+
- RAM: 64GB+ sistem belleği önerilir
- Depolama: Model ağırlıkları için 100GB+ boş alan
- Python: CUDA sürümüne bağlı olarak 3.10 veya 3.12
Tüketici Donanımı Seçeneği
RTX 4090 veya benzeri tüketici GPU’ları için:
- 4-bit kuantizasyonlu kuantize modeller mevcut
- VRAM gereksinimlerini azaltmak için uzaktan metin kodlayıcı
- Belleği yönetmek için CPU offload yeteneği
Kurulum Yöntemleri
Yöntem 1: Doğrudan Kurulum (H100 GPU)
# Depoyu klonlayın
git clone https://github.com/black-forest-labs/flux2.git
cd flux2
# Sanal ortam oluşturun
python3.10 -m venv .venv
source .venv/bin/activate
# Bağımlılıkları yükleyin (CUDA 12.6)
pip install -e . --extra-index-url https://download.pytorch.org/whl/cu126 --no-cache-dir
# Ortam değişkenlerini ayarlayın
export FLUX2_MODEL_PATH="<flux2_path>"
export AE_MODEL_PATH="<ae_path>"
# Düşük VRAM için CPU offloading etkinleştirin
python scripts/cli.py --cpu_offloading TrueYöntem 2: GB200 Kurulumu
# Sanal ortam oluşturun
python3.12 -m venv .venv
source .venv/bin/activate
# Bağımlılıkları yükleyin (CUDA 12.9)
pip install -e . --extra-index-url https://download.pytorch.org/whl/cu129 --no-cache-dir
# GB200 konfigürasyonu ile çalıştırın
export FLUX2_MODEL_PATH="<flux2_path>"
export AE_MODEL_PATH="<ae_path>"
export PYTHONPATH=src
python scripts/cli.pyYöntem 3: Diffusers Entegrasyonu (Düşük VRAM)
RTX 4090 kullanıcıları veya sınırlı VRAM sahipler için:
import torch
from transformers import Flux2Pipeline
from bitsandbytes import quantization_config
# 4-bit kuantizasyon yapılandırması
quantization_config = quantization_config.QuantizationConfig(
load_in_4bit=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_use_double_quant=True,
bnb_4bit_compute_dtype=torch.bfloat16
)
# Kuantizasyon ile pipeline yükleme
pipe = Flux2Pipeline.from_pretrained(
"black-forest-labs/FLUX.2-dev",
torch_dtype=torch.bfloat16,
quantization_config=quantization_config
)
# Uzaktan metin kodlayıcı (mevcutsa) kullanımı
# pipe.text_encoder = remote_text_encoder
# Görüntü oluşturma
prompt = "Gün batımında sinematik bir dağ manzarası"
image = pipe(
prompt,
num_inference_steps=50,
guidance_scale=4.0
).images[0]
image.save("flux2_output.png")Model İndirme
FLUX.2 modellerine aşağıdan ulaşabilirsiniz:
- Hugging Face: black-forest-labs/FLUX.2-dev
- GitHub: En son güncellemeler için resmi depoyu klonlayın
- Ticari Lisans: Üretim kullanımı için Black Forest Labs ile iletişime geçin
FLUX.2 ve Önceki Sürümler Karşılaştırması
FLUX.2 ve FLUX.1 Karşılaştırması
| Özellik | FLUX.1 | FLUX.2 |
|---|---|---|
| Parametreler | 12B (FLUX.1 Kontext) | 32B |
| Görüntü Kalitesi | Yüksek | Çok Yüksek |
| Düzenleme Yeteneği | Gelişmiş | Üstün |
| VRAM Gereksinimi | 40GB+ | 80GB+ |
| Hız | Hızlı | Optimize Edilmiş |
| Çoklu Görüntü Desteği | Sınırlı | Var |
FLUX.2’deki Önemli Gelişmeler:
- 2,5 Kat Daha Fazla Parametre: Görüntü kalitesi için 12B’den 32B’ye yükseltildi
- Gelişmiş Düzenleme: Daha hassas ve kontrol edilebilir düzenleme
- Çoklu Görüntü İşleme: Tek inference’da birden çok görüntüyü yönetebilme
- Daha İyi Prompt Anlayışı: Karmaşık promptları daha iyi kavrama
- Gelişmiş Filigranlama: Özgünlük doğrulamasında iyileştirmeler
Rakiplerle Karşılaştırma
FLUX.2 ve DALL-E 3
| Kriter | FLUX.2 | DALL-E 3 |
|---|---|---|
| Açık Kaynak | Evet (dev varyant) | Hayır |
| Yerel Kurulum | Evet | Hayır |
| Maliyet | Ücretsiz (sadece donanım maliyeti) | $0.04/görüntü |
| Görüntü Kalitesi | Mükemmel | Çok İyi |
| Özelleştirme | Tam kontrol | Sınırlı |
| Ticari Kullanım | Lisans gerektirir | API aboneliği |
FLUX.2 ve Midjourney
| Kriter | FLUX.2 | Midjourney |
|---|---|---|
| Kurulum | Yerel/Bulut | Sadece Bulut |
| Maliyet | Tek seferlik donanım | $10-$120/ay |
| Gizlilik | Tam | Sınırlı |
| Kontrol | Tam | Modere Edilmiş |
| Görüntü Çözünürlüğü | Ayarlanabilir | Sabit seviyeler |
| Hız | Donanıma bağlı | Yaklaşık 1 dakika |
FLUX.2 ve Stable Diffusion
| Kriter | FLUX.2 | Stable Diffusion XL |
|---|---|---|
| Kalite | Üstün | Çok İyi |
| Kullanım Kolaylığı | Orta | Kolay |
| Model Boyutu | 32B | 6.9B |
| Topluluk | Büyüyor | Büyük |
| Özelleştirme | Yüksek | Çok Yüksek |
Yerel Kurulum ve Bulut Fiyatlandırması
Yerel Kurulum Maliyetleri (Tek Seferlik)
| Donanım | Maliyet | FLUX.2 Yetenekleri |
|---|---|---|
| RTX 4090 (Kuantize) | $1,600 | Taktiklerle tam fonksiyonellik |
| H100 (80GB) | $30,000+ | Yerel performans |
| GB200 | $100,000+ | Kurumsal seviye |
| Bulut H100 | $4-8/saat | Esnek kiralama |
Bulut API Maliyetleri (Yinelenen)
| Hizmet | Fiyatlandırma |
|---|---|
| FLUX.2 API | Black Forest Labs ile iletişime geçin |
| DALL-E 3 | $0.04/görüntü (1024×1024) |
| Midjourney | $10-$120/ay |
| Stable Diffusion | Ücretsiz (açık kaynak) |
Ne Zaman Yerel Kurulum Seçilmeli?
Yerel FLUX.2’yi seçin eğer:
- Aylık binlerce görüntü işliyorsanız
- Tam veri gizliliğine ihtiyacınız varsa
- Model özelleştirmesine ihtiyaç duyuyorsanız
- Tutarlı ve yüksek hacimli kullanımınız varsa
- API kullanım sınırlarından kaçınmak istiyorsanız
Bulut API’leri seçin eğer:
- Ara sıra ya da değişken kullanımınız varsa
- Bakım yükünden kaçınmak istiyorsanız
- Donanım bütçeniz yoksa
- Kesintisiz hizmet garantisi istiyorsanız
- Kullandıkça öde modeli tercih ediyorsanız
Kırılma Noktası Analizi
Düzenli kullanımda:
- DALL-E 3: Yaklaşık 3,000 görüntü/ayda kırılma noktası ($0.04/görüntü)
- Midjourney: Temel planla yaklaşık 4,000 görüntü/ay
- Yerel FLUX.2: Donanım yatırımıyla aylık 1,000+ görüntü için en uygun
Gelişmiş Konfigürasyon
Performans Optimizasyonu
# Optimizasyonları etkinleştir
pipe.to("cuda")
pipe.enable_attention_slicing() # VRAM kullanımını azalt
pipe.enable_vae_slicing() # Daha fazla VRAM azaltma
# Flash Attention kullan (varsa)
pipe.enable_flash_attention()
# Özel üretim ayarları
image = pipe(
prompt="Profesyonel ürün fotoğrafçılığı",
negative_prompt="bulanık, düşük kalite, bozuk",
num_inference_steps=50,
guidance_scale=3.5,
max_sequence_length=256
).images[0]Toplu İşleme
prompts = [
"Huzurlu bir dağ manzarası",
"Gelecekçi bir şehir manzarası",
"Sıcak, samimi bir kahve dükkanı iç mekanı"
]
# Birden çok promptu işleyin
for i, prompt in enumerate(prompts):
image = pipe(prompt, num_inference_steps=50).images[0]
image.save(f"output_{i}.png")Yaygın Sorun Giderme
VRAM Hataları
- Çözüm:
--cpu_offloading Truebayrağını kullanın - Alternatif: 4-bit kuantize modelleri tercih edin
- Yükseltme: GPU yükseltmeyi veya bulut instanceleri kullanmayı düşünün
Yavaş Performans
- Etkinleştir: PyTorch derleme optimizasyonları
- Kullan: Mümkünse FP16/BF16 hassasiyeti
- Kontrol Et: GPU sıcaklığı ve throttling durumu
Import Hataları
- CUDA ve PyTorch sürümlerinin uyumlu olduğundan emin olun
- Temiz sanal ortamda bağımlılıkları yeniden yükleyin
- Python sürümü uyumluluğunu kontrol edin (3.10/3.12)
Sonuç
FLUX.2’nin yerel kurulumu, AI görüntü oluşturma ve düzenleme üzerinde eşi benzeri görülmemiş bir kontrol sağlar. Donanım gereksinimleri yüksek olsa da, gizlilik, özelleştirme ve yüksek hacimli kullanıcılar için maliyet tasarrufları gibi avantajlarıyla cazip bir seçenektir.
Kurumsal GPU erişimi olanlar için FLUX.2, açık kaynaklı görüntü oluşturma teknolojisinin zirvesini temsil eder ve ticari API’lere rakip veya onları aşan yetenekler sunar. Tüketici donanımı kullanıcıları için kuantize versiyonlar, kalite kaybı minimum düzeyde tutularak uygun bir başlangıç imkanı sağlar.
Araştırmacı, geliştirici ya da yaratıcı profesyonel olun, FLUX.2’nin yerel dağıtım yetenekleri, verileriniz ve iş akışınız üzerinde tam kontrol sağlarken AI destekli görüntü oluşturma için yeni imkanlar açar.
Başlamak için hazır mısınız? FLUX.2 modellerini GitHub’dan veya Hugging Face’den indirerek en son teknoloji AI görüntü oluşturma dünyasına adım atın!