← stromfee.ai

LTX 2.3 Local Video Production

Hollywood-Stil-Showreels lokal generiert auf einer NVIDIA GB10 mit dem Lightricks LTX 2.3 22B-fp8-Modell — keine Cloud-Kosten, reproduzierbar, seed-fixed.

Hardware
NVIDIA GB10
Unified Memory
119 GB
Modell
LTX 2.3 / 22B-fp8
Text-Encoder
Gemma 27B
Auflösung
1152 × 768 @ 24fps
Render-Zeit / Clip
~40 min

Karibik live

17 Clips × 5s 85.7s 91.8 MB Seeds 1001–1017

24 detaillierte Karibik-Prompts (Sonnenaufgang, Schildkröten, Delfine, Karnevals-Tänzer, Strandbonfires, Stechrochen, Segelboote, Bürgermarkt, Kokosnuss-Öffner, Pier-Reggae-Trio …) als Lern-Lauf für die Pipeline. 17 Clips gerendert, dann gestoppt — Qualität war eindeutig genug für die nächste Stufe.

Stromfee Radar V2 preview · 5 / 8

Aktuell 5 Clips rendered Final 8 Clips × 5s = 40s Seeds 2001–2008

Preview-Compilation der ersten 5 Clips (25s). Wird durch finale 8er-Version ersetzt sobald komplett — diese Datei liegt dann unter stromfee_radar_2min.mp4.

Hollywood-Stil-Prompts mit ARRI-Anamorphic-Vokabular, abgeleitet aus dem DGM-190-mhooks-Pattern: konkrete Camera-Hardware, explizite Color-Palette, Lavender-Brand-Akzent. Abgedeckte Sparten: PV (Drohne, Solar-Tracker), Wind (Brandenburg, Rotor-Wartung), BHKW (Biogas-Tanks, Macro-Ventil), BESS, Übersichts-Shots.

Stromfee Hyperframe (PV + BESS) pending

8 Clips × 5s = 40s 4× PV + 4× BESS Seeds 4001–4008 --frame@0@0.95 Conditioning

Killer-Feature von LTX 2.3: jeder Clip startet mit einem realen Stromfee-Whisk-Referenzbild als --frame@0@0.95-Konditionierung. LTX animiert dann das Bild zum 5-Sekunden-Clip. Schwerpunkt PV (Drohnen-Aerial, Industriedach, Curtailment-Drama, Parkplatz-Sunset) und BESS (Tesla-Container-Park, Halle, Aerial-Park, V2G-Cockpit) — markenkonforme Stromfee-Bildwelt statt halluzinierte Generika.

Pathos pending

8 Clips × 5s = 40s Seeds 3001–3008 Render startet nach Radar-Ende

Drama-Library für Stromfee-Akquise-Storytelling: leerer Bürgerwind-Saal in Friesland, weathered Hände mit Trianel-Abrechnung in Oberpfalz und Niedersachsen, verlassener agrar-Genossenschafts-Saal in Sachsen-Anhalt, curtailed Solarpark, gestoppte Wind-Turbinen, liquid-gold Energy-Loss-Macro, pulsende Substation-Warning-Lights.

Whisk-Style (PV + BESS) pending

8 Clips × 5s = 40s 4× PV + 4× BESS Seeds 5001–5008 Photo-vocabulary, no Hyperframe

Experiment: ohne Hyperframe-Conditioning, nur Text-Prompts im echten Whisk-Vocabulary („Dramatic aerial photograph of … professional energy industry photography, photorealistic 8K, no text overlays"). Kein ARRI/RED-Camera-Vocab (führte vorher zu Text-Halluzinationen). Vergleich zum Hyperframe-Showreel zeigt: wie viel macht das Referenzbild aus, wie viel macht der Text-Stil?

Render-Pipeline (Pattern reproduzierbar für jeden weiteren Showreel):

  1. scripts/<name>_prompts.txt — eine Zeile = ein Prompt = ein Clip
  2. scripts/run_<name>.sh — ruft den LTX-Wrapper auf, resumable, ffmpeg-concat am Ende
  3. systemd-Watcher-Kaskade triggert nächste Stufe automatisch wenn vorige fertig
  4. Upload via tailscale file cp zum Hauptserver

Warum lokal statt Cloud?

Cloud-Video (KIE.ai HappyHorse, Seedance 2) kostet pro Render. Bei einem Showreel mit 24 Clips à 8 Sekunden 9:16 sind das zweistellige Euro-Beträge — pro Iteration. Lokal auf GB10: Strom + ggf. einmalige Hardware-Amortisation. Plus: jeder Seed-Lauf ist deterministisch, gleicher Prompt + gleicher Seed = gleiches Video. Im Cloud-Setup nicht garantiert.

Trade-off: ~40 Minuten pro Clip bei 1152×768 / 20 Inference Steps. Für Marketing-Reels kein Engpass — die Pipeline läuft nachts durch.