// next sync: nach jedem Major-Release

Stand 06.05.2026 · Desktop Apps für Coding-Agenten

Codex vs.Claude Code — live im Vergleich

Eine Entscheidungshilfe für Teams, die wissen wollen, welche Desktop-Oberfläche besser zu ihrem Stil passt — Codex als fokussiertes Agenten-Cockpit oder Claude Code als visuelle Workbench.

Codex Top-Modell
GPT-5.5 · 400K
Claude Top-Modell
Opus 4.7 · 1M
Quellen geprüft
12 · offiziell
Codex · Cockpit v0.45.2 · GPT-5.5
Claude Code · Workbench v2.4.1 · Opus 4.7
06.05
Workflow · 2026

60-Sekunden-Entscheidung

Vier Fragen. Eine Empfehlung.

1/4

Lade Frage…

Live-Score
Codex · 0 Claude · 0
Tipp

Klicke eine Option an, um zur nächsten Frage zu springen. Die Empfehlung erscheint am Ende automatisch.

Schnellurteil

Die Kurzentscheidung

Beide Apps sind reif für produktive Arbeit. Die bessere Wahl hängt weniger an „kann Code ändern?" und mehr daran, wo deine Arbeit entsteht, wie du Review machst und wie viel GUI-, Cloud- bzw. Architektur-Workflow du brauchst.

Codex Desktop · GPT-5.5

Nimm eher Codex, wenn …

du viele Agenten parallel über Projekte hinweg steuerst, OpenAI/ChatGPT ohnehin nutzt, isolierte Worktrees und Review-Diffs im Vordergrund stehen und du First-Party-Websuche, Bildgenerierung mit gpt-image-2, einen 90+ Plugin-Marketplace, persistierte /goal-Workflows (MultiAgentV2), native Windows-Sandbox und Computer Use in einer fokussierten Agenten-Oberfläche willst.

0.0 /10 für Agenten-Orchestrierung
Claude Code · Opus 4.7 (1M)

Nimm eher Claude Code, wenn …

du eine visuelle Workbench mit drag-and-drop Panes, Local/Remote/SSH-Sessions, Side Chats, Cloud-Routines, Auto-Verify im Preview, einer 26-Event-Hook-Pipeline, CLAUDE.md-Memory mit Auto-Memory und PR-CI-Loops mit Auto-Fix/Auto-Merge willst — gerade nach dem Desktop-Redesign vom 01.05.2026.

0.0 /10 für visuelle App-Iteration

Preise & Pläne

Was kostet das eigentlich?

Beide Apps sind nicht standalone gepreist — sie nutzen den Rahmen des Mutter-Abos. EUR-Preise inkl. MwSt für DE. USD-Preise je Region.

Codex Desktop Inklusive in ChatGPT-Plänen

OpenAI / ChatGPT

  • Plus
    Codex inklusive · fortgeschrittene Modelle · Bilderstellung mit Thinking
    €23/mo
  • Business · ChatGPT + Codex
    2+ Lizenzen · jährliche Abrechnung · SSO/MFA · Datenschutz
    €21/Seat/mo
  • Pro 5×
    5× Plus-Limits · Frontier Pro-Modell · max. Codex · Deep Research
    €103/mo
  • Business Codex
    Nutzungsbasiert · keine feste Lizenzgebühr · Multi-Agent-Workflows · SAML
    individuell
Preise DE inkl. MwSt., Stand 06.05.2026.[6]
Claude Code Desktop Über Claude-Plan oder API

Anthropic / Claude

  • Pro
    Claude Code in Terminal/Web/Desktop · Sonnet 4.6 + Opus-Zugriff · CLAUDE.md-Memory
    $20/mo
  • Max 5×
    5× Pro-Usage · Opus 4.7 deutlich häufiger
    $100/mo
  • Team Premium
    Admin-Controls · MDM/GPO · SSO · 5-Seat-Minimum
    $100/Seat
Claude Code zieht aus demselben Token-Budget wie deine Claude-Nutzung.[9]

Profil

Stärkenkarte

Kuratierte Einordnung aus den offiziellen Funktionsbeschreibungen — keine Hersteller-Benchmarks. Achsen treffen Bedienmodell, nicht Modell-Qualität.

7 4 PARALLELITÄT REVIEW · GIT PREVIEW · GUI AUTOMATION ENTERPRISE ERWEITERBARKEIT
Codex Desktop ≈ 8.7
Claude Code ≈ 8.9
Codex Stärken
Threads parallel, Worktrees, 90+ Plugins, native Windows-Sandbox, Bildgenerierung im Coding-Thread, persistierte /goal-Workflows.
6
Claude Stärken
Drag-and-Drop-Panes, Local/Remote/SSH, Side Chats, Routines, 26-Event-Hooks, CLAUDE.md-Memory, PR-CI mit Auto-Fix/Auto-Merge.
7
Geprüft
6 Achsen, 24 Vergleichspunkte, 12 offizielle Quellen, beide Top-Modelle 2026-Frontier.
24

Architektur

Wie die Apps unter der Haube ticken

Drei Stellschrauben, die in der Praxis den Unterschied machen — Memory, Hooks und Subagents. Hier ehrlich nebeneinander gelegt.

Memory

// langfristiger Kontext

Codex Memory in Preview: lernt Vorlieben & Korrekturen, Architektur intern noch nicht öffentlich dokumentiert.
Claude CLAUDE.md im Repo + Auto-Memory + 5-Layer-Compaction. Jeder Subagent hat eigenes Memory-Verzeichnis.

Hooks

// Policy & Lifecycle

Codex Plugin-bundled Hooks, Hook-Enablement-State, Marketplace-Installation, Remote-Bundle-Caching.
Claude 26-Event-Lifecycle: PreToolUse, PostToolUse, UserPromptSubmit, SessionStart/Stop, SubagentStart, PermissionRequest, FileChanged, …

Subagents

// Multi-Agent-Setup

Codex Bis zu 6 parallele Agenten in unabhängigen Git-Worktrees; klare Rollen, ideal für Batch-Execution.
Claude Subagents in den Main-Loop integriert; Capability-Control + Memory-Verzeichnis pro Subagent.

Daten im Vergleich

Vier Charts, vier Blickwinkel

Alle Charts basieren auf offiziellen Hersteller­angaben (Stand 06.05.2026). Quelle pro Chart unten verlinkt.

Feature-Coverage in der Matrix

// live mit Filter unten
Ja Teilweise Einschränkung
// → Feature-Matrix

Feature-Matrix

Funktionen direkt nebeneinander

Filtere nach Bereich oder suche frei. „Teilweise" heißt: nur in bestimmten Modi, nur auf bestimmten Plattformen oder mit Plugin. Auf Mobile ausklappbar.

Bereich Feature Codex Desktop Claude Code Desktop Hinweis

Feature-Spotlight

Ein Feature. Beide Sichtweisen.

Klick eine Funktion an — du siehst direkt, wie Codex und Claude Code sie umsetzen, plus eine Mini-Empfehlung.

Arbeitsweisen

Zwei Pfade, ein Ziel

So sehen typische Sessions aus — vom ersten Klick bis zum Ship.

Codex · Agenten parallel führen

Projekt wählenLocal, Worktree oder Cloud.
/goal startenPersistierter Workflow, App-Server-API, Resume.
MultiAgentV2Bis zu 6 Subagents parallel, Worktree-isoliert.
ReviewDiff-Pane, Hunks, Inline-Kommentare, in-app Browser.
ShipCommit, Push, PR, Plugin-bundled Hooks.

Claude Code · visuell iterieren

Umgebung wählenLocal, Remote oder SSH (Auto-Install).
Panes anordnenChat, Diff, Terminal, Editor, Preview.
Plan-ModusPermission Modes steuern Autonomie.
Auto-VerifyPreview, DOM, Klicks, Logs, 26-Event-Hooks.
PR-LoopCI, Auto-Fix, Auto-Merge, Auto-Archive.

Tiefen-Wizard

Mehr als 60 Sekunden? Hier die Detailfragen.

Markiere alle Aussagen, die zutreffen. Score ist heuristisch — ergänzt die 60-Sekunden-Entscheidung um Nuancen.

Produktstand

Was zwischen Februar und Mai 2026 passiert ist

Acht Stationen, die den Stand 06.05.2026 erklären — neue Modelle, neue Apps, neue Bedienmodelle.

Kurzbericht

Executive Summary

Codex Desktop App ist die bessere Wahl, wenn der Arbeitsplatz aus mehreren parallel laufenden Codex-Threads besteht. Wichtig: Das ist nicht die allgemeine ChatGPT Desktop App, sondern ein eigener Codex-Client neben Codex CLI, IDE Extension und Codex Web. Das April-Update „Codex for (almost) everything" hat Computer Use, In-app Browser, Bildgenerierung mit gpt-image-2 und einen 90+ Plugin-Marketplace gebracht; im Mai folgten persistierte /goal-Workflows mit MultiAgentV2 und konfigurierbaren Permission-Profilen.

Codex wirkt nach den 2026er-Updates wie ein dediziertes Cockpit zur Führung mehrerer Agenten — mit nativer Windows-Sandbox als ehrlichem Alleinstellungsmerkmal.

Claude Code Desktop App ist die bessere Wahl, wenn du eine visuelle Workbench suchst. Der Redesign vom 01.05.2026 (Drag-and-Drop-Layout, neue Sidebar mit Filter/Group, Side Chats, Routines, Auto-Archive bei PR-Merge, neuer Diff-Viewer, erweiterter Preview für PDF/HTML/lokale Server) hat aus dem Code-Tab eine eigenständige Multi-Agent-Workbench gemacht. SSH-Sessions mit Auto-Install, PR-Monitoring mit Auto-Fix/Auto-Merge, eine 26-Event-Hook-Pipeline und CLAUDE.md-Memory mit Auto-Memory runden das Profil ab.

Der größte Unterschied liegt im Bedienmodell: Codex ist agenten- und thread­zentriert, Claude Code Desktop ist workspace- und panezentriert. „Mehrere Codex-Agenten managen" vs. „eine Entwicklungs­umgebung um Claude herum".

Bei den Top-Modellen tritt GPT-5.5 (400K Kontext, $5/$30 pro 1M Tokens) gegen Opus 4.7 mit 1M Kontextfenster an. Beide sind 2026-Frontier — die Wahl bestimmt eher der Workflow als das Modell.

Risiken bleiben bei beiden ähnlich: Agenten machen falsche Änderungen, Shell- und Computer-Use-Rechte müssen eng geführt werden, Cloud-Sessions verschieben Code in Anbieter-Infrastruktur, Diffs müssen reviewt werden. Wer sensible Repositories bearbeitet, sollte Governance, SSO/RBAC, Sandbox, Netzfreigaben und Audit-Anforderungen vor dem Rollout prüfen.

Pragmatische Empfehlung: Für OpenAI-/ChatGPT-Teams, parallele Agentenarbeit und Artefakt-lastige Aufgaben → Codex. Für Claude-Nutzer mit visueller Kontrolle, Preview-Iteration, SSH/Remote-Entwicklung und PR-CI-Loop → Claude Code. Viele 2026er-Stacks fahren dual-track: Claude Code für Architektur, komplexe Features und Frontend, Codex für autonome Tasks, DevOps und kostenkritische Workflows.

Verifikation

Agenten-Faktencheck

Zwei parallel beauftragte Agenten haben die Ergebnisse gegen offizielle Hersteller­quellen geprüft.

OpenAI · Codex-Prüfung

Codex App ist als eigenständiger Client zu behandeln. Verifiziert: macOS/Windows-App, Linux nur via CLI, Worktrees, Local/Worktree/Cloud, GitHub-Review, Subagents (bis 6 parallel in Worktrees), native Windows-Sandbox, Computer Use (April), 90+ Plugin-Marketplace, persistierte /goal-Workflows mit MultiAgentV2 (Mai), GPT-5.4 (Mainline mit Computer Use, 1M) und GPT-5.5 (Premium-Flagship in Codex mit 400K).

Anthropic · Claude-Prüfung

Claude Code ist offiziell in Terminal, IDE, Desktop-App und Browser verfügbar. Desktop-Redesign 01.05.2026: Sidebar mit Filter/Group, Drag-and-Drop-Workspace, Side Chats, Routines (Cloud-Schedules), Auto-Archive bei PR-Merge, neuer Diff-Viewer, Preview für PDF/HTML/lokale Server. Architektur: 26-Event-Hook-Pipeline, CLAUDE.md-Memory mit 5-Layer-Compaction und Auto-Memory pro Subagent. Top-Modell Opus 4.7 mit 1M Kontextfenster, Sonnet 4.6 als Daily Driver.

Primärquellen

Offizielle Dokumentation

Stützt sich vorrangig auf OpenAI- und Anthropic-Dokumentation sowie offizielle Help-Center-Release-Notes.