Codex zużywa około 4 razy mniej tokenów niż Claude Code. OpenAI lubi ten fakt przypominać. W tym filmie pokażę Ci, dlaczego to wcale nie znaczy, że Codex jest lepszym wyborem - szczególnie jeśli piszesz w .NET.
Cześć! Najpierw zastrzeżenie, bo widzę to pytanie wciąż pod filmami i pod artykułami: Codex w 2026 to nie jest ten sam Codex, co w 2021. Stary został wygaszony 3 lata temu. Dzisiejszy Codex to agent AI od OpenAI, uruchomiony w maju 2025, działa na GPT-5.3-Codex. Zupełnie inny produkt.
I razem z Claude Code to 2 najpoważniejsze agentowe narzędzia do kodowania, które dziś dominują rynek.
W tym artykule dowiesz się: czym naprawdę różnią się te dwa narzędzia, gdzie każdy wygrywa, i który wybrać w projekcie .NET. Pod koniec pokażę 2 konkretne scenariusze - w każdym wygrywa inne narzędzie.
Dwie filozofie
To są 2 różne podejścia do tego samego problemu.
Claude Code to agent lokalny i interaktywny. Uruchamiasz go w terminalu, widzisz każdy krok rozumowania, zatwierdzasz decyzje, przerywasz gdy chcesz. Ty jesteś w pętli. Pracuje na Twojej maszynie - Docker Desktop, SQL Server, IIS, to co masz postawione.
Codex to agent cloud-first i asynchroniczny. Opisujesz zadanie, Codex przenosi je do izolowanego kontenera w chmurze OpenAI, robi robotę i wraca z gotowym wynikiem. Wrzucasz task, idziesz na kawę, wracasz do przeglądu. Możesz puścić 5 zadań równolegle, każde w osobnym sandboxie.
Obie filozofie mają sens. Po prostu w różnych sytuacjach.
Kiedy Codex
Gdzie Codex realnie wygrywa?
• Token efficiency - około 4 razy mniej tokenów niż Claude Code. Na niezależnym benchmarku Figma-to-code: Codex 1,5 miliona tokenów, Claude Code 6,2 miliona na podobny output
• Terminal-Bench 2.0: 77,3% vs 65,4% u Claude - mierzalnie lepszy w zadaniach terminalowych, DevOpsowych, skryptach CLI
• Natywna równoległość - 5 taskow, 5 kontenerów w chmurze, jadą razem
• Mid-task steering od lutego 2026 - poprowadzisz agenta w trakcie pracy bez resetowania kontekstu
• Open-source CLI w Rust i TypeScript - fork, customizuj, co chcesz
• Plan Go 8 dolarów miesięcznie dla lekkich użytkowników
Ale ma trzy ograniczenia, o których musisz wiedzieć.
Po pierwsze: cloud-only dla zadań asynchronicznych. Nie ma self-hosted. Dla zespołów w obronności, bankowości, ochronie zdrowia to często jest blocker.
Po drugie: zamknięty model. Codex sam wybiera, nie wybierzesz sobie Opusa zamiast GPT.
Po trzecie: w marcu 2026 na forum OpenAI pojawiały się doniesienia o degradacji jakości. Może być tymczasowe, ale warto śledzić.
Kiedy Claude Code
Gdzie Claude Code wygrywa?
• Lokalny i interaktywny - widzisz co agent robi, uczysz się przy okazji, przerywasz gdy chcesz
• Milion tokenów kontekstu na planie Max - i to naprawdę działa, 76% rekalu na MRCR v2
• Wyższa celność na wieloplikowych refaktorach - lepiej radzi sobie z niejednoznacznymi wymaganiami
• Natywny MCP - stdio i HTTP, 300+ gotowych integracji (Codex ma tylko stdio)
• CLAUDE.md z hookami, layered settings, policy enforcement - bardziej rozbudowana konfiguracja agenta
• Agent Teams - wielu agentów pracuje równolegle na tej samej liście zadań
• Działa z Twoim lokalnym środowiskiem - i tu dochodzimy do najważniejszego dla .NET developera
Sprawa specyficzna dla .NET
Codex uruchamia asynchroniczne zadania w izolowanych kontenerach Linux w chmurze OpenAI. Teraz pomyśl o swoim projekcie .NET.
Masz MSBuild z wymyślnymi targetami. Masz SQL Server Developer postawiony lokalnie. Masz IIS Express dla starszych projektów. Może masz Docker Desktop z Windows containers. Może masz jeszcze jakieś stare .NET Framework gdzieś w solucji.
Przełożenie tego na cloud sandbox jest bolesne, a czasem wręcz niemożliwe. Claude Code tego problemu nie ma - pracuje lokalnie, z tym, co masz postawione.
Druga sprawa: w .NET często debugujesz rzeczy typu "dlaczego DbContext lifetime powoduje memory leak w Scoped" albo "czemu MediatR pipeline nie łapie tego exception'a". To są problemy, gdzie chcesz widzieć rozumowanie agenta krok po kroku i móc go w każdej chwili zatrzymać. Transparentny workflow Claude Code tu wygrywa.
Trzecia sprawa: równoległość. Codex robi ją świetnie, ale w typowym projekcie enterprise .NET rzadko masz 5 niezależnych taskow do puszczenia naraz. Zwykle jest jedno duże zadanie z zależnościami. A tam liczy się deep reasoning.
2 zadania, 2 zwycięzcy
Pokażę Ci to na dwóch zadaniach, bo nie chcę Ci wciskać, że jedno narzędzie wygrywa wszędzie.
Zadanie A - 5 drobnych bugów z QA. Null reference w kontrolerze, literówka w walidacji, brakujący nagłówek CORS, niepoprawny JSON w DTO, timeout na endpointcie. Niezależne, proste sprawy.
Tu Codex wygrywa. Wrzucasz 5 taskow do kolejki, każdy jedzie w osobnym sandboxie, za kwadrans masz pięć PR-ów do review. Równoległość plus prostota równa się idealny scenariusz dla Codexa.
Zadanie B - refaktor warstwy repozytorium z Dappera na EF Core Fluent API. Kilkanaście repozytoriów, różne konwencje narosłe przez lata, hacki wydajnościowe w zapytaniach, stare mapowania między encjami a DTO. Trzeba rozumieć intencje, nie tylko składnię.
Tu Claude Code wygrywa zdecydowanie. Czyta całą warstwę persystencji w jednym kontekście, widzi że OrderRepository i CustomerRepository mają podobną strukturę, ale inną konwencję nazewnictwa, i pyta Cię, który styl zachować. Krok po kroku, z Tobą w pętli.
Codex by to wykonał, ale w cloud sandboxie bez dostępu do Twojej lokalnej bazy byłby skazany na mnóstwo założeń, z których część byłaby błędna.
Moja rekomendacja
Dla większości backendowych .NET developerów Claude Code to sensowniejszy pierwszy wybór. Lokalne środowisko, transparentność, typowy profil zadań enterprise - to wszystko gra na jego korzyść.
Ale coraz więcej zespołów używa obu: Claude Code do architektonicznych zmian i refaktorów, Codex do batchów drobnych zadań puszczanych asynchronicznie. To nie jest konkurencja, to są dwa różne narzędzia do dwóch różnych rzeczy.
Najważniejsze
I teraz najważniejsza rzecz, której ten film Ci w pełni nie przekaże.
Zainstalowanie Claude Code to 5 minut. Ale różnica między "pobawiłem się tydzień i wróciłem do ręcznego kodowania" a "Claude Code pisze za mnie 60% kodu produkcyjnego" nie leży w narzędziu. Leży w workflow.
Jak napisać CLAUDE.md pod projekt .NET, jak dzielić zadania tak, żeby agent je poprawnie wykonał, kiedy go przerwać, jak weryfikować output bez tracenia czasu, jak połączyć to z Copilotem w Riderze - tego uczysz się miesiącami na własnych błędach.
Albo możesz to przejść ze mną. Nagrałem Szkołę 3x Dev - jak budować aplikacje szybciej dzięki AI, gdzie pokazuję dokładnie ten workflow na realnych projektach .NET.