Claude Opus 4.6 — premiera nowego flagowego modelu Anthropic. Co się zmieniło?

Claude Opus 4.6 — premiera nowego flagowego modelu Anthropic. Co się zmieniło

5 lutego 2026 roku Anthropic oficjalnie wypuścił Claude Opus 4.6 — najnowszą iterację swojego najmocniejszego modelu językowego. To nie jest drobna aktualizacja. Opus 4.6 wprowadza zestaw zmian, które realnie wpływają na codzienną pracę z AI, szczególnie jeśli korzystasz z Claude’a do generowania kodu, analizy długich dokumentów lub budowania agentowych workflow.

Poniżej rozkładam na czynniki pierwsze, co dokładnie się zmieniło względem Opus 4.5 i dlaczego ta aktualizacja ma znaczenie.

Okno kontekstowe: z 200K do 1 miliona tokenów

Opus 4.6 to pierwszy model z rodziny Opus, który obsługuje okno kontekstowe o wielkości 1 miliona tokenów (aktualnie w fazie beta). W praktyce oznacza to możliwość przetwarzania w jednym zapytaniu objętości odpowiadającej kilku książkom, kompletnej dokumentacji projektu albo rozbudowanej bazy kodu — bez konieczności dzielenia materiału na mniejsze fragmenty.

Dotychczasowy limit 200K tokenów (dostępny jako standardowy kontekst) nadal obowiązuje w podstawowym zakresie cenowym. Prompty przekraczające 200K tokenów objęte są cenami premium: 10$/37,50$ za milion tokenów wejściowych/wyjściowych.

Co istotne, samo powiększenie okna kontekstowego to dopiero połowa sukcesu. Problemem większości modeli jest tzw. context rot — degradacja jakości odpowiedzi wraz ze wzrostem ilości przetwarzanego kontekstu. Anthropic zaadresował ten problem bezpośrednio. W benchmarku MRCR v2, który testuje zdolność modelu do odnajdywania ukrytych informacji w dużych zbiorach tekstu, Opus 4.6 uzyskał wynik 76% przy milionowym kontekście. Dla porównania Sonnet 4.5 w tych samych warunkach osiągnął zaledwie 18,5%.

Context Compaction — kompresja, która zmienia zasady gry

Jedną z najbardziej praktycznych nowości w Opus 4.6 jest mechanizm Context Compaction (kompakcja kontekstu). To funkcja dostępna po stronie serwera, która automatycznie podsumowuje starsze fragmenty konwersacji, gdy ta zbliża się do limitu okna kontekstowego.

Dlaczego to ważne? Każdy, kto pracował z AI nad dłuższym projektem, zna problem: po kilkunastu wymianach wiadomości model zaczyna „zapominać” wcześniejsze ustalenia, gubi kontekst i popełnia błędy wynikające z utraty informacji. Compaction rozwiązuje to elegancko — zamiast brutalnego obcinania historii konwersacji, system inteligentnie kompresuje starszy kontekst, zachowując kluczowe ustalenia i decyzje, a usuwając redundantne fragmenty.

W efekcie Opus 4.6 jest w stanie prowadzić efektywnie nieskończone konwersacje bez manualnego zarządzania kontekstem. Dla deweloperów budujących narzędzia na bazie API Claude’a to fundamentalna zmiana — koniec z „session resets”, slicing windowami i innymi obejściami, które do tej pory były konieczne przy długotrwałych zadaniach agentowych.

Generowanie kodu — znacząco mniej błędów

Opus 4.6 podnosi poprzeczkę w programowaniu. Model wyraźnie lepiej radzi sobie z rozumieniem architektury kodu, zależności między modułami i niejawnych konwencji projektowych. Bezpośrednim efektem jest mniejsza liczba halucynacji i generowanie kodu, który faktycznie pasuje do kontekstu projektu.

Liczby mówią same za siebie:

  • Terminal-Bench 2.0 (agentowe kodowanie): 65,4% (vs. 59,8% dla Opus 4.5)
  • OSWorld (agentowe sterowanie komputerem): 72,7% (vs. 66,3% dla Opus 4.5)
  • SWE-bench Verified: 80,8%

Szczególnie widoczna poprawa dotyczy wykrywania i naprawiania złożonych błędów — race conditions, edge case’ów i subtelnych problemów integracyjnych, które wymagają głębokiego zrozumienia zachowania systemu. Model potrafi teraz skuteczniej wykrywać i korygować własne błędy podczas code review, co było jedną z poważniejszych słabości poprzednich generacji.

W kontekście dłuższych sesji programistycznych kompakcja kontekstu dodatkowo eliminuje problem, w którym model po dłuższej pracy nad kodem tracił orientację w strukturze projektu. Teraz utrzymuje spójność nawet w wielogodzinnych sesjach kodowania.

Adaptive Thinking — inteligentne dostosowanie głębokości rozumowania

Poprzedni model oferował binarny wybór: rozszerzone myślenie włączone lub wyłączone. Opus 4.6 wprowadza Adaptive Thinking — model sam decyduje, kiedy i jak głęboko powinien się zastanowić nad odpowiedzią.

Deweloperzy korzystający z API mogą teraz ustawić jeden z czterech poziomów wysiłku:

  • Low — model pomija rozumowanie przy prostych zapytaniach, priorytet na szybkość
  • Medium — umiarkowane rozumowanie, pomijane przy najprostszych zadaniach
  • High (domyślny) — model prawie zawsze korzysta z rozszerzonego myślenia
  • Max (ekskluzywny dla Opus 4.6) — brak ograniczeń głębokości rozumowania, przeznaczony do najtrudniejszych zadań analitycznych

To pozwala na realne optymalizowanie kosztów i latencji. Proste zadania jak formatowanie tekstu czy rename zmiennych mogą działać na niskim poziomie wysiłku, podczas gdy złożone refaktoryzacje czy analiza architektury korzystają z pełnej mocy modelu.

Agent Teams — zespoły agentów AI

Opus 4.6 wprowadza w Claude Code koncepcję Agent Teams (w fazie research preview). Zamiast jednego agenta przetwarzającego zadania sekwencyjnie, możliwe jest teraz uruchamianie wielu niezależnych instancji Claude’a, które koordynują się między sobą i pracują równolegle.

Schemat działania: jeden agent pełni rolę „lidera zespołu”, dzieląc główne zadanie na podzadania i przydzielając je poszczególnym „członkom zespołu”. Każdy agent-członek posiada własne okno kontekstowe i pracuje niezależnie — np. jeden agent zajmuje się logiką backendu, drugi frontendem, trzeci migracją danych.

Scott White, Head of Product w Anthropic, porównał tę funkcję do posiadania „utalentowanego zespołu ludzi pracujących dla Ciebie”, wskazując, że segmentacja odpowiedzialności pozwala agentom „koordynować się równolegle i pracować szybciej”.

128K tokenów wyjściowych

Limit tokenów wyjściowych wzrósł dwukrotnie — z 64K do 128K. Oznacza to możliwość generowania kompletnych, obszernych odpowiedzi, długich fragmentów kodu czy rozbudowanych dokumentów w jednym zapytaniu, bez konieczności dzielenia ich na części.

Fast Mode — do 2,5x szybsze generowanie

Nowy tryb Fast Mode (speed: "fast") przyspiesza generowanie tokenów wyjściowych nawet 2,5-krotnie. To ten sam model z tą samą inteligencją, ale działający na szybszej infrastrukturze inferencyjnej. Tryb dostępny w cenach premium (30$/150$ za milion tokenów).

Ceny bez zmian

Cennik bazowy Opus 4.6 pozostaje identyczny jak w przypadku Opus 4.5: 5$/25$ za milion tokenów wejściowych/wyjściowych. To bezpośredni upgrade bez podwyżki kosztów dla istniejących workflow operujących w standardowym oknie 200K tokenów.

Claude w PowerPoint

Oprócz samego modelu Anthropic wypuścił również integrację Claude’a z PowerPoint (research preview). Wcześniej Claude mógł jedynie wygenerować plik prezentacji, który następnie trzeba było przenieść do PowerPointa. Teraz prezentacje można tworzyć i edytować bezpośrednio w PowerPoincie z pomocą Claude’a w panelu bocznym, z zachowaniem szablonów, fontów i layoutów firmowych.

Podsumowanie — co to zmienia w praktyce?

Claude Opus 4.6 to nie jest kosmetyczna aktualizacja z dopiskiem „+0.1″ do numeru wersji. To model, który adresuje trzy kluczowe bolączki poprzedników:

  1. Context rot — rozwiązany przez kompakcję kontekstu i lepszą wydajność przy dużych oknach kontekstowych
  2. Błędy w generowaniu kodu — znacząco zredukowane dzięki głębszemu rozumieniu architektury i zdolności do autokorekty
  3. Limit jednego agenta — przełamany przez Agent Teams i równoległe przetwarzanie

Dla deweloperów i firm korzystających z Claude’a do tworzenia oprogramowania, analizy dokumentów czy budowania narzędzi agentowych Opus 4.6 stanowi najbardziej kompletny model na rynku. Wyniki benchmarków stawiają go ponad GPT-5.2 od OpenAI i Gemini 3 Pro od Google w kluczowych kategoriach — kodowaniu agentowym, obsłudze długiego kontekstu i pracy z narzędziami.

Model jest dostępny od 5 lutego 2026 na claude.ai, przez API (identyfikator: claude-opus-4-6) oraz na platformach chmurowych AWS Bedrock, Google Vertex AI i Microsoft Foundry.

Podobne wpisy