Anthropic przypadkowo ujawnił kod źródłowy swojego popularnego narzędzia do kodowania Claude Code.
Do wycieku doszło zaledwie kilka dni po tym, jak magazyn Fortune poinformował, że firma nieumyślnie upubliczniła prawie 3000 plików, w tym wersję roboczą wpisu na blogu szczegółowo opisującą potężny przyszły model, który stwarza bezprecedensowe zagrożenia dla cyberbezpieczeństwa. Zgodnie z postem na blogu, który wyciekł do Fortune, model jest znany wewnętrznie jako „Mythos” i „Capybara”.
Wyciek kodu źródłowego ujawnił około 500 000 linii kodu w około 1900 plikach. Zapytana o komentarz firma Anthropic potwierdziła, że w ramach „wersji Claude Code” wyciekł „pewien wewnętrzny kod źródłowy”.
Rzecznik powiedział: „Nie dotyczyły ani nie zostały ujawnione żadne wrażliwe dane klientów ani dane uwierzytelniające. Był to problem z opakowaniem wydania spowodowany błędem ludzkim, a nie naruszeniem bezpieczeństwa. Wdrażamy środki, aby zapobiec ponownemu wystąpieniu takiej sytuacji”.
Najnowsze naruszenie bezpieczeństwa danych jest potencjalnie bardziej szkodliwe dla Anthropic niż poprzednie przypadkowe ujawnienie wersji roboczej bloga firmy na temat nadchodzącego modelu. Chociaż najnowsze naruszenie bezpieczeństwa nie ujawniło wagi samego modelu Claude, pozwoliło osobom znającym się na kwestiach technicznych wydobyć dodatkowe informacje wewnętrzne z bazy kodu firmy, twierdzi specjalista ds. cyberbezpieczeństwa z firmy Fortune, którego poproszono o sprawdzenie naruszenia.
Claude Code jest prawdopodobnie najpopularniejszym produktem firmy Anthropic i odnotowuje gwałtowny wzrost wskaźników jego wykorzystania przez duże firmy. Przynajmniej niektóre możliwości Claude Code nie wynikają z dużego modelu języka, na którym opiera się produkt, ale z „uprzęży” oprogramowania otaczającego podstawowy model sztucznej inteligencji i informującego go, jak korzystać z innych narzędzi programowych, a także dostarczających ważnych barier i instrukcji regulujących jego zachowanie. To kod źródłowy tego agenta wyciekł do sieci.
Wyciek potencjalnie umożliwia konkurentowi odtworzenie sposobu działania uprzęży agenta Claude Code i wykorzystanie tej wiedzy do ulepszenia własnych produktów. Niektórzy programiści mogą również chcieć stworzyć wersje open source oprogramowania agenta Claude Code w oparciu o kod, który wyciekł.
Według Roya Paza, starszego badacza bezpieczeństwa sztucznej inteligencji w LayerX Security, wyciekający kod dostarczył także kolejnych dowodów na to, że Anthropic ma wewnętrznie nowy model o nazwie Capybara, do którego wprowadzenia firma aktywnie się przygotowuje. Paz powiedział, że firma prawdopodobnie wprowadzi na rynek „szybką” i „wolną” wersję nowego modelu, opartą na pozornie większym oknie kontekstowym modelu i że będzie to najbardziej zaawansowany model na rynku.
Obecnie Anthropic sprzedaje każdy ze swoich modeli w trzech różnych rozmiarach. Większe, bardziej wydajne wersje modeli są oznaczone jako Opus; Nieco szybsze i tańsze, ale mniej wydajne wersje noszą markę Sonnet; a te najmniejsze, najtańsze i najszybsze nazywają się Haiku. W szkicu bloga uzyskanym w zeszłym tygodniu przez Fortune firma Anthropic opisuje Capybarę jako model nowej generacji, który jest jeszcze większy i wydajniejszy niż Opus, ale także droższy.
Paz stwierdził, że najnowszy wyciek, który po raz pierwszy został upubliczniony, wygląda na „błąd ludzki” po tym, jak ktoś skorzystał ze skrótu, który ominął normalne zabezpieczenia przed publikacją. Anthropic powiedział Fortune, że nie doszło do obejścia normalnych zabezpieczeń dotyczących zwolnienia.
„Zazwyczaj duże firmy mają rygorystyczne procesy i wiele kontroli, zanim kod trafi do produkcji, podobnie jak skarbiec, którego otwarcie wymaga wielu kluczy” – powiedział Fortune. „W Anthropic wygląda na to, że proces ten nie został wdrożony i pojedyncza błędna konfiguracja lub nieprawidłowe kliknięcie nagle odsłoniło cały kod źródłowy”.
Paz zadał również pytania dotyczące potencjalnego połączenia tego narzędzia z wewnętrznymi systemami Anthropic. Powiedział, że największym problemem może nie być bezpośredni dostęp do modeli zaplecza, ale raczej to, że wyciekający kod może ujawnić niepubliczne szczegóły dotyczące działania systemów, takie jak interfejsy API i procesy wewnętrzne. Dodał, że tego typu informacje mogą pomóc wyrafinowanym aktorom w lepszym zrozumieniu architektury modeli Anthropic i sposobu ich wdrażania, co z kolei może pomóc w podejmowaniu prób obejścia istniejących zabezpieczeń.
Najpotężniejszy obecnie model Anthropic, Claude 4.6 Opus, został już przez firmę zaklasyfikowany jako model niebezpieczny pod względem zagrożeń cyberbezpieczeństwa. Firma Anthropic twierdzi, że jej obecne modele Opus są w stanie samodzielnie identyfikować luki dnia zerowego w oprogramowaniu. Chociaż funkcje te mają pomóc firmom wykrywać i naprawiać błędy, hakerzy, w tym państwa narodowe, mogą również wykorzystać je do wyszukiwania i wykorzystywania luk.
To nie pierwszy raz, kiedy Anthropic przypadkowo ujawnia szczegóły dotyczące swojego popularnego narzędzia Claude Code. W lutym 2025 r. wcześniejsza wersja Claude Code przypadkowo ujawniła swój oryginalny kod w wyniku podobnego naruszenia. Wystawa pokazała, jak narzędzie działało za kulisami i jak łączyło się z wewnętrznymi systemami Anthropic. Następnie Anthropic usunął oprogramowanie i kod publiczny.
UWAGA REDAKTORA: Ten artykuł został zaktualizowany w celu uwzględnienia dodatkowych komentarzy od Anthropic i wyjaśnienia niektórych szczegółów technicznych z jednego ze źródeł.

