Roje agentów Cursora korzystających z OpenAI zbudowały i obsługiwały przeglądarkę przez tydzień bez pomocy człowieka. Oto dlaczego jest to ważne

Gdyby zespół inżynierów stworzył przeglądarkę internetową, która działała tylko w połowie, ludzie nie mówiliby. Ale kiedy Michael Truell, dyrektor generalny startupu programistycznego Cursor, opublikował post

Po co to całe zamieszanie? Dwa główne powody: z jednej strony zdolność skupienia uwagi sztucznej inteligencji była w przeszłości krótka. Na początku ChatGPT modele mogły skupić się na swoim zadaniu tylko przez kilka sekund. W przypadku najlepszych modeli horyzont ten rozciągał się do minut, a następnie do godzin. Projekt Cursor twierdzi, że jest to jeden z pierwszych przypadków, w których system sztucznej inteligencji utrzymywał złożony, otwarty projekt oprogramowania przez cały tydzień bez nadzoru człowieka.

Ponadto poszczególni agenci AI są ograniczeni do małych, ukierunkowanych zadań. Jednak zatrudnienie setek agentów do koordynacji dużego projektu nadal wydaje się futurystyczne. Dlatego Cursor chciał sprawdzić, jak daleko mogą posunąć się w autonomicznym kodowaniu (w projekcie, który dla zespołu ludzkiego może zająć miesiące) dzięki współpracy „orkiestry” agentów AI. Czy system sztucznej inteligencji mógłby być wystarczająco trwały i wystarczająco dobrze ze sobą współpracować, aby eksplorować kod, dzielić pracę na fragmenty, debugować i kontynuować pracę przez wiele dni bez odbiegania od bieżącego zadania?

„Orkiestra” agentów AI

Naukowcy odkryli, że odpowiedź w większości była twierdząca. Eksperyment Cursor zorganizował setki agentów w coś na kształt zespołu programistycznego. Miał „planistów”, „pracowników” i „sędziów” koordynujących pracę nad milionami linii kodu. Wskazuje to na to, co zarówno Cursor, jak i OpenAI mówią o najbliższej przyszłości, w której sztuczna inteligencja nie tylko pomoże pracownikom, ale przejmie całe projekty. To zasadniczo zmieniłoby sposób wykonywania złożonej pracy, najpierw w tworzeniu oprogramowania, ale potem w innych zawodach.

Od kilku lat prowadzone są eksperymenty z rojami AI. Jednak obecnie, jak twierdzi Cursor, modele są mądrzejsze i mogą zachować spójność znacznie dłużej. Modele można uruchamiać na znacznie większą skalę, z niestandardową warstwą organizującą setki agentów i zapobiegającą popadnięciu ich w chaos.

Jonas Nelle, inżynier w firmie Cursor, który pracuje nad długowiecznymi agentami sztucznej inteligencji, powiedział Fortune, że w miarę ciągłego ulepszania modeli sztucznej inteligencji inżynierowie i badacze powinni co kilka miesięcy weryfikować swoje założenia dotyczące możliwości modeli sztucznej inteligencji. Chociaż przyznał, że „dzisiaj nie pobierze ani nie usunie przeglądarki Chrome”, projekt przeglądarki był „z pewnością lepszy niż wszystko, co mogły zrobić poprzednie modele”.

Ci długo żyjący agenci stanowią ważną granicę, dodał Bill Chen, inżynier OpenAI, który przeprowadza testy warunków skrajnych i ocenia zachowanie modeli firmy w świecie rzeczywistym. Czas trwania zadania oraz fakt, że system sztucznej inteligencji może je wykonać autonomicznie i spójnie, to „bardzo dobry wskaźnik tego, jak inteligentny i ogólny jest system” – stwierdził. Projekt Cursor, oparty na technologii GPT-5.2 OpenAI, jest „bezpośrednim wynikiem naszego ciągłego poszerzania granic możliwości modeli”. Powiedział, że w przyszłości testy będą miały jeszcze dłuższy horyzont.

Roje agentów AI nie są gotowe do użytku w przedsiębiorstwach

Nie są to jednak systemy gotowe do produkcji. Projekt, w którym przez kilka dni lub tygodni działają roje agentów, jest nie tylko pełen błędów i niekompletny, ale także kosztowny. Chociaż ceny gwałtownie spadły w ciągu ostatniego roku, długotrwałe prace z setkami agentów AI mogą nadal zwiększać koszty.

Istnieją również problemy z bezpieczeństwem. System autonomiczny budzi obawy dotyczące luk w zabezpieczeniach, wycieków danych i nie tylko, a także wymaga wielu nowych poziomów kontroli i możliwości audytu.

Chen powiedział jednak, że przewiduje niedaleką przyszłość, w której coś takiego mogłoby być gotowe „do powszechnej konsumpcji i po niewygórowanych kosztach. Jak dotąd postęp jest stały” – wyjaśnił, a na każdym kroku odnotowano znaczący postęp. Jak stwierdził, na razie ekscytacja wynika z faktu, że jest to prawdziwy, praktyczny przykład możliwości modelu „w porównaniu z tym, jak model ten wypada w akademickich i publicznych ocenach oraz testach porównawczych”.

Zmiana zaskoczyła nawet najbardziej doświadczonych obserwatorów AI. W niedawnym poście niezależny badacz Simon Willison przewidział, że do 2029 roku ktoś zbuduje całą przeglądarkę internetową, wykorzystując głównie sztuczną inteligencję, i nie byłoby to nawet zaskakujące. „Opracowanie nowej przeglądarki internetowej to jeden z najbardziej skomplikowanych projektów oprogramowania, jaki mogę sobie wyobrazić” – napisał. Kursor mógł przyspieszyć tę oś czasu. „Być może zostałem cofnięty o trzy lata” – powiedział Willison. „Muszę przyznać, że jestem bardzo zaskoczony, że tak szybko pojawiło się coś tak zdolnego”.

Odnosi się to do tego, co OpenAI i inni nazywają „nadwyżką możliwości”: poglądem, że najbardziej wyrafinowane modele sztucznej inteligencji mogą zrobić znacznie więcej, niż są wdrażane publicznie, ale odpowiednia kombinacja narzędzi, projektu produktu i spadków kosztów może nagle sprawić, że staną się użyteczne na dużą skalę. Chociaż narzędzia takie jak przeglądarka Cursor nie są jeszcze gotowe do wykorzystania, trajektoria jest jasna.

Roje agentów Cursora korzystających z OpenAI zbudowały i obsługiwały przeglądarkę przez tydzień bez pomocy człowieka. Oto dlaczego jest to ważne | Fortuna

Koniecznie przeczytaj

Analiza: Southwest Air zakłada, że wyższe ceny nie odstraszą podróżnych

Wiadomości giełdowe: Alfabet zbliża się do 4 bilionów dolarów, wzrost wydatków konsumenckich na Środkowym Zachodzie

„Za stary, żeby rządzić i nudno jest znać tylko jego jako prezydenta”: milenialsi i pokolenie Z w Kamerunie mają przed sobą ósmą kadencję dla...

Jak media społecznościowe zmieniły 75-letni podręcznik wielkiego CPG | Fortuna

ZOSTAW ODPOWIEDŹ Anuluj odpowiedź

Najnowszy artykuł

Car graniczny Trumpa mówi, że „małe” siły bezpieczeństwa pozostaną w Minnesocie po redukcji sił bezpieczeństwa. „Wrócimy do pierwotnego śladu” | Fortuna

Słuchawki Walmart z redukcją szumów za 160 dolarów kosztują zaledwie 23 dolarów

USA i Iran przeprowadzą nową rundę rozmów nuklearnych w związku z wysłaniem przez Trumpa największego na świecie lotniskowca na Bliski Wschód | Fortuna

Reddit INSIDER przesyła główne wotum zaufania po zarobkach

Wojsko amerykańskie śledzi objęty sankcjami tankowiec płynący z Karaibów do Oceanu Indyjskiego i „zamyka go” | Fortuna

O nas

Popularna kategoria

Wybór redaktora

Legendarny zespół rockowy powraca do rezydencji w kasynie Las Vegas Strip

REI sprzedaje 4-litrowy plecak podróżny za jedyne 33 USD, który odpowiada potrzebom i ma wystarczająco dużo miejsca