Inside Anthropic Claude zwiększa produktywność programistów, ale budzi obawy związane z utratą umiejętności i utratą satysfakcji z pracy | Fortuna

Written by ca.spsingh22@gmail.com

Witamy w Eye on AI. W tym wydaniu… Anthropic zdobywa klientów korporacyjnych, ale w jaki sposób jej inżynierowie korzystają z modeli AI Claude’a… Dyrektor generalny OpenAI Sam Altman deklaruje „kod czerwony”… Apple ponownie wznawia wysiłki w zakresie sztucznej inteligencji… Były główny naukowiec OpenAI Ilya Sutskever twierdzi, że „powrót do epoki badań”, ponieważ LLM nie oferują AGI… Czy wdrażanie sztucznej inteligencji spowalnia?

Jak sztuczna inteligencja zmienia kodowanie?

Wróćmy teraz do Claude’a i kodowania. W marcu Dario Amodei trafił na pierwsze strony gazet, gdy oznajmił, że do końca roku 90% kodu oprogramowania w firmach będzie pisane przez sztuczną inteligencję. Wielu wyśmiewało tę prognozę i od tego czasu Amodei nieco wycofał się z tego stwierdzenia, twierdząc, że nigdy nie miał na myśli sugerowania, że przed zaimplementowaniem tego kodu w pętli nie będzie jeszcze człowieka. Powiedział również, że jego przewidywania nie są odległe, jeśli chodzi o Anthropic, ale zastosował w tym przypadku znacznie luźniejszy zakres procentowy, mówiąc w październiku, że obecnie „70, 80, 90% kodu” ma wpływ na sztuczną inteligencję w jego firmie.

Cóż, Anthropic ma zespół badaczy zajmujących się „skutkami społecznymi” technologii sztucznej inteligencji. Aby dowiedzieć się, jak dokładnie sztuczna inteligencja zmienia charakter tworzenia oprogramowania, zbadała, w jaki sposób 132 inżynierów i badaczy korzysta z Claude. W badaniu wykorzystano zarówno wywiady jakościowe z pracownikami, jak i analizę danych dotyczących korzystania przez nich z Claude. Blog Anthropic na temat badania możesz przeczytać tutaj, ale mamy dla Ciebie ekskluzywne pierwsze spojrzenie na to, co odkryli:

Programiści antropiczni zgłosili, że używają Claude do około 60% swoich zadań zawodowych. Ponad połowa inżynierów stwierdziła, że może „całkowicie przekazać” od zera do 20% swojej pracy Claude’owi, ponieważ nadal czuli potrzebę sprawdzania i weryfikowania wyników Claude’a. Najczęstszymi zastosowaniami Claude’a było debugowanie istniejącego kodu, pomaganie inżynierom w zrozumieniu, którymi częściami bazy kodu się zajmują oraz, w mniejszym stopniu, wdrażanie nowych funkcji oprogramowania. Znacznie rzadziej używano Claude do zadań związanych z planowaniem i projektowaniem oprogramowania wysokiego poziomu, zadaniami związanymi z analizą danych i tworzeniem front-endu.

W odpowiedzi na moje pytania dotyczące tego, czy badania Anthropic zaprzeczają wcześniejszym stwierdzeniom Amodei, rzecznik Anthropic zwrócił uwagę na małą liczebność próby badawczej. „Nie jest to odzwierciedleniem wspólnego badania inżynierów w całej firmie” – powiedział rzecznik. Anthropic zauważyło również, że w badaniu nie uwzględniono „pisania kodu” jako odrębnego zadania, zatem nie było możliwe dokładne porównanie z wypowiedziami Amodei. Stwierdzono, że wszyscy inżynierowie inaczej definiowali ideę automatyzacji i „całkowitego delegowania” zadań kodowania Claude’owi, co dodatkowo zaciemniło jakąkolwiek jasną refleksję na temat komentarzy Amodei.

Myślę jednak, że wymowne jest to, że inżynierowie i badacze Anthropic nie byli specjalnie przygotowani do powierzenia wielu ważnych zadań Claude’owi. W wywiadach powiedzieli, że zazwyczaj zlecają Claudeowi zadania, co do których byli całkiem pewni, że nie są skomplikowane, powtarzalne lub nudne, a których pracę Claude można było łatwo zweryfikować, a w szczególności „w przypadku których jakość kodu nie jest krytyczna”. To wydaje się nieco potępiającą oceną obecnych umiejętności Claude’a.

Z drugiej strony inżynierowie stwierdzili, że bez Claude’a około 27% pracy, którą obecnie wykonują, po prostu nie zostałoby wykonane w przeszłości. Obejmowało to wykorzystanie sztucznej inteligencji do tworzenia interaktywnych pulpitów nawigacyjnych, których utworzeniem wcześniej po prostu nie zawracaliby sobie głowy, oraz tworzenie narzędzi do wprowadzania drobnych poprawek w kodzie, których wcześniej nie zawracaliby sobie głowy. Dane dotyczące użytkowania wykazały również, że 8,6% zadań Claude Code to zadania, które Anthropic określiło jako „poprawianie wycinanek”.

Nie tylko dyskwalifikować, ale i dewaluować? Opinie były podzielone.

Najciekawszymi ustaleniami raportu było to, jak korzystanie z oprogramowania Claude wpłynęło na odczucia inżynierów dotyczące ich pracy. Wielu było szczęśliwych, że Claude pozwolił im zajmować się szerszym niż wcześniej zakresem zadań związanych z tworzeniem oprogramowania. Niektórzy twierdzili, że korzystanie z Claude pozwoliło im myśleć o umiejętnościach wyższego poziomu, głębiej rozważając na przykład koncepcje projektowania produktu i doświadczenia użytkownika, zamiast skupiać się na podstawach realizacji projektu.

Niektórzy jednak martwili się utratą własnych umiejętności kodowania. „Teraz polegam na sztucznej inteligencji, która mówi mi, jak korzystać z nowych narzędzi, i dlatego brakuje mi doświadczenia. W rozmowach z innymi członkami zespołu od razu zapamiętuję wszystko, zamiast teraz muszę pytać sztuczną inteligencję” – powiedział jeden z inżynierów. Jeden ze starszych inżynierów był szczególnie zaniepokojony wpływem tego na młodszych programistów. „Myślę, że dalsze rozwijanie własnych możliwości wymagałoby wiele przemyślanego wysiłku, zamiast ślepo akceptować wyniki modelu” – powiedział starszy programista. Niektórzy inżynierowie zgłaszali ćwiczenia zadań bez Claude’a, specjalnie w celu przeciwdziałania utracie umiejętności.

Inżynierowie byli podzieleni co do tego, czy korzystanie z Claude pozbawiło ich znaczenia i satysfakcji, jaką czerpieli z pracy. „To dla mnie koniec pewnej epoki: programuję od 25 lat i poczucie, że posiadam kompetencje w tym zakresie, jest kluczem do mojej satysfakcji zawodowej” – powiedziała jedna z nich. Inny doniósł, że „spędzanie dnia na podżeganiu Claude’a nie jest zbyt zabawne ani satysfakcjonujące”. Ale inni byli bardziej ambiwalentni. Jeden z nich zauważył, że tęsknił za „stanem przepływu zen” związanym z ręcznym kodowaniem, ale „chętnie z niego zrezygnował” ze względu na zwiększoną produktywność, jaką zapewnił im Claude. Przynajmniej jeden stwierdził, że czuje większą satysfakcję ze swojej pracy. „Myślałem, że pisanie kodu naprawdę sprawia mi przyjemność, a zamiast tego po prostu cieszę się tym, co daje mi pisanie kodu” – powiedziała ta osoba.

Firma Anthropic zasługuje na uznanie za przejrzystość w zakresie wiedzy o tym, jak jej własne produkty wpływają na jej pracowników, oraz za raportowanie wyników, nawet jeśli są one sprzeczne z tym, co powiedział jej dyrektor generalny. Kwestie poruszone w badaniu Anthropic dotyczące deskillingu i wpływu sztucznej inteligencji na poczucie znaczenia, jakie ludzie czerpią ze swojej pracy, to kwestie, z którymi wkrótce będzie musiał się zmierzyć coraz większy odsetek osób we wszystkich branżach.

FORTUNA W AI

Pięć lat później AlphaFold firmy Google DeepMind pokazuje, dlaczego nauka może być zabójczą aplikacją dla sztucznej inteligencji (Jeremy Kahn)

Ekskluzywnie: Gravis Robotics zbiera 23 miliony dolarów, aby zaradzić niedoborom siły roboczej w budownictwie za pomocą maszyn napędzanych sztuczną inteligencją, autor: Beatrice Nolan

Twórca aplikacji do terapii AI zamknął ją, uznając, że jest zbyt niebezpieczna. Oto dlaczego uważasz, że chatboty AI nie są bezpieczne dla zdrowia psychicznego: autor: Sage Lazzaro

Dyrektor finansowy Nvidii przyznaje, że Eva Roytburg nie podpisała mega umowy na OpenAI o wartości 100 miliardów dolarów (dwa miesiące po tym, jak pomogła w odrodzeniu się sztucznej inteligencji)

Wyceny start-upów AI podwajają się i potrajają w ciągu kilku miesięcy, ponieważ wzajemne rundy finansowania zapewniają imponująco przyspieszony wzrost, autor: Allie Garfinkle

Znawcy twierdzą, że przyszłość sztucznej inteligencji będzie mniejsza i tańsza, niż myślisz, autor: Jim Edwards

AI W WIADOMOŚCIACH O BADANIACH AI

Powrót do deski kreślarskiej. Był czas, nie tak dawno temu, kiedy trudno byłoby znaleźć kogoś tak zagorzałego zwolennika hipotezy AGI, że „wszystko, czego potrzebujesz, to skala” jak Ilja Suckew. (Krótko mówiąc, był to pomysł, że samo budowanie coraz większych modeli językowych w oparciu o Transformera, dostarczanie im coraz większej ilości danych i trenowanie ich w coraz większych klastrach obliczeniowych ostatecznie doprowadzi do dostarczenia sztucznej inteligencji ogólnej na poziomie człowieka, a poza tym superinteligencji większej niż cała zbiorowa mądrość ludzkości). Zaskakujące było więc zobaczenie, jak były główny naukowiec OpenAI usiadł z podcasterem Dwarkeshem Patelem w jednym z odcinków podcastu „Dwarkesh”, który wystartował w zeszłym tygodniu, i usłyszał, jak mówi, że jest teraz przekonany że LLM nigdy nie zapewnią inteligencji na poziomie ludzkim. Sutskever twierdzi teraz, że jest przekonany, że osoby z wykształceniem wyższym nigdy nie będą w stanie dobrze uogólniać na dziedziny, które nie zostały wyraźnie ujęte w ich danych szkoleniowych, co oznacza, że będą mieli trudności ze zdobyciem naprawdę nowej wiedzy. Zauważył również, że szkolenie LLM jest wysoce nieefektywne: wymaga tysięcy lub milionów przykładów czegoś i powtarzających się informacji zwrotnych od ludzi oceniających, podczas gdy ludzie zazwyczaj mogą się czegoś nauczyć na podstawie zaledwie kilku przykładów, a także mogą dość łatwo tworzyć analogie między dziedzinami. W rezultacie Sutskever, który obecnie prowadzi własny start-up zajmujący się sztuczną inteligencją, Safe Superintelligence, mówi Patelowi, że „wróciliśmy do epoki badań” i szukamy nowych sposobów projektowania sieci neuronowych, które osiągnęłyby Święty Graal w tej dziedzinie. AGI. Sutskever powiedział, że ma pewne intuicje, jak to osiągnąć, ale ze względów komercyjnych nie zamierzał dzielić się nimi w „Dwarkesh”. Mimo milczenia na temat tajemnic handlowych podcastu warto posłuchać. Wszystkiego można posłuchać tutaj. (Uwaga, jest długi. Możesz go podsumować swojej ulubionej sztucznej inteligencji.)

MASZ KALENDARZ

2-7 grudnia: NeurIPS, San Diego

8–9 grudnia: Fortune Brainstorm AI San Francisco. Prośba o przybycie tutaj.

6 stycznia: Kolacja Fortune Brainstorm Tech na targach CES. Prośba o przybycie tutaj.

19-23 stycznia: Światowe Forum Ekonomiczne, Davos, Szwajcaria.

10–11 lutego: Szczyt Akcji AI, New Delhi, Indie.

POKARM DLA MÓZGU

Czy wdrażanie sztucznej inteligencji zwalnia? Tak twierdzi artykuł w The Economist, cytujący szereg niedawno opublikowanych danych. Nowe dane z US Census Bureau pokazują, że wykorzystanie sztucznej inteligencji w miejscu pracy ważone zatrudnieniem w Stanach Zjednoczonych spadło do około 11%, przy czym adopcja spada szczególnie w dużych firmach, a przyjęcie nieoczekiwanie słabe trzy lata po powstaniu generatywnej sztucznej inteligencji. Inne zbiory danych wskazują na to samo ochłodzenie: badacze ze Stanford odkryli, że wykorzystanie sztucznej inteligencji spadło z 46% do 37% w okresie od czerwca do września, natomiast Ramp podaje, że przyjęcie sztucznej inteligencji na początku 2025 r. wzrosło do 40%, po czym ustabilizowało się, co sugeruje, że dynamika ustabilizowała się. To spowolnienie jest o tyle istotne, że duże firmy technologiczne planują wydać w nadchodzących latach 5 bilionów dolarów na infrastrukturę AI i będą potrzebować około 650 miliardów dolarów rocznych przychodów (głównie od przedsiębiorstw), aby to uzasadnić. Wyjaśnienia powolnego tempa wdrażania sztucznej inteligencji obejmują niepewność makroekonomiczną i dynamikę organizacyjną, w tym wątpliwości menedżerów co do zdolności obecnych modeli do generowania znacznego wzrostu produktywności. W artykule argumentowano, że jeśli wdrażanie nie przyspieszy, korzyści gospodarcze wynikające ze sztucznej inteligencji będą wolniejsze i bardziej nierówne, niż oczekują inwestorzy, co utrudnia uzasadnienie obecnych ogromnych nakładów inwestycyjnych.

ca.spsingh22@gmail.com

Website | + posts

Inside Anthropic Claude zwiększa produktywność programistów, ale budzi obawy związane z utratą umiejętności i utratą satysfakcji z pracy | Fortuna

Koniecznie przeczytaj

Prawdopodobnie widzieliśmy już „szczyt Trumpa” – mówi PIMCO, a Gabinet Owalny jest obecnie ograniczony przez sądy i wybory śródokresowe | Fortuna

„Delikatna” bransoletka z kryształowym sercem o wartości 170 dolarów Walmart będzie w sprzedaży za 25 dolarów przed walentynkami

Ray Dalio ostrzega, że sztuczna inteligencja jest na wczesnym etapie bańki | Fortuna

3 akcje FTSE 100 i FTSE 250 do rozważenia po jesiennym budżecie!

ca.spsingh22@gmail.com

Najnowszy artykuł

Nowa kryptowaluta: Pepeto, kryptowaluta oparta na Ethereum, ogłasza, że posiadacze przedsprzedaży zarabiają przy każdej transakcji, stale śledząc Elona Muska Favorit

Czy ustawa CLARITY nie jest potrzebna? XRP może być gotowy na kolejny duży wzrost

Britney Spears przyznaje się do mniejszego zarzutu „mokrej lekkomyślności” w sprawie DUI, aby uniknąć więzienia | Fortuna

Centra danych na morzu: Panthalassa w Oregonie pozyskuje 140 mln dolarów pod przewodnictwem Petera Thiela na sztuczną inteligencję napędzaną falami

Cogent Communications Holdings raportuje mniejszą stratę w pierwszym kwartale; Przychody spadły o 3% – Alphastreet

O nas

Popularna kategoria

Wybór redaktora

Burmistrz Cleveland odpowiada na felieton gościnny GeekWire i nazywa Ohio City „studium przypadku tego, co jest możliwe”

Macy’s sprzedaje parę poduszek za 99 dolarów, zaprojektowanych specjalnie dla osób śpiących na brzuchu; teraz tylko 40 dolarów