Saturday, April 4, 2026

Według MIT | w przypadku większości zadań w miejscu pracy sztuczna inteligencja jest wystarczająco dobra, aby ją zaliczyć, ale nie na tyle dobra, aby zaimponować Fortuna

Koniecznie przeczytaj

Rosnący odsetek amerykańskich pracowników biurowych, którzy w swojej codziennej pracy eksperymentowali ze sztuczną inteligencją, prawdopodobnie miał chwile zwątpienia co do swojej długoterminowej stabilności pracy.

Jednak zgodnie z najnowszymi danymi opublikowanymi przez MIT, pomimo wszystkich ulepszeń sztucznej inteligencji w ostatnich latach, technologia ta nadal jest w stanie osiągnąć jedynie niski poziom w określonych zadaniach w miejscu pracy. Nawet wtedy możesz nadal popełniać duże błędy.

Pracownicy martwiący się, że wkrótce zostaną zastąpieni przez sztuczną inteligencję, prawdopodobnie pocieszą się nowymi badaniami MIT, które przedstawiają narrację o przejęciach stanowisk przez sztuczną inteligencję nie tyle jako szybki film akcji, ile bardziej jako powolny utwór do przemyśleń.

Z opublikowanego w czwartek wstępnego badania wynika, że ​​sztuczna inteligencja stopniowo staje się coraz lepsza w wykonywaniu różnorodnych zadań w różnych zawodach. Jednak w większości przypadków wydajność obecnie dostępnych modeli jest podobna do wydajności rozczarowanego stażysty: spełnia minimalne wymagania, ale ogólnie ma trudności z wykonaniem wysokiej jakości pracy bez udoskonalania jej przez ludzką rękę.

Czyszczenie baru

Badacze z MIT wykorzystali 41 różnych LLM, w tym wersje Claude, Gemini i ChatGPT, do analizy wydajności ponad 11 000 zadań, głównie tekstowych, na różnych stanowiskach wymienionych przez Departament Pracy. Ich wyniki zostały następnie ocenione przez ludzi z prawdziwym doświadczeniem zawodowym w tych dziedzinach. Celem było sprawdzenie, jak często wymiana pracownika AI może dać wynik, który menedżer uznałby za akceptowalny bez jakiejkolwiek edycji przez człowieka, a następnie ocenić jego jakość.

Naukowcy odkryli, że sztuczna inteligencja stała się z biegiem lat bardziej niezawodna w wielu rodzajach pracy, ale nadal nie spełnia jej oczekiwań w przypadku podniesienia ryzyka lub standardów. W badaniu MIT zastosowano skalę ocen od 1 do 9, aby ocenić wydajność sztucznej inteligencji, przy czym 7 zdefiniowano jako „minimalnie wystarczające”, co oznacza, że ​​praca jest użyteczna w obecnej postaci i nie wymaga modyfikacji. Do końca 2025 r. modele sztucznej inteligencji uzyskały 7 punktów w przypadku około 65% zadań.

Co najważniejsze dla firm rozważających zastąpienie części swoich pracowników sztuczną inteligencją, dane z MIT sugerują, że sztuczna inteligencja ma trudności z wykonywaniem bardziej skomplikowanych zadań. Niezależnie od tego, ile czasu model AI potrzebował na wykonanie zadania, prawdopodobieństwo sukcesu przy ocenie jakości wynoszącej 9 lub „powyżej” nigdy nie przekraczało 50%. Innymi słowy, gdy zadanie wymaga wielu kroków, kreatywności i precyzji, zastąpienie sztucznej inteligencji jest bardziej prawdopodobne, że zakończy się niepowodzeniem niż sukcesem.

Badanie wpisuje się w niektóre aspekty obecnej narracji na temat wdrażania sztucznej inteligencji w amerykańskich firmach. Firmy korzystające ze sztucznej inteligencji częściej automatyzują rutynowe zadania i role po odejściu na stanowiska podstawowe, podczas gdy niektóre wysoce techniczne umiejętności, zwłaszcza cyfrowe, w rzeczywistości są kojarzone z dodatkowymi wynagrodzeniami.

Znalazło to odzwierciedlenie w danych z MIT, które wykazały niższy średni wskaźnik sukcesu w przypadku wykwalifikowanych stanowisk na stanowiskach prawniczych i informatycznych, podczas gdy modele sztucznej inteligencji ogólnie łatwiej radziły sobie z zadaniami tekstowymi związanymi z zawodami budowlanymi i konserwacyjnymi.

Firmy, które eksperymentowały z pełną automatyzacją niektórych części swojej pracy, borykają się z coraz większymi trudnościami. W ubiegłym roku Deloitte przygotował dwa raporty dla klientów rządowych w Australii i Kanadzie i w obu przypadkach stwierdzono, że są one pełne kłamstw. Odkryto, że media, takie jak CNET i Sports Illustrated, wykorzystują sztuczną inteligencję do generowania niedokładnych historii z wymyślonymi tytułami. Prawnicy również polegali na sztucznej inteligencji przy przygotowywaniu swoich dokumentów, a jedna z firm prawniczych przeprosiła publicznie w zeszłym roku po tym, jak wyszło na jaw, że we wniosku o ogłoszenie upadłości w jednej z jej spraw pojawiły się fałszywe wezwania wygenerowane przez sztuczną inteligencję.

Anegdotyczne dowody i dane z MIT sugerują, że sztuczna inteligencja nadal wymaga ludzkiej ręki, aby zmaksymalizować korzyści, chociaż technologia szybko się poprawia. Badacze z MIT oszacowali, że wskaźnik powodzenia sztucznej inteligencji w przypadku analizowanych zadań wzrastał każdego roku aż o 11 punktów procentowych dzięki bardziej wydajnym modelom.

Autorzy szacują, że do 2029 r. większość modeli sztucznej inteligencji będzie w stanie wykonać od 80% do 95% zadań tekstowych przy minimalnie wystarczającym benchmarku.

Nadal nie wiadomo, czy sztuczna inteligencja będzie kiedykolwiek w stanie skalować się w kierunku doskonałej, a nawet doskonałej wydajności.

„Powszechna automatyzacja, szczególnie w dziedzinach o niskiej tolerancji błędów, może być jeszcze daleka od ideału” – napisali naukowcy.

Website |  + posts
- Advertisement -spot_img
- Advertisement -spot_img

Najnowszy artykuł