
OpenAI uruchomiło dziś nowy flagowy model obrazowania, chcąc rozwiać niedawne obawy, że pozostaje w tyle za rywalami w wyścigu o uchwycenie sposobu myślenia zarówno konsumentów, jak i firm.
Nowy model obrazowania umożliwia bardziej precyzyjną edycję obrazów i może generować obrazy nawet czterokrotnie szybciej niż poprzednia sztuczna inteligencja do obrazowania OpenAI, podała firma w poście na blogu. Powiedział, że nowy model, a także nowa funkcja obrazowania w ChatGPT zostały zaprojektowane tak, aby generowanie obrazów było „zachwycające”.
Zgodnie z postem na blogu OpenAI, nowe obrazy ChatGPT są dziś udostępniane wszystkim użytkownikom ChatGPT i API na całym świecie. Firma twierdzi, że działa na wszystkich modelach, więc użytkownicy nie muszą wybierać konkretnego modelu z rozwijanego menu, aby z niego skorzystać.
„Wierzymy, że wciąż jesteśmy na początku tego, co może umożliwić obrazowanie” – stwierdziła firma w poście na blogu. „Dzisiejsza aktualizacja to ważny krok naprzód i czeka nas jeszcze więcej, od bardziej szczegółowych edycji po bogatsze, bardziej szczegółowe wyniki we wszystkich językach”.
Choć lojalnym użytkownikom ChatGPT może się to wydawać prezentem świątecznym, pracownicy OpenAI byli zapracowanymi elfami odpowiadającymi na notatkę „Code Red” Świętego Mikołaja (tj. dyrektora generalnego) Sama Altmana po Święcie Dziękczynienia, która miała nakłonić firmę do ulepszenia ChatGPT w ciągu następnych ośmiu tygodni w obliczu intensywnej konkurencji ze strony rywali, w szczególności Google.
Model Gemini firmy Google zyskiwał na popularności po wprowadzeniu na rynek w sierpniu modelu obrazującego Nano Banana. Google twierdzi, że miesięczna liczba aktywnych użytkowników wzrosła z 450 milionów w lipcu do 650 milionów w październiku.
Najnowsza wersja firmy, Nano Banana Pro, zyskała ogromną popularność po premierze 20 listopada dzięki nowej możliwości modelu w zakresie przejrzystej obsługi tekstu na obrazach (coś, co stanowiło drażliwy problem od lat). Użytkowników zachwyciła także zdolność Nano Banana Pro do tworzenia sensownych diagramów i infografik oraz fakt, że umożliwia ona edycję obrazów zamiast odtwarzania ich od zera.
W zeszłym tygodniu OpenAI wypuściło najnowszą wersję swojego modelu tekstowego, GPT-5.2; Od tego czasu obserwatorzy branży czekali, czy firma wypuści przed Nowym Rokiem nowy model wizerunkowy. Ale czy będzie wystarczająco dobry, aby przewyższyć Google?
Fidji Simo, dyrektor generalny Applications w OpenAI, napisał w poście Substack, że interfejs czatu ChatGPT nie był pierwotnie zaprojektowany tak, aby wykraczał poza tekst, dlatego nowemu modelowi obrazu towarzyszy „dedykowany punkt wejścia” do ChatGPT dla obrazów, który działa bardziej jak „studio kreatywne”, dostępne na pasku bocznym w aplikacji mobilnej i w Internecie.
„Nowe ekrany do przeglądania i edycji zdjęć ułatwiają tworzenie obrazów zgodnych z Twoją wizją lub inspirowanych trendami i wstępnie ustawionymi filtrami” – napisał. „Co więcej, nasz nowy model szybciej i lepiej radzi sobie ze szczegółowymi instrukcjami w celu uzyskania bardziej precyzyjnych edycji i kreatywnych przekształceń”. Model może zachować spójność kluczowych elementów, takich jak oświetlenie, kompozycja i podobieństwo, między tym, co wprowadzają użytkownicy, a tym, co wychodzi z modelu, „dzięki czemu wyniki są znacznie bliższe oczekiwaniom” – dodał.
Mimo to Nano Banana Pro może nadal zapewniać przewagę w zakresie zaangażowania umysłowego na wczesnym etapie. W niedawnym wywiadzie dla Fortune Allie Miller, doradczyni i inwestorka ds. sztucznej inteligencji, opowiedziała, jak niedawno wzięła udział w wydarzeniu typu Shark Tank prowadzonym przez Marka Cubana i była zszokowana tym, co się stało, gdy Kubańczyk wypowiedział słowa „Nano Banana”.
Miała nadzieję, że wzmianka o generatorze obrazów AI o dziwacznej nazwie Google może wywołać zamieszanie wśród tysięcy ludzi na widowni, których Miller określił jako w większości nowicjuszy w dziedzinie sztucznej inteligencji. Zamiast tego tłum skinął głową w uznaniu.
Podobnie jak sam ChatGPT, wyjaśnił, „istnieją pewne narzędzia lub modele sztucznej inteligencji, o których słyszy się w kółko, a które odgrywają ważną rolę w popkulturze”.
Czas pokaże, czy elfy z OpenAI zdołają sprawić, że ich nowe obrazy ChatGPT będą tak atrakcyjne, jak najbardziej poszukiwane zabawki sezonu. Ale moment, który nadchodzi w ramach Code Red firmy, podkreśla szerszą rzeczywistość: chociaż jakość modeli nadal ma znaczenie w wyścigu sztucznej inteligencji, jest to coraz bardziej bitwa o serca i umysły konsumentów.


