OpenAI uruchamia nowy model obrazowania, próbując wyprzedzić Nano Banana firmy Google w ramach przedsięwzięcia Code Red | Fortuna

Written by ca.spsingh22@gmail.com

OpenAI uruchomiło dziś nowy flagowy model obrazowania, chcąc rozwiać niedawne obawy, że pozostaje w tyle za rywalami w wyścigu o uchwycenie sposobu myślenia zarówno konsumentów, jak i firm.

Nowy model obrazowania umożliwia bardziej precyzyjną edycję obrazów i może generować obrazy nawet czterokrotnie szybciej niż poprzednia sztuczna inteligencja do obrazowania OpenAI, podała firma w poście na blogu. Powiedział, że nowy model, a także nowa funkcja obrazowania w ChatGPT zostały zaprojektowane tak, aby generowanie obrazów było „zachwycające”.

Zgodnie z postem na blogu OpenAI, nowe obrazy ChatGPT są dziś udostępniane wszystkim użytkownikom ChatGPT i API na całym świecie. Firma twierdzi, że działa na wszystkich modelach, więc użytkownicy nie muszą wybierać konkretnego modelu z rozwijanego menu, aby z niego skorzystać.

„Wierzymy, że wciąż jesteśmy na początku tego, co może umożliwić obrazowanie” – stwierdziła firma w poście na blogu. „Dzisiejsza aktualizacja to ważny krok naprzód i czeka nas jeszcze więcej, od bardziej szczegółowych edycji po bogatsze, bardziej szczegółowe wyniki we wszystkich językach”.

Choć lojalnym użytkownikom ChatGPT może się to wydawać prezentem świątecznym, pracownicy OpenAI byli zapracowanymi elfami odpowiadającymi na notatkę „Code Red” Świętego Mikołaja (tj. dyrektora generalnego) Sama Altmana po Święcie Dziękczynienia, która miała nakłonić firmę do ulepszenia ChatGPT w ciągu następnych ośmiu tygodni w obliczu intensywnej konkurencji ze strony rywali, w szczególności Google.

Model Gemini firmy Google zyskiwał na popularności po wprowadzeniu na rynek w sierpniu modelu obrazującego Nano Banana. Google twierdzi, że miesięczna liczba aktywnych użytkowników wzrosła z 450 milionów w lipcu do 650 milionów w październiku.

Najnowsza wersja firmy, Nano Banana Pro, zyskała ogromną popularność po premierze 20 listopada dzięki nowej możliwości modelu w zakresie przejrzystej obsługi tekstu na obrazach (coś, co stanowiło drażliwy problem od lat). Użytkowników zachwyciła także zdolność Nano Banana Pro do tworzenia sensownych diagramów i infografik oraz fakt, że umożliwia ona edycję obrazów zamiast odtwarzania ich od zera.

W zeszłym tygodniu OpenAI wypuściło najnowszą wersję swojego modelu tekstowego, GPT-5.2; Od tego czasu obserwatorzy branży czekali, czy firma wypuści przed Nowym Rokiem nowy model wizerunkowy. Ale czy będzie wystarczająco dobry, aby przewyższyć Google?

Fidji Simo, dyrektor generalny Applications w OpenAI, napisał w poście Substack, że interfejs czatu ChatGPT nie był pierwotnie zaprojektowany tak, aby wykraczał poza tekst, dlatego nowemu modelowi obrazu towarzyszy „dedykowany punkt wejścia” do ChatGPT dla obrazów, który działa bardziej jak „studio kreatywne”, dostępne na pasku bocznym w aplikacji mobilnej i w Internecie.

„Nowe ekrany do przeglądania i edycji zdjęć ułatwiają tworzenie obrazów zgodnych z Twoją wizją lub inspirowanych trendami i wstępnie ustawionymi filtrami” – napisał. „Co więcej, nasz nowy model szybciej i lepiej radzi sobie ze szczegółowymi instrukcjami w celu uzyskania bardziej precyzyjnych edycji i kreatywnych przekształceń”. Model może zachować spójność kluczowych elementów, takich jak oświetlenie, kompozycja i podobieństwo, między tym, co wprowadzają użytkownicy, a tym, co wychodzi z modelu, „dzięki czemu wyniki są znacznie bliższe oczekiwaniom” – dodał.

Mimo to Nano Banana Pro może nadal zapewniać przewagę w zakresie zaangażowania umysłowego na wczesnym etapie. W niedawnym wywiadzie dla Fortune Allie Miller, doradczyni i inwestorka ds. sztucznej inteligencji, opowiedziała, jak niedawno wzięła udział w wydarzeniu typu Shark Tank prowadzonym przez Marka Cubana i była zszokowana tym, co się stało, gdy Kubańczyk wypowiedział słowa „Nano Banana”.

Miała nadzieję, że wzmianka o generatorze obrazów AI o dziwacznej nazwie Google może wywołać zamieszanie wśród tysięcy ludzi na widowni, których Miller określił jako w większości nowicjuszy w dziedzinie sztucznej inteligencji. Zamiast tego tłum skinął głową w uznaniu.

Podobnie jak sam ChatGPT, wyjaśnił, „istnieją pewne narzędzia lub modele sztucznej inteligencji, o których słyszy się w kółko, a które odgrywają ważną rolę w popkulturze”.

Czas pokaże, czy elfy z OpenAI zdołają sprawić, że ich nowe obrazy ChatGPT będą tak atrakcyjne, jak najbardziej poszukiwane zabawki sezonu. Ale moment, który nadchodzi w ramach Code Red firmy, podkreśla szerszą rzeczywistość: chociaż jakość modeli nadal ma znaczenie w wyścigu sztucznej inteligencji, jest to coraz bardziej bitwa o serca i umysły konsumentów.

ca.spsingh22@gmail.com

Website | + posts

OpenAI uruchamia nowy model obrazowania, próbując wyprzedzić Nano Banana firmy Google w ramach przedsięwzięcia Code Red | Fortuna

Koniecznie przeczytaj

Czy altcoiny nie są martwe? Analityk twierdzi, że „wiosna się ładuje”

Kamala Harris mówi, że „myśli” o ponownym kandydowaniu na prezydenta: „Będę cię informować na bieżąco” | Fortuna

JPMorgan wyznacza nowy cel dla S&P 500 do 2026 roku

4 bardzo tanie akcje wzrostowe do rozważenia w 2026 r.!

ca.spsingh22@gmail.com

Najnowszy artykuł

Nowa kryptowaluta: Pepeto, kryptowaluta oparta na Ethereum, ogłasza, że posiadacze przedsprzedaży zarabiają przy każdej transakcji, stale śledząc Elona Muska Favorit

Czy ustawa CLARITY nie jest potrzebna? XRP może być gotowy na kolejny duży wzrost

Britney Spears przyznaje się do mniejszego zarzutu „mokrej lekkomyślności” w sprawie DUI, aby uniknąć więzienia | Fortuna

Centra danych na morzu: Panthalassa w Oregonie pozyskuje 140 mln dolarów pod przewodnictwem Petera Thiela na sztuczną inteligencję napędzaną falami

Cogent Communications Holdings raportuje mniejszą stratę w pierwszym kwartale; Przychody spadły o 3% – Alphastreet

O nas

Popularna kategoria

Wybór redaktora

Najwyższy urzędnik Fed wysyła komunikat ostrzegawczy w sprawie przyszłych obniżek stóp procentowych

Nvidia wykonuje najodważniejszy jak dotąd ruch i zaczynają się konsekwencje