Rankingi mocy AI wywrócone do góry nogami: OpenAI, Google rosną, a Anthropic spada, wynika z raportu Poe

Dołącz do naszych codziennych i cotygodniowych newsletterów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodących w branży relacji z AI. Dowiedz się więcej
Najnowszy raport Poe’a na temat zastosowań pokazuje, że OpenAI i Google umacniają swoją pozycję w kluczowych kategoriach sztucznej inteligencji, podczas gdy Anthropic traci pozycję, a wyspecjalizowane zdolności rozumowania wyłaniają się jako kluczowe pole rywalizacji.
Według danych opublikowanych dzisiaj przez Poe , platformę oferującą dostęp do ponad 100 modeli AI, między styczniem a majem 2025 r. nastąpiły znaczące zmiany udziałów rynkowych we wszystkich głównych kategoriach AI. Dane pochodzące od subskrybentów Poe zapewniają rzadką widoczność rzeczywistych preferencji użytkowników wykraczającą poza branżowe punkty odniesienia.
„Jako uniwersalna brama do ponad 100 modeli AI, Poe ma unikalny pogląd na trendy użytkowania w całym ekosystemie” — powiedział Nick Huber, lider ekosystemu AI w Poe, w ekskluzywnym wywiadzie dla VentureBeat. „Najbardziej zaskakujące rzeczy dziejące się obecnie to szybka innowacja (3-krotnie większa liczba wydań w okresie styczeń-maj 2025 r. w porównaniu z tym samym okresem w 2024 r.), coraz bardziej zróżnicowany krajobraz konkurencyjny i modele wnioskowania to wyraźna historia sukcesu początku 2025 r.”

W generowaniu tekstu podstawowego GPT-4o firmy OpenAI utrzymało dominującą pozycję z 35,8% udziałem w wiadomościach, podczas gdy nowsza rodzina GPT-4.1 firmy szybko zdobyła 9,4% udziału w ciągu kilku tygodni od premiery. Podobnie Gemini 2.5 Pro firmy Google osiągnął około 5% udziału w wiadomościach wkrótce po wprowadzeniu.
Te zyski nastąpiły w dużej mierze kosztem modeli Claude firmy Anthropic, które odnotowały 10% absolutny spadek udziału w okresie sprawozdawczym. Raport zauważa, że Claude 3.7 Sonnet w znacznym stopniu zastąpił wcześniejszy Claude 3.5 Sonnet w preferencjach użytkowników, chociaż ten ostatni nadal utrzymuje znaczący 12% udział w użytkowaniu.
DeepSeek , który doświadczył wirusowego wzrostu na początku tego roku, odnotował spowolnienie dynamiki, ponieważ konkurenci wydali własne niedrogie, rozwlekłe modele rozumowania. Udział wiadomości DeepSeek R1 spadł z 7% szczytu w połowie lutego do 3% pod koniec kwietnia.
Być może najważniejszym trendem zidentyfikowanym w raporcie jest gwałtowny wzrost liczby wyspecjalizowanych modeli rozumowania, których udział wzrósł z około 2% do 10% wszystkich wiadomości tekstowych wysyłanych za pośrednictwem platformy PoE od początku 2025 r.
„Modele rozumowania, nawet w początkowym okresie, wykazały niezwykłą zdolność do obsługiwania złożonych zadań ze zwiększoną precyzją” — powiedział Huber VentureBeat. „Wcześni użytkownicy wyraźnie dostrzegają w tym wartość i są gotowi zaakceptować kompromisy w zakresie kosztów i czasu przetwarzania, aby uzyskać lepsze wyniki”.
W tym segmencie o wysokim wzroście Gemini 2.5 Pro szybko ugruntował swoją pozycję lidera, zdobywając około 31% wykorzystania modelu rozumowania w ciągu zaledwie sześciu tygodni od premiery. Obecnie jest liderem w tej kategorii, wyprzedzając wyspecjalizowane w rozumowaniu modele Claude'a.
OpenAI nadal szybko wprowadza innowacje w tej przestrzeni, wypuszczając wiele modeli wnioskowania ( o1-pro , o3-mini , o3-mini-high , o3 i o4-mini ) w ciągu pierwszych czterech miesięcy 2025 r. Raport wskazuje, że użytkownicy Poe szybko przyjmują najnowsze oferty OpenAI, przechodząc ze starszych modeli, takich jak o1, na nowsze alternatywy, takie jak o3.
Raport odnotował również pojawienie się hybrydowych modeli rozumowania, takich jak Gemini 2.5 Flash Preview i Qwen 3 , które mogą dynamicznie dostosowywać poziom rozumowania w konwersacjach. Jednak obecnie te modele stanowią tylko około 1% wykorzystania modeli rozumowania.
Analitycy branżowi sugerują, że ten zwrot w stronę wyspecjalizowanych możliwości rozumowania jest sygnałem dojrzewania rynku sztucznej inteligencji, na którym generowanie surowego tekstu staje się powszechne. Zmusza to dostawców do wyróżniania się za pomocą funkcji o wyższej wartości, za które można uzyskać wyższe ceny.
Rynek generacji obrazów wydaje się coraz bardziej konkurencyjny, a rodzina Imagen 3 firmy Google systematycznie zwiększała swój udział z ok. 10% do 30% w 2025 r., rywalizując obecnie z rodziną modeli FLUX firmy Black Forest Labs, która łącznie miała ok. 35% udziałów pod koniec kwietnia.
Narzędzie GPT-Image-1 firmy OpenAI, wprowadzone do interfejsu API pod koniec kwietnia, w ciągu zaledwie dwóch tygodni osiągnęło poziom 17% wykorzystania w generowaniu obrazów, co odzwierciedla wirusową adopcję tego narzędzia w aplikacji ChatGPT w marcu i na początku kwietnia.
Raport wskazuje, że modele FLUX utrzymały swój ogólny udział w generowaniu obrazów w technologii PoE, ale w okresie sprawozdawczym odnotowały umiarkowany spadek z około 45% do 35%.
Ta trójstronna rywalizacja między Google , OpenAI i Black Forest Labs oznacza znaczącą zmianę w stosunku do początku 2024 r., kiedy to warianty Midjourney i Stable Diffusion dominowały w tej przestrzeni. Szybka poprawa jakości obrazu, przestrzeganie monitów i szybkość renderowania przekształciły tę kategorię w jedno z najbardziej zaciętych pól bitwy AI.
Jak wynika z dodatkowych danych branżowych, w ciągu ostatnich sześciu miesięcy nastąpił znaczny wzrost popularności generowania obrazów w przedsiębiorstwach, a działy marketingu i agencje kreatywne coraz częściej integrują te narzędzia ze swoimi procesami produkcyjnymi.
W generowaniu wideo, niedawno wydana rodzina modeli Kling chińskiego laboratorium Kuaishou szybko zrewolucjonizowała rynek, zdobywając łącznie około 30% udziału w użytkowaniu. Co najważniejsze, Kling-2.0-Master osiągnął 21% całego generowania wideo na Poe do końca kwietnia, zaledwie trzy tygodnie po premierze.
Veo 2 firmy Google utrzymało mocną pozycję, z udziałem wynoszącym około 20% po premierze w lutym, podczas gdy pionier kategorii Runway odnotował znaczny spadek udziału w rynku z około 60% do 20% w całym okresie sprawozdawczym.
Szybkość, z jaką Kling penetruje rynek, pokazuje, jak szybko może zmienić się krajobraz konkurencyjny w nowych kategoriach sztucznej inteligencji, w których uznani gracze mogą nie utrzymać swojej wczesnej przewagi, gdy nowi gracze szybko wprowadzają iteracje i udoskonalenia.
Generowanie wideo pozostaje najbardziej wymagającą obliczeniowo aplikacją AI skierowaną do konsumentów, a modele wymagają znacznej mocy przetwarzania, aby tworzyć nawet krótkie klipy. To sprawiło, że wykorzystanie jest bardziej ograniczone niż generowanie tekstu lub obrazu, ale oczekuje się, że szybko spadające koszty i poprawa jakości doprowadzą do szerszej adopcji do 2025 r.
Do grona przedsiębiorstw będących pierwszymi użytkownikami tej technologii zaliczają się agencje reklamowe, twórcy treści w mediach społecznościowych i platformy edukacyjne, które zaczęły włączać materiały wideo generowane przez sztuczną inteligencję do swoich strategii dotyczących treści, mimo obecnych ograniczeń tej technologii.
ElevenLabs nadal jest liderem w kategorii generowania dźwięku, spełniając około 80% wszystkich próśb subskrybentów o zamianę tekstu na mowę w okresie sprawozdawczym. Jednak raport podkreśla pojawiającą się konkurencję ze strony nowych firm Cartesia , Unreal Speech , PlayAI i Orpheus , które oferują zróżnicowane opcje głosowe, efekty i modele cenowe.
Dominacja rynkowa jednego gracza stoi w ostrym kontraście do bardziej rozdrobnionej konkurencji w innych kategoriach AI. Eksperci branżowi przypisują stałe przywództwo ElevenLabs wczesnemu wejściu na rynek, obszernej bibliotece głosowej i stałym ulepszeniom jakości, które utrzymały przewagę techniczną nad konkurentami.
Nowi uczestnicy odnoszą sukcesy, celując w określone nisze rynkowe. Unreal Speech zyskał popularność wśród producentów podcastów i wydawców audiobooków, oferując wyspecjalizowanych aktorów głosowych i możliwości w zakresie emocjonalnym. Tymczasem Cartesia skupiła się na wielojęzycznych głosach z autentycznymi akcentami, przyciągając zainteresowanie globalnych przedsiębiorstw i platform edukacyjnych.
Przewiduje się, że rynek audio AI znacznie wzrośnie do 2025 r., ponieważ możliwości zamiany tekstu na mowę zbliżają się do jakości ludzkiej i znajdują zastosowanie w obsłudze klienta, rozwiązaniach ułatwiających dostęp i tworzeniu treści. Stosunkowo niskie wymagania obliczeniowe w porównaniu z generowaniem wideo umożliwiają szersze wdrożenie i eksperymentowanie.
Dynamiczny charakter modeli sztucznej inteligencji stwarza zarówno szanse, jak i wyzwania dla przedsiębiorstw integrujących te technologie.
„Może być trudno nadążyć za najnowszymi rozwiązaniami w dziedzinie AI, a tempo tylko nabiera tempa” — powiedział Huber VentureBeat. „Jeśli prowadzisz firmę, która już wykorzystuje AI na dużą skalę, inwestowanie w solidne, niezależne od dostawcy procesy oceny jest kluczowe, ponieważ model, który jest najlepszy w tym miesiącu, może być drugim najlepszym w przyszłym miesiącu”.
Ta zmienność preferencji dotyczących modeli podkreśla wartość platform takich jak Poe, które oferują dostęp do wielu modeli za pośrednictwem jednego interfejsu, umożliwiając użytkownikom porównywanie wyników i dostosowywanie się do zmieniających się ekosystemów sztucznej inteligencji.
Analitycy branżowi sugerują, że rosnące znaczenie zdolności rozumowania może zwiastować zmianę w sposobie, w jaki przedsiębiorstwa oceniają i wdrażają modele sztucznej inteligencji, ze względu na coraz większy nacisk na precyzję i niezawodność w przypadku złożonych zadań, a nie tylko na szybkość i efektywność kosztową.
Ponieważ laboratoria pionierskie nadal wypuszczają bardziej wydajne modele w przyspieszonym tempie, firmy stają przed trudnymi decyzjami, kiedy standaryzować konkretne platformy, a kiedy zachować elastyczność. Wielu liderów korporacyjnej sztucznej inteligencji przyjmuje podejście portfelowe, używając różnych modeli do różnych zadań, jednocześnie zachowując możliwość zmiany dostawców w miarę rozwoju możliwości.
„Będzie to ważny obszar do obserwacji, zwłaszcza wśród dostawców rozwiązań wschodzących, gdyż reprezentuje najlepsze osiągnięcia, jakie obecnie oferuje sztuczna inteligencja” – zauważył Huber, odnosząc się do modeli wnioskowania.
Raport wskazuje, że możliwości multimedialne stają się coraz bardziej konkurencyjne, co sugeruje, że generowanie tekstu, które od dawna było głównym celem rozwoju sztucznej inteligencji, może ustąpić miejsca bardziej zrównoważonemu ekosystemowi, w którym generowanie obrazu, wideo i dźwięku odgrywa równie ważną rolę.
Przedsiębiorstwa, którym uda się z powodzeniem poruszać w tym skomplikowanym środowisku, to najprawdopodobniej te, które utrzymają ramy oceny skoncentrowane na konkretnych przypadkach użycia, zamiast gonić za najnowszymi wersjami modeli, a jednocześnie stworzą infrastrukturę techniczną umożliwiającą szybkie wdrożenie w przypadku pojawienia się znaczących ulepszeń.
W miarę jak modele sztucznej inteligencji kontynuują swoją grę w krzesełka na szczycie rankingów, jedno staje się jasne: na dzisiejszym rynku korona rzadko kiedy pozostaje na tej samej pozycji przez dłuższy czas — a firmy stawiające swoją przyszłość na wczorajszego czempiona w dziedzinie sztucznej inteligencji mogą znaleźć się w sytuacji, w której jutro znajdą się w gorszej sytuacji.
Jeśli chcesz zaimponować swojemu szefowi, VB Daily ma dla Ciebie rozwiązanie. Dajemy Ci wewnętrzny wgląd w to, co firmy robią z generatywną sztuczną inteligencją, od zmian regulacyjnych po praktyczne wdrożenia, dzięki czemu możesz dzielić się spostrzeżeniami, aby uzyskać maksymalny zwrot z inwestycji.
Przeczytaj naszą Politykę prywatności
Dziękujemy za subskrypcję. Sprawdź więcej newsletterów VB tutaj .
Wystąpił błąd.

venturebeat