Nowy model AI od Google DeepMind – Gemini 2.5 Pro (experimental)

Google DeepMind zaprezentowało Gemini 2.5, swój najnowszy i najbardziej zaawansowany model sztucznej inteligencji. Gemini 2.5 to model „myślący”, zaprojektowany do rozwiązywania coraz bardziej złożonych problemów. Pierwsza wersja 2.5, Gemini 2.5 Pro Experimental, znacząco wyprzedza inne modele w popularnych benchmarkach i wykazuje imponujące zdolności rozumowania i kodowania.

Kluczowe cechy i możliwości

Gemini 2.5 wprowadza nową jakość w rozumieniu i przetwarzaniu informacji przez modele AI.

Rozumowanie: W przeciwieństwie do prostego klasyfikowania i przewidywania, Gemini 2.5 analizuje informacje, wyciąga logiczne wnioski, uwzględnia kontekst i niuanse oraz podejmuje świadome decyzje. Ta zdolność „myślenia” pozwala modelowi na efektywne radzenie sobie ze złożonymi zadaniami, co przekłada się na wyższą dokładność i lepsze wyniki.
Kodowanie: Gemini 2.5 Pro wykazuje imponujące zdolności w generowaniu, transformacji i edycji kodu. W testach SWE-bench Verified, uznawanych za standard w ocenie agentów kodujących, Gemini 2.5 Pro osiągnął wynik 63.8% przy użyciu niestandardowej konfiguracji agenta. Model potrafi na przykład wygenerować działający kod gry na podstawie jednolinijkowego polecenia.
Kontekst: Gemini 2.5 charakteryzuje się rozszerzonym oknem kontekstowym, co pozwala mu na przetwarzanie ogromnych zbiorów danych i złożonych problemów z różnych źródeł informacji. Gemini 2.5 Pro obsługuje okno kontekstowe o rozmiarze 1 miliona tokenów, a wkrótce planowane jest wprowadzenie obsługi 2 milionów tokenów. Model z łatwością radzi sobie z różnymi rodzajami danych, w tym tekstem, audio, obrazami, wideo, a nawet całymi repozytoriami kodu.

Benchmarki i wyniki

Gemini 2.5 Pro Experimental osiąga znakomite wyniki w różnorodnych benchmarkach, często przewyższając inne modele.

W testach rozumowania i wiedzy, takich jak Humanity’s Last Exam, Gemini 2.5 Pro osiąga wynik 18.8% (bez użycia narzędzi zewnętrznych).
W benchmarkach matematycznych i naukowych, takich jak GPQA i AIME 2025, 2.5 Pro również wypada bardzo dobrze, często prowadząc w swojej kategorii.
W testach kodowania, takich jak SWE-bench Verified, Gemini 2.5 Pro osiąga wynik 63.8% (z użyciem agenta).
Model wypada również bardzo dobrze w ocenie preferencji ludzkich (LMArena), gdzie zajmuje pierwsze miejsce z dużą przewagą.

Poniższa tabela przedstawia szczegółowe wyniki Gemini 2.5 Pro Experimental w porównaniu z innymi modelami:

źródło obrazka: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#enhanced-reasoning

Zastosowania

Dzięki swoim zaawansowanym możliwościom, Gemini 2.5 otwiera nowe możliwości zastosowań AI w różnych dziedzinach.

Model może być wykorzystywany do tworzenia zaawansowanych aplikacji internetowych i agentów kodujących.
Gemini 2.5 Pro potrafi generować kod na podstawie jednolinijkowego polecenia, co znacznie upraszcza proces tworzenia oprogramowania.
Dzięki zdolności do przetwarzania różnych rodzajów danych, model może być stosowany w analizie złożonych problemów, wymagających uwzględnienia wielu źródeł informacji.

Dostępność i dalszy rozwój

Gemini 2.5 Pro Experimental jest już dostępny dla deweloperów i przedsiębiorstw w Google AI Studio. Użytkownicy Gemini Advanced mogą również korzystać z modelu na komputerach i urządzeniach mobilnych. W najbliższych tygodniach model będzie również dostępny na platformie Vertex AI. Google DeepMind planuje dalszy rozwój Gemini, w tym zwiększenie okna kontekstowego do 2 milionów tokenów i dalsze ulepszanie jego możliwości. Firma zachęca również do dzielenia się opiniami na temat modelu, aby móc jak najlepiej dostosować go do potrzeb użytkowników.