Nowy model OpenAI GPT-4.1

OpenAI zaprezentowało nową serię modeli GPT: GPT-4.1, GPT-4.1 mini i GPT-4.1 nano. Modele te przewyższają GPT-40 i GPT-40 mini pod każdym względem, szczególnie w kodowaniu i wykonywaniu instrukcji. Wprowadzono w nich również większe okna kontekstowe, obsługujące do 1 miliona tokenów kontekstu, co pozwala na lepsze wykorzystanie tego kontekstu dzięki ulepszonemu rozumieniu długiego kontekstu. Modele te charakteryzują się odświeżonym zakresem wiedzy z czerwca 2024 r.

GPT-4.1 osiąga doskonałe wyniki w następujących standardowych wskaźnikach branżowych:

Kodowanie: GPT-4.1 osiąga wynik 54,6% w SWE-bench Verified, co oznacza poprawę o 21,4% w porównaniu z GPT-40 i o 26,6% w porównaniu z GPT-4.5, co czyni go wiodącym modelem do kodowania.
Wykonywanie instrukcji: W teście Scale’s MultiChallenge, mierzącym zdolność wykonywania instrukcji, GPT-4.1 osiąga wynik 38,3%, co oznacza wzrost o 10,5% w porównaniu z GPT-40.
Długi kontekst: W Video-MME, teście multimodalnego rozumienia długiego kontekstu, GPT-4.1 ustanawia nowy rekordowy wynik, osiągając 72,0%.

Chociaż testy porównawcze dostarczają cennych informacji, modele te zostały wytrenowane z naciskiem na użyteczność w świecie rzeczywistym. Rodzina modeli GPT-4.1 oferuje wyjątkową wydajność przy niższych kosztach. Modele te zwiększają wydajność w każdym punkcie krzywej opóźnień. GPT-4.1 mini to znaczący skok w wydajności małych modeli, dorównujący, a nawet przewyższający GPT-40 w wielu testach.