• Qwen3: Nowa generacja otwartych modeli od Alibaba Cloud

    Alibaba Cloud ogłosiła premierę Qwen3, nowej rodziny dużych modeli językowych (LLM), zaprojektowanych z myślą o wszechstronnych zastosowaniach, wysokiej wydajności i dostępności dla społeczności open source. Modele Qwen3 są dostępne w wersjach gęstych (dense) oraz z architekturą mieszanki ekspertów (Mixture of Experts, MoE), co pozwala na optymalizację kosztów obliczeniowych oraz dostosowanie do różnorodnych scenariuszy użycia. Nowa…

  • Llama 4 od Meta: Nowa generacja flagowych modeli AI

    Meta wypuściła nową kolekcję modeli AI, Llama 4. W skład tej rodziny wchodzą cztery nowe modele: Llama 4 Scout, Llama 4 Maverick i Llama 4 Behemoth. Wszystkie modele Llama 4 zostały wytrenowane na „dużych ilościach nieoznakowanych danych tekstowych, obrazowych i wideo”, aby zapewnić im „szerokie wizualne zrozumienie”. Architektura Llama 4: Mieszanka Ekspertów (MoE) Meta twierdzi,…