Google wypuścił Gemma 4 12B — kompaktowy model językowy, który powinien działać płynnie na większości współczesnych laptopów z 16GB RAM-u. To duża zmiana dla tych, którzy chcą eksperymentować z zaawansowaną AI bez wysyłania danych do chmury czy inwestowania w drogi sprzęt.

Tricks, które sprawiają, że 12B parametrów wystarczy, to nowy schemat kodowania i inteligentna predykcja tokenów. Google udało się tutaj spakować wydajność, którą normalnie widywaliśmy w większych modelach. To oznacza, że nawet osoby pracujące na zwykłych maszynach mogą teraz korzystać z modeli porównywalnych do znacznie większych wersji.

Wydanie takiego modelu ma rzeczywisty wpływ na dostępność AI. Nie chodzi tylko o osoby eksperymentujące z kodowaniem czy twórców — to zmienia grę dla każdego, kto chce zrozumieć, jak działają modele, lub ma konkretne zadania do wykonania lokalnie. Może to przyspieszyć adopcję open-source'owych rozwiązań AI i zmniejszyć zależność od gigantów chmurowych.