Sakana AI i NVIDIA zaprezentowały TwELL, nową technologię wykorzystującą CUDA kernels, która przyspieszył inferencję modeli języka o 20,5% i trening o 21,9%. Rozwiązanie optymalizuje obliczenia na GPU-ach NVIDIA poprzez bardziej efektywne wykorzystanie paralelizmu i zarządzania pamięcią. Ta optymalizacja jest ważna dla zmniejszenia kosztów oraz czasu działania dużych modeli AI w praktycznych aplikacjach.
Badania
MarkTechPost