NVIDIA zaprezentowała X-Token, innowacyjną metodę knowledge distillation z projekcją wielokrotnych tokenów, która osiąga lepsze wyniki niż poprzednia metoda GOLD o 3,82 punktu średniej na modelu Llama-3.2-1B. Metoda wykorzystuje guidance projekcji do skuteczniejszego transferu wiedzy między modelami przy użyciu różnych tokenizatorów. To osiągnięcie jest istotne dla kompresji dużych modeli językowych, umożliwiając szybsze i mniej wymagające obliczeniowo wdrażanie AI w praktyce.