Badania arXiv CS.LG

Fine-tuning z zachowaniem rotacji w modelach nadzorowanych

13 maj 2026

Hype:

5/10

Badacze opracowali nową metodę fine-tuning'u, która zachowuje rotacje w reprezentacjach modeli podczas treningu nadzorowanego. Podejście to zmniejsza zaburzenia istniejących wag modelu i poprawia transfer knowledge między zadaniami. Metoda ma potencjał do zwiększenia efektywności adaptacji dużych modeli językowych do nowych zastosowań bez ryzyka katastrofalnego zapominania wcześniej zdobytej wiedzy.

Czytaj oryginał →