Badacze z arXiv sprawdzili, czy LLM-y rzeczywiście potrafią analizować własne procesy myślowe i wyjaśniać swoją wewnętrzną logikę. Studium pokazuje znaczące rozbieżności między deklarowanymi możliwościami introspekcji a rzeczywistymi zdolnościami modeli. Wyniki ujawniają, że modele często generują przekonujące, ale nieprecyzyjne wyjaśnienia, co ma implikacje dla zaufania do AI i interpretowaniu jego decyzji.