Naukowcy zaproponowali AgentWall, system bezpieczeństwa działający w czasie wykonywania dla lokalnych agentów AI, który zabezpiecza przed niebezpiecznymi akcjami i manipulacją. System analizuje działania agentów zanim zostaną wykonane, umożliwiając ich blokowanie lub modyfikację bez konieczności trenowania nowego modelu. To rozwiązanie jest ważne dla wdrażania autonomicznych agentów w rzeczywistych systemach, gdzie potrzebna jest gwarancja bezpieczeństwa niezależnie od ich zawartości lub instruk
Badania
arXiv CS.AI