Syll to otwartoźródłowy projekt, który łączy w jednym systemie zdolność do pracy z API, linią poleceń, interfejsami web i aplikacjami desktopowymi. Do tej pory agenty AI były zwykle specjalizowane w jednym obszarze — albo umiały klikać w GUI, albo wywoływać API. Syll zmienia to podejście, tworząc unifikowaną platformę, gdzie agent inteligentnie przełącza się między różnymi rodzajami interfejsów w zależności od potrzeby.
Co wyróżnia Syll, to sposób komunikacji między użytkownikiem a agentem. Zamiast pisania kompleksowych instrukcji, możesz po prostu pokazać agentowi, jak wykonać daną czynność — klikanie, wpisywanie, nawigacja. System nagraża te demonstracje i zamienia je w wielokrotnie użyteczne "umiejętności". Agent z kolei nie działa w ukryciu — pokazuje ci log swoich działań, zrzuty ekranów z kluczowych momentów i prosi o zatwierdzenie przed każdym ważnym krokiem. Wszystko — pamięć agenta, nauczane umiejętności, procedury i reguły — przechowywane jest lokalnie w postaci zwykłych plików, które możesz edytować, czytać i modyfikować.
Zespół zwalidował system na rzeczywistych aplikacjach: Adobe Photoshop, Adobe Audition, Stardew Valley, macOS Finder. To pokazuje, że projekt nie jest tylko teoretycznym ćwiczeniem, lecz rzeczywiście pracuje z profesjonalnym oprogramowaniem. Syll może stać się fundacją dla osobistych automatyzacji — coś, co użytkownik może nauczać, oglądać dokładnie co się dzieje, i ciągle rozwijać bez zamykającego go w czarnej skrzynce ekosystemu proprietary.