W 1995 roku Microsoft rozpoczął sprzedaż programu Bob, który miał być przyjaznym i prostym graficznym interfejsem dla mało zaawansowanych użytkowników zastępującym standardowy GUI systemów Windows 95 i 3.1. Bob wykorzystywał metaforę mieszkania, w którym poszczególne pokoje (biuro, salon, garaż) odpowiadały różnym grupom aplikacji. Pokoje zamieszkiwali animowani asystenci (tzw. "agenci") oferujący użytkownikowi pomoc. System umożliwiał wybór głównego przewodnika spośród kilkunastu kreskówkowych postaci np. psa o imieniu Rover. Każdy z asystentów miał własną osobowość, styl wypowiedzi i zachowania.

Microsoft zachwalał swój produkt:

Bob naprawdę sprawia, że używanie domowego PC do zarządzania domem staje się proste i radosne, ponieważ otrzymujesz pomoc Osobistych Przewodników w Bob!

Animowani asystenci Microsoftu narodzili się w trakcie badań nad "interfejsami społecznymi" prowadzonych wspólnie z naukowcami z uniwersytetu Stanford. Z ich obserwacji wynikało, że ludzie antropomorfizują komputery, traktując je tak jakby posiadały inteligencję i uczucia. Wyciągnięto z tego wniosek, że programy komputerowe nie powinny pełnić roli narzędzi, które po prostu prezentują informacje, ale aktywnych partnerów pomagających w wykonywaniu zadań użytkownikowi. Ludzie przyzwyczajeni są do interakcji poprzez rozmowę, odczytywania emocji z wyrazu twarzy, poruszania się w pomieszczeniach i manipulacji obiektami w naturalnej przestrzeni. Wszystkie te zasady wprowadzono w interfejsie Microsoft Bob. Dumne wypowiedzi naukowców ze Stanford na temat Boba czyta się dzisiaj z rozbawieniem, bo projekt okazał się oczywiście totalną klapą.

Nikt nie chciał używać Boba. Interfejs wyglądał głupio. Mógłby nadawać się dla dzieci, ale program kierowano do dorosłych użytkowników - zawierał aplikację do planowania finansów (czy ktokolwiek powierzyłby swoje pieniądze animowanej papudze?), procesor tekstu i specjalną wersję klienta e-mail. Aplikacje zostały ukryte jako elementy dekoracji pomieszczeń, a podpisy pojawiały się dopiero po naciśnięciu klawisza F1. Program nadużywał irytujących efektów dźwiękowych. Systemowi asystenci, w założeniu mili i pomocni, budzili wściekłość zmuszając użytkownika do odpowiadania na dziesiątki niekończących się pytań przy każdej okazji i oglądania w kółko tych samych "zabawnych" animacji. Niezależnie od tego ile razy użytkownik wykonywał dowolną czynność, system zmuszał go do przechodzenia krok po kroku przez tutorial.

Tak prezentował się Bob:

Naprawdę trudno uwierzyć, że ktoś w Microsoft mógł myśleć, że dorosła osoba będzie chciała pracować w systemie, który wygląda jak stworzony dla pięciolatka. Projektanci Boba potraktowali mało zaawansowanych użytkowników komputerów jak idiotów, którzy potrzebują uproszczonego interfejsu i postaci z kreskówek mówiących im co mają robić. Nie wiem czy Bob trafiłby w ogóle do sprzedaży, gdyby nie fakt, że jego project managerką była Melinda French, przyszła żona Billa Gatesa...

Boba szybko wycofano z rynku, ale Microsoft nie porzucił pomysłu animowanych asystentów, którzy pojawili się w MS Office. Wśród nich znalazł się oczywiście słynny Pan Spinacz (Mr. Clippit lub Clippy), wybrany jako domyślna postać, ponieważ nie budził żadnych niekorzystnych skojarzeń w różnych kulturach. Clippy przeszedł do historii jako najbardziej znienawidzona przez użytkowników funkcjonalność w aplikacji Word 🙂

Jak napisał na swoim blogu Chris Pratley, project manager Microsoft Word, w założeniu asystenci mieli się pojawiać po odpaleniu aplikacji wskazując, że program jest gotowy do pracy i nie zawiesił się. Mieli też wprowadzać dobrą atmosferę 😉 i dawać użytkownikom łatwy dostęp do pomocy poprzez możliwość zadania pytania w języku naturalnym. Głównym ficzerem był system podpowiedzi prezentowanych automatycznie po wykonaniu przez użytkownika określonych akcji. Najbardziej znanym i irytującym przypadkiem był tip "It looks like you're writing a letter." ("Wygląda na to, że piszesz list."), który pojawiał się w Wordzie za każdym razem, kiedy użytkownik zaczynał pisanie dokumentu od słowa "Dear..." ("Drogi/a..."). Jak w przypadku Boba intencje były dobre - ludzki, emocjonalny interfejs, który będzie służył pomocą ucząc użytkowników nowych opcji. Ale czy ktokolwiek chciałby spotkać w rzeczywistości tak namolne indywiduum jak Pan Spinacz?

Inny film naśmiewający się ze Spinacza:

Podobno animowani asystenci w Office wypadli bardzo dobrze na badaniach użyteczności, ale niestety testowano jedynie pierwsze użycie programu przez nowicjuszy, a nie wielokrotne użycie przez osoby korzystające z Office na co dzień... Z powodu negatywnego feedbacku od użytkowników (choć wg Pratleya negatywnego tylko w 50%, w co nie chce mi się wierzyć) w nowszych wersjach MS Office animowani asystenci zostali domyślnie wyłączeni. W Office 2007 zabrakło ich zupełnie.

Piesek Rover z Microsoft Bob powrócił w Windows XP jako asystent systemowej wyszukiwarki, ale został usunięty z Windows Vista.

Najnowszym zastosowaniem animowanych asystentów w produktach Microsoftu jest internetowa wyszukiwarka Ms. Dewey. Panna D jest co prawda dużo milsza od Pana Spinacza, ale jej uroki nie są raczej w stanie skłonić nikogo do rezygnacji z szybkości działania Google.

Czy idea wirtualnych asystentów skazana jest na porażkę? Moim zdaniem w dużej mierze tak, choć nie we wszystkich przypadkach. Trudno sobie dziś wyobrazić poważne interfejsy wykorzystujące animowanych "inteligentnych" agentów jako podstawowy sposób interakcji z użytkownikiem, o czym jeszcze kilka lat temu mówili futurolodzy. Raymond Kurzweil w 1999 roku przewidywał:

W roku 2009 przynajmniej 50% transakcji jest przeprowadzanych online. Inteligentni asystenci łączący rozpoznawanie ciągłej mowy, rozumienie języka naturalnego, zdolność rozwiązywania problemów i animowane osobowości rutynowo asystują przy odnajdywaniu informacji, odpowiadaniu na pytania i przeprowadzaniu transakcji. Inteligentni asystenci stali się głównym interfejsem podczas interakcji z usługami opartymi o informację, które oferują szerokie możliwości wyboru. Projektanci osobowości są poszukiwani, a dziedzina ta jest rozwijającym się obszarem tworzenia oprogramowania. (The Age of Spiritual Machines)

Ben Shneiderman wprost nazwał to marzenie naiwną głupotą. To że ludzie komunikują się społecznie, nie oznacza że pragną iluzji takiej komunikacji podczas pracy ze swoim komputerem. Nie znam użytkownika komputera, który nie narzekałby na to, że musi ciągle na coś czekać (na załadowanie systemu operacyjnego, start programu, wykonanie jakiejś operacji, dotarcie do jakiejś opcji lub informacji) - nie ważne ile czasu to zajmuje, zawsze trwa to zbyt długo. Tymczasem w świecie społecznym prowadzenie dialogu z drugą osobą jest bardzo często wartością samą w sobie, czym dialog z komputerem nigdy nie będzie. Język naturalny wymaga form gramatycznych i pełen jest zwrotów grzecznościowych, które sprawiają że wydawanie w nim poleceń jest mniej efektywne, niż korzystanie z prostych komend. Wreszcie komunikacja społeczna po prostu zbyt mocno angażuje nasze umysłowe zasoby, aby miała stać się podstawą interfejsu do wykonywania prostych czynności (don't make me think!). Wszystko to powoduje, że z punktu widzenia użyteczności wirtualne postaci nie sprawdzają się.

Z drugiej strony, właśnie emocjonalne i poznawcze zaangażowanie jakie wzbudzają u użytkowników tego typu rozwiązania sprawia, że mogą one w niektórych przypadkach znaleźć swoje zastosowanie. Choć do tej pory wykorzystywano wirtualnych asystentów w zły sposób, lekceważąc podstawowe zasady psychologii i konstruowania interfejsów, to czasem mogą być oni pomocnym, wzbogacającym doświadczenie użytkownika dodatkiem. Dobrze zaprojektowane animowane postacie, które wciągają użytkowników w dialog, mogą stanowić nie lada atrakcję i wpływać pozytywnie na user experience. Badania wskazują na przykład, że informacje przekazywane przez animowanych agentów mogą być lepiej zapamiętywane i chętniej wykorzystywane przez ludzi niż informacje przekazywane za pomocą tekstu czy samej mowy.

Ponieważ ruch i twarze bardzo mocno przyciągają ludzką uwagę, animowani asystenci nie mogą pojawiać się nagle i bez zrozumiałego powodu jak słynny Spinacz, bo trudno jest ich zignorować i będą przeszkadzać użytkownikom w ich zadaniach. Muszą być grzeczni i nie wtrącać się w wykonywane przez użytkownika czynności, jeśli nie zostali o to poproszeni. Nie powinni nigdy blokować działania systemu, ani spowalniać wykonywania zadań przez prezentowanie wielokrotnie tych samych zbędnych animacji. Powinni reagować na akcje użytkownika natychmiast i w sposób adekwatny. Wyłączenie asystenta nie powinno sprawiać kłopotów.

Dość udanym i ciekawym przykładem zastosowania animowanych asystentów są postacie pojawiające się przy wypełnianiu formularzy na stronie towarzystwa ubezpieczeniowego Allstate. Szkoda, że brak im interaktywności - można było chociaż wykorzystać asystentów do prezentowania komunikatów o błędach, jakie może popełnić użytkownik.

Jest trochę serwisów WWW, które używają jako pomocy chatterbotów pozwalających na prowadzenie rozmowy np. Ania w Ikea lub lingubot Hubert na serwisie Hestia. Oba boty posiadają swoje wizualizacje. Ania robi głupią minę kiedy nie potrafi zrozumieć pytania i uśmiecha się gdy zna odpowiedź. Hubert jest mniej ekspresyjny, ale za to mówi za pomocą syntezatora mowy IVO. W przypadku tak skomplikowanej tematyki jak ubezpieczenia bot może być dobrą pomocą. Zamiast szukać informacji na serwisie i wczytywać się warunki ubezpieczenia lub przeglądać długie FAQ-i, użytkownik może zadać pytanie botowi i otrzymać na nie konkretną odpowiedź. Bot może się okazać wygodniejszy od wyszukiwarki, która dostarczy zbyt wiele wyników.

Sporo badań zostało przeprowadzonych nad użyciem animowanych agentów w systemach e-learningowych. Uczenie się obcego języka może być prostsze, gdy komunikujmy się z wirtualną postacią, która posiada również język gestów i mimikę twarzy przekazującą emocje.

Animowani pomocnicy nadają się także wyjątkowo dobrze do zastosowania w interfejsach przeznaczonych dla dzieci.

Na serwisie soków Kubuś, skierowanym do dzieci w wieku od 4 do12 lat, który projektowałem dla Maspexu, postać Kubusia oprócz roli brandingowej miała pełnić rolę przewodnika prezentującego dzieciom swój fantastyczny świat.

W założeniu animowany Kubuś miał zapraszać dzieci do lokacji, których jeszcze nie widziały i spełniać funkcję pomocy, podpowiadając im co można robić na każdym ekranie. Ponieważ serwis jest kierowany także do dzieci, które nie potrafią jeszcze czytać, Kubuś miał komunikować się głosem. Dzieci mogłyby podążyć za animowanym Kubusiem lub go zignorować, ale zawsze powinna istnieć możliwość przywołania go. Niestety w finalnej realizacji stało się inaczej (mniejsza z tym dlaczego) i obecność Kubusia na podstronach została ograniczona do głosu i modalnych okienek dialogowych (!) pojawiających się zawsze w każdej lokacji, nie ważne ile razy użytkownik był już w danym miejscu. Sądzę, że te okienka bardziej denerwują dzieci (które prawdopodobnie starają się je jak najszybciej zamknąć, nie zwracając w ogóle uwagi na treść), niż im w czymkolwiek pomagają. Nie wiem czy budzą one u małych konsumentów pozytywne uczucia względem Kubusia! To kolejny przykład na interfejs, gdzie idea wirtualnych asystentów nie wypaliła - jednak nie z powodu błędnej koncepcji, a realizacji.

(Update: strona Kubusia w opisanej tutaj wersji już nie istnieje w sieci.)

Linki: