Budowanie botów

Czym jest voicebot? Najważniejsze informacje o narzędziu zastępującym IVR w call center

Spis treści

W dzisiejszych czasach nietrudno znaleźć szereg artykułów na temat tego, jak oparte na sztucznej inteligencji voiceboty zyskują na popularności w świecie biznesu. Jeśli chodzi o automatyzację call center w bankach, instytucjach finansowych, czy agencjach turystycznych, sprawy mają się tak samo.

Samoobsługa staje się zatem coraz bardziej popularna, a voiceboty grają pierwsze skrzypce w biznesach, które inwestują w automatyzację obsługi klienta. Designerzy botów mają również okazję do tego, by przyczynić się do sukcesu tych organizacji.

W jednym z naszych pierwszych artykułów z Poradnika Budowania Botów powiedzieliśmy sobie, czym są chatboty. Z kolei celem tego artykułu jest wprowadzenie projektantów botów w temat voicebotów z racji stale rosnącego zainteresowania wśród firm, a także omówienie korzyści płynących z wdrożenia voicebotów jako zamiennika systemów IVR i sterowania połączeniami (call steering).

W tym artykule omówimy:

  • Projektowanie i budowanie voicebotów.
  • Rodzaje voicebotów i ich zastosowania.
  • Generatywną AI i jej zastosowanie w konstrukcji w voicebotów
  • Wkład voicebotów AI w wydajność centrów obsługi klientów
  • Przyszłość voicebotów opartych na sztucznej inteligencji

Czym są voiceboty AI?

Zasadniczo voiceboty to chatboty wyposażone w funkcję przetwarzania mowy. Innymi słowy, to oparte na sztucznej inteligencji oprogramowanie, które odbiera polecenia głosowe i posługuje się mową. Znajdują szerokie zastosowanie, na przykład w call center, aplikacjach mobilnych, czy komunikatorach takich jak WhatsApp.

Podobnie jak chatboty, voiceboty rozwinęły się w zawrotnym tempie: znakomicie rozumieją kontekst, dają spersonalizowane i celne odpowiedzi, a interakcje z nimi stały się zdecydowanie płynniejsze i bardziej ludzkie.

Dzięki tym postępom, voiceboty zajęły miejsce technologii IVR i systemów sterowania połączeniami w setkach firm.

Voicebot AI: Zastępca systemów IVR w call center

Od niecałej dekady systemy Interactive Voice Response (IVR) stanowiły podstawę obsługi klienta w wielu sektorach, w tym w bankowości, finansach, turystyce i wielu innych. IVR to sposób zautomatyzowania call center, który kieruje klientów przez serię uprzednio nagranych wiadomości, aby na koniec mogli zostać przekierowani do konsultanta.

Choć systemy IVR z powodzeniem przekierowują połączenia od lat, ich słabości obnażone zostały przez gwałtowne postępy technologiczne w zakresie konwersacyjnej AI. Gdy klient próbuje dodzwonić się do firmy i musi najpierw przejść przez system IVR, na swojej drodze może napotkać szereg negatywnych doświadczeń.

  1. Systemy IVR wymagają cierpliwości od dzwoniącego, ponieważ ten musi poczekać na wyliczenie poszczególnych opcji
  2. Klient może łatwo popełnić błąd wciskając omyłkowo zły przycisk (jeśli nie można się cofnąć)
  3. Systemy IVR nie zostawiają miejsca na dodatkowy kontekst, więc jeśli system nie wymieni sprawy, w której klient dzwoni, musi on łączyć się z numerem ogólnym.

Właśnie dlatego voiceboty AI są tak przełomowym rozwiązaniem. Zamiast wymagać od klientów, aby czekali na wysłuchanie opcji i możliwość wciśnięcia przycisku, tym samym narażając ich na frustrację, voiceboty AI rozmawiają z nimi tak, jak konsultanci.

Voiceboty to nowy wymiar doskonałości w zakresie obsługi klienta, który pozwala biznesom obsługiwać bardziej skomplikowane zapytania, zapewniać spersonalizowany serwis i dostarczać lepsze pod każdym względem doświadczenie użytkownika, jednocześnie oszczędzając na kosztach operacyjnych.

W dodatku, wraz z czasem voiceboty oparte na AI uczą się i stają się sprawniejsze dzięki możliwościom uczenia maszynowego. Im więcej interakcji obsługują, tym bardziej stają się inteligentne i wydajne, podnosząc jakość usługi na jeszcze wyższy poziom. Dlatego też zmiana z systemu IVR na boty AI stanowi znaczący skok do przodu w technologii call center, oferując lepszą wydajność, elastyczność i satysfakcję dla klientów.

Jak działają voiceboty? 

Choć voiceboty i chatboty oparte na konwersacyjnej sztucznej inteligencji mają wiele wspólnych cech operacyjnych, te pierwsze wykorzystują dwa unikatowe elementy: Automatyczne Rozpoznawanie Mowy (Automatic Speech Recognition, ASR) i Zamiana Tekstu na Mowę (Text-to-Speech, TTS). Na samym początku interakcji ASR przekłada wypowiedzianą komendę lub pytanie użytkownika na formę tekstową. Na koniec interakcji, TTS przekształca wygenerowaną odpowiedź tekstową w język mówiony. Cały proces działania voicebota prezentuje się następująco:

  1. Komenda lub pytanie użytkownika: Interakcja zaczyna się, gdy użytkownik zadaje pytanie lub wydaje polecenie voicebotowi. Stopień skomplikowania tej komunikacji werbalnej może wahać się od prostego zapytania do opisu zawiłego problemu.
  2. Automatyczne rozpoznawanie mowy (ASR): Automatyczne rozpoznawanie mowy przekłada wypowiedzianą wiadomość na tekst. Następnie, voicebot wykorzystuje wygenerowany tekst w silniku rozumienia języka naturalnego (Natural Language Understanding, NLU). Trafność ASR to kluczowy parametr, ponieważ stanowi fundament wszystkich kolejnych kroków.
  3. Rozumienie języka naturalnego (NLU): NLU rozszyfrowuje zamiar ukryty w zapytaniu i podanych szczegółach, takich jak data, lokalizacja, czy szczegóły produktu. Technologia ta umożliwia voicebotowi zrozumieć kontekst i semantyczne znaczenie danych wprowadzonych przez użytkownika.
  4. Zarządzanie dialogiem Komponent ten określa, skąd pobrać dane istotne do utworzenia właściwej odpowiedzi na zapytanie klienta. Mogą pochodzić z zewnętrznego systemu lub bazy wiedzy, lecz możliwe jest także uznanie zapytania za zbyt skomplikowane i przekierowanie połączenia do konsultanta.
  5. Generowanie języka naturalnego (NLG): Na podstawie pozyskanych danych i rozpoznanego zamiaru użytkownika, NLG tworzy zrozumiałą odpowiedź tekstową. Bierze pod uwagę wszystkie dostępne informacje i całokształt wiedzy, aby skonstruować wyczerpującą, precyzyjną odpowiedź.
  6. Text-to-Speech: Na koniec wygenerowany tekst zostaje przekonwertowany z powrotem na język mówiony. TTS dodaje również prozodię, intonację i inne cechy języka mówionego, by poprawić naturalność wypowiedzi. Moduluje styl mowy na wzór ludzkich konwersacji i podnosząc tym samym jakość doświadczenia dla użytkownika.
        Proces i elementy działania voicebota

        Proces i elementy działania voicebota

        Ewolucja chatbotów głosowych: Asystenci AI zasilani przez generatywną AI

        Technologie generatywne, takie jak ChatGPT, mają swoje unikatowe zalety, jednak obecnie nie spełniają jeszcze wymogów wydajnej automatyzacji w komercyjnej obsłudze klienta, dlatego też nie są w stanie dorównać możliwościom botów opartych na konwersacyjnej AI.

        Niemniej jednak, zastosowanie ChatGPT w tworzeniu systemu NLU może znacznie przyspieszyć proces tworzenia voicebotów (aż o 60%!). Co więcej, ChatGPT może być wszechstronnie wykorzystany przy projektowaniu doświadczeń konwersacyjnych:

        Generowanie fraz treningowych: W ten sposób można automatycznie wyprodukować szereg fraz treningowych i sprawić, że chatboty oparte na głosie będą prawidłowo rozpoznawać i odpowiadać na różne zapytania użytkowników. Zmniejsza to czas potrzebny na ręczne wprowadzanie danych.

        Syntezowanie branżowej terminologii: ChatGPT może w bardzo wydajny sposób wygenerować listę synonimów dla terminów z danej branży. Nie tylko poszerza to zasób słów voicebota, ale także pozwala mu zrozumieć i odpowiadać na wszelakie polecenia użytkowników nawet jeśli są one sformułowane nieco inaczej.

        Tworzenie scenariuszy rozmowy: ChatGPT ułatwia także życie bot designerom poprzez automatyczne tworzenie złożonych scenariuszy rozmowy. Dobrze zoptymalizowane dialogi zapewniają płynność i logiczne posuwanie konwersacji do przodu, dzięki czemu rozmowy z użytkownikami są angażujące i wydajne.

        Możliwości te przyspieszają proces szkolenia chatbota AI, a co za tym idzie, pozwalają bot designerom tworzyć bardziej wydajną, angażującą spójną z marką komunikację.

        Dlaczego firmy potrzebują voicebotów

        Wdrożenie voicebotów w strategię komunikacyjną Twojego biznesu niesie za sobą kilka znaczących korzyści. Omówimy je teraz jedno po drugim, od przyspieszenia obsługi klienta poprzez wykonywanie konkretnych zadań.

        Zastąpienie systemu IVR – wykorzystując rozumienie języka naturalnego (NLU), voiceboty umieją odczytać zamiary dzwoniącego. W odróżnieniu od tradycyjnych systemów, gdzie użytkownicy muszą poruszać się wybierając różne opcje, na przykład „Aby przejść do rezerwacji, wciśnij 1”, konwersacyjne voiceboty pozwalają klientom na bezpośrednie wyrażanie swoich potrzeb, takich jak „Potrzebuję umówić spotkanie z doradcą”. Voicebot od razu rozumie zamiar, umawia spotkanie lub, jeśli trzeba, przekierowuje połączenie do odpowiedniego zespołu lub konsultanta. Ten zaawansowany system nie tylko znacznie oszczędza czas konsultantów w zespołach obsługi klienta, ale także poprawia doświadczenie użytkownika.

        Usprawnienie odpowiedzi na najczęściej zadawane pytania – voiceboty zorientowane na informacje usprawniają interakcje z klientami odpowiadając na częste zapytania takie jak „Gdzie znajduje się najbliższy oddział?”, „Kiedy mogę spotkać się z doradcą?” lub „W jakich godzinach jesteście otwarci?”. Funkcjonują jako efektywne narzędzie w dostarczaniu szybkich i trafnych informacji, tym samym poprawiając wydajność obsługi klienta.

        Szybsze wykonywanie zadań – voiceboty zorientowane na cele lub wykonywanie transakcji służą do automatyzacji wybranych procesów, działając w roli specjalistów od obsługi klienta. Takie zaawansowane voiceboty mogą wykonywać działania takie jak zamawianie nowej karty kredytowej, umawianie spotkań z doradcą sprzedaży lub zgłaszanie zażaleń, usprawniając w ten sposób obsługę klienta i poprawiając wydajność.

        Krótszy czas oczekiwania – klienci nie muszą oczekiwać na konsultanta, aby otrzymać pomoc. Wielu klientów często skarży się na wydłużone czasy oczekiwania lub błędy w rozumieniu systemu sterowania połączeniami.

        Rozumienie zamiaru klienta – jak wspomnieliśmy wyżej, voiceboty polegają na silniku NLU, by przetwarzać intencje użytkownika i dawać inteligentne odpowiedzi, poprawiając w ten sposób doświadczenie użytkownika w interakcji z marką. Lepsze doświadczenie użytkownika prowadzi z kolei do lojalności wobec marki.

        Spersonalizowane interakcje – voiceboty zapewniają niezwykle spersonalizowane odpowiedzi w oparciu o wcześniejsze interakcje i dane klienta, takie jak imię i nazwisko, identyfikator klienta lub data urodzenia.

        Wyzwania związane z tworzeniem voicebotów

        Jak dotąd omówiliśmy, jak działają voiceboty i w jaki sposób firmy mające call center mogą na nich skorzystać. Jednak zbudowanie bota AI wiąże się z kilkoma przeszkodami, począwszy od pierwszego ustawienia voicebota, w ramach którego należy go zaprojektować, określić procedury, zamiary i kluczowe frazy. Jakość Twojego voicebota będzie odpowiadać jakości zbioru danych i jego przeszkoleniu. Poniżej wymieniamy kilka wyzwań, które możesz napotkać na swojej drodze oraz sposoby sprostania im:

        Projektowanie dialogów i procedur – stworzenie wyczerpującej listy możliwych dialogów i procedur do zautomatyzowania może okazać się trudnym orzechem do zgryzienia. Najpierw należy stworzyć dostosowaną do czatbotów wyczerpującą listę zapytań, które klient może sam chcieć zadać poruszając się po stronie. Proces ten może trochę potrwać, ale wsparcie ChatuGPT w wygenerowaniu scenariusza rozmowy krok po kroku może go trochę przyspieszyć. Wygenerowane odpowiedzi można następnie przenieść do kreatora botów.

        Brak zaufania do botów – ludzie zazwyczaj nie ufają botom, a zatem sprawienie, aby Twój bot brzmiał bardziej jak człowiek to nie lada wyzwanie. Designerzy botów mogą pokonać tę przeszkodę poprzez programowanie fraz reprezentujących Twoją markę. Aby naśladować ludzką mowę za pomocą głosu AI wiele firm korzysta z SSML, czyli języka wykorzystywanego do regulowania elementów mowy takich jak pauzy, prędkości i wymowy.

        Rozpoznawanie mowy wciąż się rozwija – voiceboty AI posługują się już wszystkimi najważniejszymi językami, jednak w zakresie zdolności rozpoznawania mowy nadal występują ograniczenia technologiczne w rozumieniu akcentów dialektów, a także slangu lub mowy nieformalnej. Kiedy można się spodziewać, że technologia rozpoznawania mowy zacznie radzić sobie z takimi zawiłościami? Tylko czas pokaże.

        Przyszłość voicebotów AI

        Rozpowszechnienie voicebotów na przestrzeni poprzedniej dekady wywołało niemałe poruszenie wśród zarówno klientów, jak i biznesów oraz tego, jak obie strony komunikują się ze sobą. Oto kilka z najgłośniejszych trendów w świecie botów AI:

        Integracja z ChatGPT – uzbrojenie voicebota w szeroki zasób informacji i poszerzenie jego frazeologicznego i terminologicznego repertuaru to kluczowy zabieg w tworzeniu bota, jeśli chcemy, żeby prawidłowo rozumiał zapytania użytkowników. ChatGPT potrafi przyspieszyć ten proces poprzez błyskawiczne i wydajne generowanie terminologii potrzebnej na początkowych etapach tworzenia voicebota.

        Rozpoznawanie mowy – niektóre firmy korzystają z SSML by dostosowywać brzmienie naturalnej mowy. W ten sposób mogą naśladować mowę ludzi, włączając do niej pauzy, akcenty, wymowę, prędkość i intonację. Dla przykładu, asystent głosowy Google urozmaica swoje wypowiedzi wstawkami typu „eee”, „yyy” czy też „mhm”, by naśladować naturalny ludzki rytm i wtrącenia.

        Centra kontaktu przesiadają się na voiceboty – wiele organizacji, w tym banki, lotniska, czy hotele coraz szybciej odchodzą od przestarzałych już centrów kontaktu i zaczynają stosować chatboty i voiceboty w aplikacjach mobilnych, komunikatorach i na stronach internetowych. Jak wspomnieliśmy na początku tego artykułu, rośnie również liczba klientów preferujących rozmowy z botami niż z ludźmi.

        Jak wybrać platformę do budowania voicebotów odpowiednią dla Twojego biznesu?

        Wybierając platformę do tworzenia voicebotów należy zastanowić się nad tym, która z nich pozwoli nam zbudować wydajne rozwiązanie, analizować jego wyniki i przeprowadzać automatyczne testy, by z czasem zwiększać jego efektywność. Oto jak SentiOne Automate może pomóc designerom botów w udoskonaleniu voicebotów AI:

        Prosty interfejs budowy: Możliwość stworzenia voicebota łatwego do zbudowania i wdrożenia to wymóg konieczny dla tych, którzy nie mają dedykowanego zespołu programistów lub wykwalifikowanych technicznie dot designerów. Dzięki SentiOne Automate z łatwością stworzysz zaawansowane dialogi i przepływy konwersacyjne za pomocą naszego low-code/no-code interfejsu typu „drag-and-drop”.

        Analityka w czasie rzeczywistym – Zyskaj głębsze zrozumienie problemów swoich klientów, analizując wydajność Twojego voicebota w czasie rzeczywistym. Oceniaj zdolność bota do udzielania trafnych odpowiedzi na zapytania klientów i rozszerzaj ich zastosowanie, by ulepszać doświadczenie klienta.

        Automatyczne testowanie botów  – SentiOne Automate ma wbudowaną funkcję testowania botów umożliwiającą skalowalne sprawdzanie ich wydajności (nie musisz ręcznie testować każdego z nich osobno). Automatycznie testuj wszystkie możliwe scenariusze rozmów za pomocą wbudowanego testera czatów lub interakcji w czasie rzeczywistym, by zagwarantować gotowość chatbota na wszystkie okoliczności. Możesz też podzielić testy na kategorie, by łatwiej śledzić wyniki.

        Stałe szkolenie i edukacja – wybierając platformę do budowania voicebotów ważne jest wsparcie w budowaniu i wdrażaniu bota. SentiOne Automate ma dobrze udokumentowane protokoły szkoleniowe pozwalające zrozumieć niuanse tworzenia chatbotów.

        SentiOne Automate: Platforma stworzona dla designerów botów

        Wraz z rosnącym zapotrzebowaniem na designerów botów rozwijać się będzie też popyt na wydajną platformę służącą projektowaniu i wdrażaniu voiecbotów od A do Z. SentiOne Automate pomaga designerom maksymalnie upłynnić ten proces. Jeśli chcesz dowiedzieć się więcej o najlepszych praktykach w tworzeniu voicebotów i jak je wdrażać, pobierz nasz ebook. Jeśli masz pytania, umów się na rozmowę z naszymi ekspertami.

        Przydatne definicje

        IVR –  Interactive Voice Response (IVR) to system wykorzystujący rozpoznawanie głosu i wybrane klawisze na klawiaturze, by przeprowadzać dzwoniących przez system telefoniczny przed przekazaniem połączenia do konsultanta.

        Przekierowywanie połączeń – przekierowywanie połączeń wykorzystuje AI i rozpoznawanie głosu, by interpretować mówione polecenia i automatycznie kierować dzwoniących do odpowiedniego departamentu lub zasobu.

        Chatboty a voiceboty – voicebot to chatbot dodatkowo wyposażony w głos. Chatbot to rodzaj oprogramowania komunikujący się przez „interfejs konwersacyjny”. Zazwyczaj wykorzystywane są w firmach w roli wirtualnego reprezentanta obsługi klienta, który odciąża innych pracowników poprzez udzielanie odpowiedzi na najczęściej zadawane pytania.

        Projektowanie botów (projektowanie konwersacyjne) – proces projektowania chatbota (tworzenie bota), który mówi jak prawdziwa osoba i z którym użytkownik może prowadzić rozmowę przypominającą interakcje międzyludzkie. Boty AI zaprojektowane są w spersonalizowany sposób i mogą przy tym udzielać wysoce trafnych odpowiedzi dzięki możliwości zintegrowania ich z zewnętrznymi API, w tym systemami CRM, narzędziami wewnętrznymi i bazami danych. Projektowanie botów bierze także pod uwagę markę, dla której powstaje bot i gwarantuje spójność tonu i przekazu we wszystkich komunikatach.

        Budowanie botów (programowanie botów) – proces budowania bota przez designerów, rozłożony na poszczególne etapy i elementy, (rozumienie języka naturalnego, przetwarzanie, dane wejściowe i wyjściowe) rozmowy, zależności między nimi oraz to, jak designerzy łączą boty z zewnętrznymi danymi, w tym interfejsami API, CRM i bazami danych w celu gromadzenia informacji.

        NLU i NLP – NLU, czyli rozumienie języka naturalnego, skupia się na ludzkich czynnikach w komunikacji, w tym przekazywanego w niej zamiaru. Z kolei NLP, czyli przetwarzanie języka naturalnego, skupia się na analizie dużych zbiorów danych i przetwarzaniu tekstu w jego dosłownej formie.

        LLM – Duży model językowy (large language model, LLM) to rodzaj algorytmu sztucznej inteligencji, który wykorzystuje techniki uczenia głębokiego i ogromnych zbiorów danych do rozumienia, podsumowywania, tworzenia i przewidywania nowych treści.

        SSML – Speech Synthesis Markup Language to rodzaj kodu pomagający komputerom odczytywać tekst na głos w sposób zbliżony do naturalnej ludzkiej mowy.


        Podsumowanie artykułu

        Artykuł ten omawia podstawowe informacje na temat voicebotów i opisuję ich rolę w automatyzacji call center jako zamiennik systemów Interactive Voice Response (IVR). Voice boty to chatboty wykorzystujące głos, które w oparciu o sztuczną inteligencję rozumieją polecenia głosowe i odpowiadają na nie. Znajdują zastosowanie w call center, aplikacjach mobilnych i komunikatorach. Korzystanie z voicebotów AI wiąże się z korzyściami, takimi jak spersonalizowane i trafne odpowiedzi oraz usprawniona obsługa klienta. Artykuł omawia również wyzwania związane z budowaniem voicebotów, przyszłe trendy oraz wskazówki dotyczące wyboru platformy do budowania voicebotów dla Twojej firmy.