Ograniczenia i możliwości ChatGPT — okiem eksperta
Ostatnimi czasy branżą AI zawładnął model ChatGPT — najnowszy produkt firmy OpenAI. Dyskusje na jego temat dominowały w przestrzeni zarówno inżynierów pracujących nad sztuczną inteligencją, jak i w świecie biznesu. Jakie są możliwości ChatGPT — i jakie cechują go ograniczenia? O komentarz poprosiliśmy Bartosza Bazińskiego, założyciela SentiOne oraz programistę specjalizującego się w modelach językowych.
Korzyści i możliwości ChatGPT
Największą zaletą modelu ChatGPT jest to, że jest zbudowany na kolosalnej, gigantycznej wręcz ilości danych. I właśnie to stoi za jego sukcesem oraz powoduje, że odpowiedzi bota są takie zgrabne. ChatGPT buduje zdania złożone i pięknie opisuje abstrakcyjne pojęcia — wszystko dzięki bardzo dużej ilości danych wejściowych.
Dodatkowo, model ma bardzo fajnie wymyślony sposób optymalizacji, w którym model językowy trenowany jest na ogromnych danych z wielką liczbą parametrów (kontekst dla każdego słowa ma 2048 wyrazów). Do tego kluczowym elementem procesu jest oddzielny model do scoringu odpowiedzi (z wieloma punktami odniesienia). Dzięki temu ChatGPT udało się zoptymalizować pod kątem zwracania odpowiedzi robiących duże wrażenie na ludziach.
ChatGPT — ograniczenia kluczowe dla biznesu
Generyczne modele, takie jak ChatGPT, mają swoje wady. Ten rodzaj chatbotów nazywamy czarną skrzynką. Są w stanie wygenerować piękne odpowiedzi, ale zupełnie nie rozumie o co był zapytany. Nie orientuje się w rzeczywistości, nie osadza informacji kontekście. Przykładowo, gdy po półfinałach Mistrzostw Świata internauci pytali ChatGPT “Jaki będzie wynik meczu Chorwacja-Argentyna?”, bot odpowiadał: “nie znam wyników hipotetycznego meczu.” Nie jest to już tak zadowalająca odpowiedź — mógłby chociaż zażartować, że zawsze wygrywa najlepszy!
Innym problemem związanym z ChatGPT jest to, że został on zbudowany na nieobrobionych danych. W rezultacie, może on wprowadzać w błąd — dostarczając długich i miłych odpowiedzi, ale z fałszywymi informacjami. W efekcie rozmowa z tym modelem wydaje się prawdziwa; ale gdy zagłębisz się w jego odpowiedzi, mogą okazać się mylące, nieprecyzyjne, niezgodne z faktami, a nawet rozpowszechniać fałszywe wiadomości.
Ponieważ modele tak naprawdę nie rozumieją znaczenia swoich odpowiedzi, mogą łatwo podać błędne informacje. Z takiej pozycji niedaleko do szerzenia dezinformacji — ubranej w piękną składnię i gramatykę. Takich przypadków w świecie botów było już sporo. Na przykład bot Tay zbudowany przez Microsoft na danych z Twittera bardzo szybko zaczął rozpowszechniać rasistowskie treści.
Ostatnia wadą ChatGPT jest koszt wytworzenia takiej technologii. OpenAI nie chwali się nigdzie, ile trwało trenowanie tak wielkiego modelu, ani ile zasobów sprzętowych pochłania jego wytrenowanie i generowanie odpowiedzi. Z doświadczenia wiemy, że są to kolosalne ilości serwerów i mocy obliczeniowej — jest to niestety barierą do wdrożeń komercyjnych. Już poprzedni model GPT-3 z 2020 roku od OpenAI był „extremely expensive”. Możemy się zatem domyślać, że ChatGPT jest jeszcze droższy…
Czego potrzebuje od AI biznes?
W rezultacie, ChatGPT może być fajną nowinką dla indywidualnych użytkowników. Może być także dużą pomocą dla twórców treści, marketingowców, bo z łatwością wygeneruje tekst w dowolnej stylistyce (np. pijanego angielskiego żeglarza). Niestety, ponieważ jego odpowiedzi mogą wprowadzać w błąd lub udzielać nieprawdziwych informacji — bardzo ciężko nam sobie wyobrazić w jaki sposób miałby znaleźć zastosowanie w biznesie.
Aktualnie konwersacyjna sztuczna inteligencja, taka jak ChatGPT, jest używana przede wszystkim w automatyzacji obsługi klientów. W tym kontekście kluczowe jest przechodzenie określonego wieloetapowego procesu który rozwiązuje problem klienta. Taki proces musi być ściśle zdefiniowany przez daną firmę.
Z takich technologii korzystają banki, placówki medyczne, ubezpieczyciele. Niezbędne dla takiego zastosowania jest aby bot trzymał się ustalonego schematu, nie udzielał więcej informacji niż jest pytany, aby ze stuprocentową pewnością rozumiał pytanie i był w stanie je przypisać do odpowiedniej frazy, intencji lub ścieżki dialogowej.
Dla wszystkich dużych firm kluczowym elementem wdrożenia chatbota jest pełna kontrola nad przebiegiem procesu i komunikatami bota. Jest on przecież przedłużeniem wizerunku marki, musi być zaufany i nie tworzyć dodatkowego ryzyka dla firmy.
Jak przystosować modele AI do biznesu?
To, czego brakuje ChatGPT, to dokładna wiedza dziedzinowa. Boty stają się użyteczne dla biznesu dopiero po przeszkoleniu z wykorzystaniem zbiorów danych z określonej branży. Tego w końcu potrzebują firmy — modeli opartych o wiedzę ekspercką i dane treningowe precyzyjnie dostosowane do potrzeb.
Co więcej, wdrożenia biznesowe modeli AI muszą odzwierciedlać głos ich marki, być godnym zaufania rozszerzeniem ich marki. Bez takich danych, ChatGPT będzie tylko nowinką technologiczną, ale bez szansy na skomercjalizowanie na dużą skalę.
SentiOne pracuje obecnie nad podobnym modelem, ale opartym na danych domenowych z naszych kluczowych branż – bankowości, ubezpieczeń, finansów. Nasze zbiory danych budujemy na podstawie monitoringu internetu – analizując miliony opinii i rozmów online – które następnie czyścimy i anotujemy, by był dobrym materiałem treningowym dla bota.
Dodatkowo, do naszego silnika rozumienia języka naturalnego dodajemy też dane od naszych klientów: historyczne zapisy rozmów z call center, scenariusze rozmów biura obsługi klienta, etc. Dzięki temu możemy jeszcze lepiej dotrzeć do faktycznej intencji użytkowników. Co więcej, takie podejście pozwala nam szybciej budować i testować boty (ponieważ wymagana jest mniejsza liczba fraz do nauki).
Patrząc na zasoby SentiOne — zbiory danych i zespół — jestem przekonany, że nikt nie zbuduje lepszego modelu dla języka polskiego niż my. Oczywiste jest, że modele na dużą skalę (takie jak GPT) pozwalają poprawić dokładność rozpoznawania intencji, a to popchnie całą branżę do przodu.