Trendy w sieci

Przetwarzanie języka naturalnego (NLP) – z czym to się je i jak użyć w biznesie?

Pamiętacie może pierwszy moment Williama w Westworld? Kiedy wybierał sobie przebranie, aby wejść do futurystycznego świata rozrywki, pomagała mu Angela – android witający gości. William zapytał ją wprost czy jest prawdziwa, na co udzieliła mu dość enigmatycznej odpowiedzi: “Skoro nie widzisz różnicy, jakie to ma znaczenie?”

I okazuje się, że to – filozoficzne bądź co bądź – pytanie wychodzi daleko poza ramy srebrnego ekranu. Naukowcy borykają się z nim bowiem już od około ośmiu dekad (jeśli nie liczyć Kartezjańskich rozważań o automatach, mających miejsce już w XVII wieku). Czy androidy śnią o elektrycznych owcach? Inaczej mówiąc: czy maszyny potrafią samodzielnie myśleć? A jeśli tak, to co je różni od nas – ludzi? Czy powinniśmy się bać, że któregoś dnia nas pokonają i zdobędą władzę nad światem? Tworząc najróżniejsze scenariusze science fiction w szeroko pojętej sztuce, literaturze i filmie, staramy się jakoś oswoić z myślą, że któregoś dnia być może będziemy żyli pośród elektronicznych ludzi. Niektóre z post-apokaliptycznych dystopii weszły już przecież na stałe do kanonu współczesnej popkultury. Weźmy na przykład Matrix, Łowcę androidów czy Terminatora.

Przetwarzanie języka przez ludzki mózg vs komputer

Prawdopodobnie to niepowtarzalny sposób, w jaki umysł ludzki przyswaja i przetwarza język, leży u podstaw całej koncepcji o myślących maszynach. Nasza skomplikowana komunikacja jest atrybutem mocno wyróżniającym nas spośród innych gatunków. A zatem, zanim Alan Turing zmienił sposób ujmowania tematu, pytanie “czy maszyny myślą?” dość długo trzymało w szachu matematyków i filozofów. W końcu, w 1950 roku Turing opracował test bazujący na jego pracy The imitation game, który – w wielkim skrócie – polega na tym, że sprawdza się, czy program komputerowy jest na tyle sprytny, żeby nabrać prawdziwego człowieka. Test ten stał się fundamentem dla sztucznej inteligencji. A dziś jest to być może najszybciej rozwijająca się dziedzina informatyki. Serio, to wszystko dzieje się naprawdę.

Stworzyliśmy maszyny, które potrafią naśladować ludzki sposób uczenia się i akwizycji języka, a następnie operują na przyswojonych danych. Pochłaniają i analizują ogromne ilości danych, żeby mieć możliwość oszacowania najbardziej prawdopodobnej odpowiedzi na zadany problem. Na szczęście, mimo że komputery są są dużo szybsze i bardziej niezawodne, to wciąż ludzie tym wszystkim sterują.

 Co można zrobić za pomocą systemów przetwarzania języka naturalnego?

Możemy zaobserwować, jak sztuczną inteligencję i jej pochodne wprowadza się w życie w naprawdę wielu różnych dziedzinach. Istnieją systemy, które rozpoznają i klasyfikują semantyczne i składniowe struktury języka naturalnego. A te, jak wiemy, zazwyczaj są inne niż w stylu oficjalnym, co sprawia, że za pomocą logicznych metod dużo trudniej jest rozpracować mowę potoczną.

Dzięki technikom przetwarzania języka naturalnego mamy możliwość oddzielenia ziarna od SPAMu. Przetrząsania niezliczonych tekstów w poszukiwaniu wspólnych tematów. Rozpoznawania autora tekstu na podstawie jego stylu, co jest niezwykle pomocne w śledzeniu plagiatów. To nie wszystko. Na przykład pewna grupa naukowców opracowała system, który skanuje teksty ogłoszeń i jest w stanie wskazać te, które zawierają nielegalne treści dotyczące handlu ludźmi. Co więcej, system ten został użyty i dopracowany przez biuro prokuratury okręgowej Nowego Jorku podczas hakatonu zatytułowanego Koniec z Handlem Ludźmi [tłum. własne]. A zatem, tak, myślące maszyny pomagają nam też w dobrych uczynkach.

Jak korzysta się z NLP w biznesie?

Ponadto są na świecie ludzie, którzy potrafią zastosować tego typu innowacyjne systemy do tworzenia kolejnych świetnie prosperujących przedsiębiorstw. Jak to? No cóż. Branża dawno wyszła poza potrzeby konsumentów opierające się na wirtualnych asystentach bazujących na rozpoznawaniu mowy typu Siri. Czy też towarzyskich chatbotach konstruowanych wyłącznie “w celach rozrywkowych” – jak to określili twórcy Zo i Tay z Microsoftu. Jak jeszcze rekiny biznesu wykorzystują mariaż językoznawstwa i technologii? Oto subiektywny przegląd marek opartych na systemach NLP, które wydają się niezmiernie ciekawe.

  • Czy wiedzieliście na przykład, że Watson z IBM jest maszynerią stojącą za Dinozaurkiem CogniToys? To taka sprytna dziecięca zabawka działająca na wi-fi, która potrafi odpowiadać na pytania, opowiadać historyjki i dowcipy. A co więcej, z każdym użyciem robi się mądrzejsza – tak jak dziecko, które się nią bawi. Sprytne, prawda?
  • Pośród narzędzi oferowanych przez facebookowego Messengera można znaleźć wit.ai – silnik dla botów, który można śmiało wykorzystać przy tworzeniu własnych wirtualnych ambasadorów wewnątrz aplikacji.
  • Twiggle to wsparcie dla wyszukiwarek w sklepach internetowych promowany przez Alibaba i Yahoo! Japan. Mówi się, że potrafi pomóc ludziom znaleźć potrzebne produkty praktycznie tak samo jak ekspedient sklepowy, ponieważ potrafi zrozumieć język, którym klienci posługują się naturalnie.
  • Skoro już mowa o wyszukiwarkach, to warto wspomnieć też pewną samouczącą się, która specjalizuje się w znajdowaniu opracowań naukowych. Wraz z kolejnymi wyszukaniami wychwytuje ona nowe przydatne frazy kluczowe. Kiedy więc następnym razem będziecie pisali pracę naukową, może przyda się Semantic Scholar.
  • Jeśli natomiast szukacie bardzo produktywnego, ale może nieco milkliwego i bezwolnego content writera, który z pewnością nie będzie się z nikim spierał i nie będzie podkradał kubków, to zastanówcie się nad WordSmithem. Jest to program oparty na sztucznej inteligencji, który tylko w 2016 roku wyprodukował półtora miliarda tekstów!
  • Kto natomiast potrzebuje dynamicznego tłumacza, mądrzejszego niż auto-tłumaczenia z maili ze SPAMem, opartego na kombinacji technologii z elementem ludzkim, może zainteresować się firmą Unbabel.
  • Jest spora szansa, że używacie (albo kiedyś używaliście) SwiftKey – aplikacji, która przewiduje i podpowiada najczęściej używane słowa w trakcie pisania. Jeszcze dwa lata temu marka została zaliczona do nieźle rokujących startupów. Dziś działa na 150+ językach i ma 250 milionów użytkowników.
  • W SentiOne natomiast używamy przetwarzania języka naturalnego do estymacji wydźwięku wypowiedzi internetowych i niektórych informacji na temat ich autorów. Ale nie poprzestajemy na tym! Lubimy o sobie myśleć jako o naprawdę ciekawskich odkrywcach, więc chyba nigdy nie przestaniemy się rozwijać. Dlatego właśnie wysłaliśmy w kwietniu bieżącego roku silną reprezentację naszych najpiękniejszych umysłów na międzynarodową konferencję naukową World Wide Web do Perth w Australii. Dla tych, którzy nie wiedzą: jest to jedna z najbardziej prestiżowych konferencji naukowych na świecie. Zaciekawić może fakt, że między innymi Larry Page i Sergey Brin prezentowali swój algorytm PageRank na WWW w 1998. Chwilę przed tym, jak założyli taką jedną firmę, którą nazwali Google. Nic więc dziwnego, że nasz zespół dowiedział się tam co niemiara i wrócił z głowami pełnymi pomysłów na rozwijanie naszej platformy. Wkrótce się przekonacie!

Na zdjęciu dumnie prezentują się: Michał Brzezicki – CTO w SentiOne, Tomek Krupa – Head of Research w SentiOne oraz Yoelle Maarek – VP of Research w Yahoo! i Andrei Broder – web search guru z Google

Sztuczna inteligencja, NLP, uczenie maszynowe – to ostatnio w świecie technologii słowa wytrychy. Nic dziwnego, bo to naprawdę popularne trendy w innowacjach. Każdego dnia wykluwa się mnóstwo startupów opartych na super inteligentnych systemach. Zamierzają sprawić, że “świat będzie lepszy”. I faktycznie niektóre z nich stają się milionowymi biznesami dosłownie w mgnieniu oka. Czy trzeba się bać tego galopującego postępu? Chyba nie. Dopóki jako ludzkość pamiętamy, że technologia to narzędzie jak każde inne (choć może nieco bardziej skomplikowane), a to do nas należy, w jaki sposób będziemy go używać.