Centrum wiedzy

Menu

Projekt POIR.01.01.01-00-0806/16 pn. SentiCognitiveServices – nowa generacja usług do automatyzacji marketingu i obsługi sieci społecznościowych oparta o metody sztucznej inteligencji

Opis projektu wspartego środkami unijnymi:

Oprogramowanie do analizy mediów społecznościowych i powiązane usługi to rynek, który według prognoz wzrośnie globalnie z 1,6 mld USD w 2015 roku do 5,4 mld USD w roku 2020. Aktualnie dostępne rozwiązania monitoringu internetu dostarczają firmom tylko prostych analiz wypowiedzi internautów np. opartych o zliczanie słów lub analizę wydźwięku emocjonalnego z zastosowaniem słowników i algorytmów opartych na technikach sztucznej inteligencji. W konsekwencji uzyskanie odpowiedzi na pytanie "Co internauci sądzą o naszych produktach?" zadawane przez działy marketingu, obsługi klienta i zarządzania produktami, wymaga manualnej analizy wypowiedzi przez analityków w celu przygotowywania dedykowanych raportów opisowych. Skala danych to miliony wypowiedzi każdego dnia. Podsumowanie, o czym w istocie dyskutowali internauci w kontekście danego produktu, wymaga ogromnej ilości pracy ludzi.

Przedmiotem projektu jest opracowanie technologii umożliwiających pełną automatyzację wytwarzania takich raportów. W tym celu:

  1. Zostaną przeprowadzone badania przemysłowe w zakresie przetwarzania języka naturalnego dostosowanego do analizy tekstów potocznych.
  2. Opracowana zostanie warstwa ekstrakcji danych z opinii internautów za pomocą metod opartych o uczenie maszynowe i podejście symboliczne.
  3. Wytworzona zostanie warstwa wnioskowania bazująca na różnych modelach ekstrakcji informacji, takich jak aspekty, obiekty, wartościowe cytaty, porównania produktowe.

Następnie w ramach prac rozwojowych zostaną wytworzone moduły aplikacyjne służące do monitorowania stron generowanych dynamicznie, automatycznego tworzenia raportów i ostrzegania o sytuacjach kryzysowych.

Efekty działań w ramach projektu zostaną wykorzystane poprzez wprowadzenie nowych produktów oraz wdrożone w obecnym produkcie SentiOne. W rezultacie twórcy narzędzia będą mogli zaoferować unikatowy na skalę światową produkt, na który zapotrzebowanie zostało potwierdzone badaniami rynku opartymi o listy intencyjne potencjalnych klientów.

Wydatki kwalifikowane (wartość projektu): 11 699 568,70 zł
Kwota dofinansowania: 8 682 464,57 zł

- numer wniosku o dofinansowanie: POIR.01.01.01-00-0806/16
- okres realizacji projektu: 07/2017 - 06/2020
- działanie: 1.1 Projekty B+R Przedsiębiorstw
- poddziałanie: 1.1.1 Badanie przemysłowe i prace rozwojowe realizowane przez przedsiębiorstwa

PROMOCJA PROJEKTU
W ramach promocji projektu, SentiOne informuje o współpracy i postępach za pośrednictwem publikacji prasowych oraz podczas wydarzeń i prelekcji.

W 2017 i 2018 roku uczestniczyliśmy w kilku międzynarodowych konferencjach podczas których zarówno w wystąpieniach, strefach targowych jak i kuluarach wspominaliśmy o postępach prac projektowych i możliwościach jakie otworzyły się przed SentiOne za sprawą współpracy z NCBiR.

KONFERENCJE

BIG DATA CONGRESS Warszawa, 2018

W kwietniu, jeden z założycieli SentiOne - Bartosz Baziński, podczas Big Data Congress (wydarzenie odbywało się w Warszawie w dniach 18-19.04.2018), opowiadał o tym, jak z pomocą Sztucznej Inteligencji zautomatyzować obsługę klienta w kanałach tekstowych. Dwa dni merytorycznych i angażujących paneli przyciągnęły ponad 620 uczestników, którzy usłyszeli o realizowanym przez nas projekcie.(http://bigdatacee.pl/prelegenci/)

INFOSHARE Gdańsk, 2018.

InfoShare (22-23.05.2018) to największa konferencja technologiczna w Europie Środkowo-Wschodniej. W tym roku w imprezie wzięło udział ponad 6000 uczestników. SentiOne zostało partnerem wydarzenia. Podczas konferencji InfoShare 2018, dwóch przedstawicieli SentiOne przygotowało prelekcje na temat:

1. Customer Service is the New Marketing

2. AI, NLP & Machine Learning, czyli technologiczne esperanto XXI w.

Oba wystąpienia dotyczyły realizowanego projektu. Ponadto w ramach promocji projektu, podczas wydarzenia w strefie targowej, reprezentanci SentiOne opowiadali o współpracy w ramach projektu.

AI4U Monachium, 2018

Ponadto w ramach prac promocyjnych reprezentant spółki - Michał Brzezicki prowadził prelekcję podczas konferencji AI4U w Monachium 26 - 27 czerwca 2018.

(https://www.ai4u-konferenz.de/). Wystąpienie pod tytułem “Usage of Artificial Intelligence for Improving Customer Support and Brand Recognition” odbywało się w języku angielskim. W swoim wystąpieniu mówił o efektach prac nad projektem.

beIT Gdańsk, 2019

21 kwietnia 2019 roku Olga Springer, Head of Product SentiOne, poprowadziła warsztat pt. “Co Product Manager powinien wiedzieć o AI?” na Konferencji Inżynierii Oprogramowania „beIT”, która odbyła się na Politechnice Gdańskiej.

Podczas wystąpienia poprzedzającego warsztat, uczestnicy dowiedzieli się o szerokich zastosowaniach sztucznej inteligencji m.in. w przetwarzaniu opinii internetowych, analizie wydźwięku i automatycznym udzielaniu odpowiedzi na pytania. Olga podzieliła się także doświadczeniem i wnioskami dotyczącymi praktycznych aspektów pracy zespołów badawczo-rozwojowych w startupach.

Ćwiczenie warsztatowe dotyczyło wyliczenia wartości biznesowej dla klienta, wynikającej z wdrożenia nowoczesnej technologii NLP. Warsztat popularyzował też współpracę firm z uczelniami naukowymi oraz prowadzenie projektów grantowych w małych i średnich przedsiębiorstwach.

PUBLIKACJE

Rzeczpospolita 17.10.2017

Wyniki prac z pierwszego etapu projektu już dostępne w repozytorium CLARIN.EU

W pierwszym etapie projektu z wykorzystaniem wiedzy zespołu lingwistów opracowano korpus tekstów potocznych języka polskiego - największy w Polsce korpus tekstów potocznych, oznaczonych parametrami morfo-syntaktycznymi, zgodnie z adnotacją Narodowego Korpusu Języka Polskiego.   

Zadanie lingwistyczne zrealizowano na podstawie szczegółowych wytycznych opracowanych przez zespół lingwistów z Politechniki Wrocławskiej.

Na korpus składa się 7561 dokumentów (około 400 000 segmentów) pochodzących z różnych źródeł i jest on dostępny na otwartej licencji Creative Common w bazie sieci CLARIN pod adresem: https://clarin-pl.eu

Teksty są autentyczne i odznaczają się cechami charakterystycznymi dla tekstów tworzonych przez użytkowników Internetu, w tym specyficzną pisownią czy błędami językowymi, które poddano procesowi specjalistycznej normalizacji przeprowadzonej przez zespół lingwistów, w tym weryfikacji poprawności podziału na segmenty.

Na bazie tego korpusu wytrenowany został tagger SentiOne do znakowania morfo-składniowego tekstów potocznych. Z jego pomocą można przeanalizować teksty internetowe pod kątem części mowy. Jest to ważne narzędzie NLP, pomocne w budowie systemów ekstrakcji informacji i jednocześnie pierwszy tego typu moduł dla języka polskiego, dostosowany do analizy mowy potocznej.

Również tagger został udostępniony w tym samym repozytorium CLARIN.eu na otwartej licencji.  


Projekt jest współfinansowany ze środków Europejskiego Funduszu Rozwoju Regionalnego