Centrum wiedzy

Menu

Projekt POIR.01.01.01-00-0806/16 pn. SentiCognitiveServices – nowa generacja usług do automatyzacji marketingu i obsługi sieci społecznościowych oparta o metody sztucznej inteligencji

Opis projektu wspartego środkami unijnymi:

Oprogramowanie do analizy mediów społecznościowych i powiązane usługi to rynek, który według prognoz wzrośnie globalnie z 1,6 mld USD w 2015 roku do 5,4 mld USD w roku 2020. Aktualnie dostępne rozwiązania monitoringu internetu dostarczają firmom tylko prostych analiz wypowiedzi internautów np. opartych o zliczanie słów lub analizę wydźwięku emocjonalnego z zastosowaniem słowników i algorytmów opartych na technikach sztucznej inteligencji. W konsekwencji uzyskanie odpowiedzi na pytanie "Co internauci sądzą o naszych produktach?" zadawane przez działy marketingu, obsługi klienta i zarządzania produktami, wymaga manualnej analizy wypowiedzi przez analityków w celu przygotowywania dedykowanych raportów opisowych. Skala danych to miliony wypowiedzi każdego dnia. Podsumowanie, o czym w istocie dyskutowali internauci w kontekście danego produktu, wymaga ogromnej ilości pracy ludzi.

Przedmiotem projektu jest opracowanie technologii umożliwiających pełną automatyzację wytwarzania takich raportów. W tym celu:

  1. Zostaną przeprowadzone badania przemysłowe w zakresie przetwarzania języka naturalnego dostosowanego do analizy tekstów potocznych.
  2. Opracowana zostanie warstwa ekstrakcji danych z opinii internautów za pomocą metod opartych o uczenie maszynowe i podejście symboliczne.
  3. Wytworzona zostanie warstwa wnioskowania bazująca na różnych modelach ekstrakcji informacji, takich jak aspekty, obiekty, wartościowe cytaty, porównania produktowe.

Następnie w ramach prac rozwojowych zostaną wytworzone moduły aplikacyjne służące do monitorowania stron generowanych dynamicznie, automatycznego tworzenia raportów i ostrzegania o sytuacjach kryzysowych.

Efekty działań w ramach projektu zostaną wykorzystane poprzez wprowadzenie nowych produktów oraz wdrożone w obecnym produkcie SentiOne. W rezultacie twórcy narzędzia będą mogli zaoferować unikatowy na skalę światową produkt, na który zapotrzebowanie zostało potwierdzone badaniami rynku opartymi o listy intencyjne potencjalnych klientów.

Wydatki kwalifikowane (wartość projektu): 11 699 568,70 zł
Kwota dofinansowania: 8 682 464,57 zł

- numer wniosku o dofinansowanie: POIR.01.01.01-00-0806/16
- okres realizacji projektu: 07/2017 - 06/2020
- działanie: 1.1 Projekty B+R Przedsiębiorstw
- poddziałanie: 1.1.1 Badanie przemysłowe i prace rozwojowe realizowane przez przedsiębiorstwa

PROMOCJA PROJEKTU
W ramach promocji projektu, SentiOne informuje o współpracy i postępach za pośrednictwem publikacji prasowych oraz podczas wydarzeń i prelekcji.

W 2017 i 2018 roku uczestniczyliśmy w kilku międzynarodowych konferencjach podczas których zarówno w wystąpieniach, strefach targowych jak i kuluarach wspominaliśmy o postępach prac projektowych i możliwościach jakie otworzyły się przed SentiOne za sprawą współpracy z NCBiR.

KONFERENCJE I WYSTĄPIENIA

WARSZTATY NA UNIWERSYTECIE GDAŃSKIM, kwiecień 2019.

25 kwietnia 2019 na Uniwersytecie Gdańskim na zaproszenie dr Joanny Redzimskiej, Jakub Klimek - inżynier w dziale badawczo-rozwojowym SentiOne, przeprowadził warsztaty z teorii analizy wydźwięku wypowiedzi dla studentów filologii angielskiej, ze specjalności przetwarzanie języka naturalnego.

Na zajęciach poruszono tematy takie jak analizy tekstowe, zdaniowe i frazowe czy też pojęcie polarności. Studenci zapoznali się z dwoma narzędziami służącymi do tagowania tekstów - BRAT i Inforex oraz podjęli się analizy przykładowych wypowiedzi i mierzenia zgodności annotatorskiej. Ćwiczenia były wstępem do dyskusji o tym, jak ważne są ustalone wytyczne między annotującymi oraz dokładne instrukcje tworzenia oznaczeń, co pozwoliło również uzyskać wyższą zgodność przy kolejnych ćwiczeniach z oznaczania tekstów.

Warsztaty wzbudziły dużą ciekawość wśród uczestników, którzy wyrazili zainteresowanie stażem w ramach projektu SentiCognitiveServices oraz innymi tematami związanymi z przetwarzaniem języka naturalnego.

W projekcie SentiCognitiveServices wykorzystywane są narzędzia sieci CLARIN, w szczególności używany do tagowania zbiorów Inforex, co wpływa na rozwój tego narzędzia.

Wkrótce ukaże się dłuższa publikacja Michała Marcińczuka, autora Inforexa, przybliżająca wprowadzone do narzędzia nowe funkcje, na przykład tagowanie morfo-składniowe, wykorzystywane przez SentiCognitiveServices przy tagowaniu korpusu UGC (user-generated content).

BIG DATA CONGRESS Warszawa, 2018

W kwietniu, jeden z założycieli SentiOne - Bartosz Baziński, podczas Big Data Congress (wydarzenie odbywało się w Warszawie w dniach 18-19.04.2018), opowiadał o tym, jak z pomocą Sztucznej Inteligencji zautomatyzować obsługę klienta w kanałach tekstowych. Dwa dni merytorycznych i angażujących paneli przyciągnęły ponad 620 uczestników, którzy usłyszeli o realizowanym przez nas projekcie.(http://bigdatacee.pl/prelegenci/)

INFOSHARE Gdańsk, 2018.

InfoShare (22-23.05.2018) to największa konferencja technologiczna w Europie Środkowo-Wschodniej. W tym roku w imprezie wzięło udział ponad 6000 uczestników. SentiOne zostało partnerem wydarzenia. Podczas konferencji InfoShare 2018, dwóch przedstawicieli SentiOne przygotowało prelekcje na temat:

1. Customer Service is the New Marketing

2. AI, NLP & Machine Learning, czyli technologiczne esperanto XXI w.

Oba wystąpienia dotyczyły realizowanego projektu. Ponadto w ramach promocji projektu, podczas wydarzenia w strefie targowej, reprezentanci SentiOne opowiadali o współpracy w ramach projektu.

AI4U Monachium, 2018

Ponadto w ramach prac promocyjnych reprezentant spółki - Michał Brzezicki prowadził prelekcję podczas konferencji AI4U w Monachium 26 - 27 czerwca 2018.

(https://www.ai4u-konferenz.de/). Wystąpienie pod tytułem “Usage of Artificial Intelligence for Improving Customer Support and Brand Recognition” odbywało się w języku angielskim. W swoim wystąpieniu mówił o efektach prac nad projektem.

beIT Gdańsk, 2019

21 kwietnia 2019 roku Olga Springer, Head of Product SentiOne, poprowadziła warsztat pt. “Co Product Manager powinien wiedzieć o AI?” na Konferencji Inżynierii Oprogramowania „beIT”, która odbyła się na Politechnice Gdańskiej.

Podczas wystąpienia poprzedzającego warsztat, uczestnicy dowiedzieli się o szerokich zastosowaniach sztucznej inteligencji m.in. w przetwarzaniu opinii internetowych, analizie wydźwięku i automatycznym udzielaniu odpowiedzi na pytania. Olga podzieliła się także doświadczeniem i wnioskami dotyczącymi praktycznych aspektów pracy zespołów badawczo-rozwojowych w startupach.

Ćwiczenie warsztatowe dotyczyło wyliczenia wartości biznesowej dla klienta, wynikającej z wdrożenia nowoczesnej technologii NLP. Warsztat popularyzował też współpracę firm z uczelniami naukowymi oraz prowadzenie projektów grantowych w małych i średnich przedsiębiorstwach.

PUBLIKACJE

O projekcie Senti Cognitive Services w pomorskich mediach

Na stronie www.livemorepomerania.com ukazał się komentarz Olgi Springer, kierownika działu produktu SentiOne, wyjaśniający, jak prace badawcze i rozwojowe, prowadzone w ramach grantu Senti Cognitive Services wpisują się w całościowy system narzędzi SentiOne, opartych na metodach sztucznej inteligencji. Polecamy lekturę :)

SentiCognitiveServices w magazynie Grow with Tech

W najnowszej edycji magazynu Grow With Tech SentiOne pojawia się w przeglądzie trójmiejskich firm pracujących nad AI. W artykule poruszono temat tworzonych w ramach projektu SentiCognitiveServices zaawansowanych silników NLU, przy których wykorzystywane jest przetwarzanie języka naturalnego oraz uczenie maszynowe. 

Wydanie Grow With Tech dostępne jest tutaj.

Rzeczpospolita 17.10.2017

Wyniki prac z pierwszego etapu projektu już dostępne w repozytorium CLARIN.EU

W pierwszym etapie projektu z wykorzystaniem wiedzy zespołu lingwistów opracowano korpus tekstów potocznych języka polskiego - największy w Polsce korpus tekstów potocznych, oznaczonych parametrami morfo-syntaktycznymi, zgodnie z adnotacją Narodowego Korpusu Języka Polskiego.   

Zadanie lingwistyczne zrealizowano na podstawie szczegółowych wytycznych opracowanych przez zespół lingwistów z Politechniki Wrocławskiej.

Na korpus składa się 7561 dokumentów (około 400 000 segmentów) pochodzących z różnych źródeł i jest on dostępny na otwartej licencji Creative Common w bazie sieci CLARIN pod adresem: https://clarin-pl.eu

Teksty są autentyczne i odznaczają się cechami charakterystycznymi dla tekstów tworzonych przez użytkowników Internetu, w tym specyficzną pisownią czy błędami językowymi, które poddano procesowi specjalistycznej normalizacji przeprowadzonej przez zespół lingwistów, w tym weryfikacji poprawności podziału na segmenty.

Na bazie tego korpusu wytrenowany został tagger SentiOne do znakowania morfo-składniowego tekstów potocznych. Z jego pomocą można przeanalizować teksty internetowe pod kątem części mowy. Jest to ważne narzędzie NLP, pomocne w budowie systemów ekstrakcji informacji i jednocześnie pierwszy tego typu moduł dla języka polskiego, dostosowany do analizy mowy potocznej.

Również tagger został udostępniony w tym samym repozytorium CLARIN.eu na otwartej licencji.  


Projekt jest współfinansowany ze środków Europejskiego Funduszu Rozwoju Regionalnego