Zespół SentiOne Research

Światowej klasy programiści, lingwiści, inżynierowie NLP i big data

Wstęp

Technologia to część naszego DNA, dlatego chcemy stać się globalnym liderem w dostarczaniu i rozwoju sztucznej inteligencji na potrzeby marketingu i obsługi klienta.  Od 2017 roku SentiOne stale rozwija zespół Research & Development, którego celem jest opracowywanie autorskiej technologii   przetwarzania języka naturalnego, budowanie korpusów lingwistycznych oraz tworzenie nowych architektur sieci neuronowych. 

Nasz zespół to światowej klasy programiści, lingwiści, inżynierowie NLP oraz specjaliści big data. Budujemy technologię rozumienia języka naturalnego we współpracy z najlepszymi uniwersytetami europejskimi. Korzystając z zestawów danych pochodzących z monitoringu internetu, nasz system może osiągnąć wysoką dokładność rozpoznawania intencji i przetwarzania konwersacji z dowolnej branży. Umożliwia to tworzenie unikalnych botów konwersacyjnych (zarówno w kanałach tekstowych, jak i głosowych), które z powodzeniem automatyzują pracę działów obsługi klienta. 

W naszej pracy kładziemy nacisk nie tylko na biznesowy, ale też na naukowy aspekt opracowanych rozwiązań. Każdego roku bierzemy udział w przygotowywaniu wielu publikacji, artykułów i wystąpień na konferencjach naukowych w Polsce i na świecie. Jesteśmy także członkami konsorcjum naukowego CLARIN-PL opracowującego zasoby językowe i infrastrukturę technologiczną dla języka polskiego. 

Zespół

dr Emilia Kacprzak Research engineer, science advisor

Zajmuje się implementacją algorytmów, prowadzeniem prac badawczo rozwojowych oraz opracowywaniem nowych technologii i algorytmów oraz sporządzaniem dokumentacji oraz raportów, przeprowadzanie ewaluacji modeli, analiza aktualnego stanu wiedzy z zakresu przetwarzania języka naturalnego i uczenia maszynowego. Członkini konsorcjum Clarin.pl. Odpowiada za współpracę badawczo-naukową z polskimi i zagranicznymi uczelniami.

Jakub Klimek Manager działu research

Team leader zespołu oraz research engineer. Inżynier matematyki stosowanej (Politechnika Gdańska). Zajmuje się opracowywaniem technologii i algorytmów NLP, budowaniem aplikacji oraz nadzorem nad integracją rozwiązań NLP/AI naszego działu w platformie SentiOne Automate. Posiada ponad 9 lat doświadczenia w tworzeniu systemów NLP takich jak chatboty, systemy ekstrakcji informacji czy generatory tekstów. Współautor patentu US9152623B2 “Natural language processing system and method”. W wolnych chwilach biega i rzuca dyskiem grając w Ultimate Frisbee.

Michał Lew Head of AI

Magister matematyki (Uniwersytet Gdański, RWTH Aachen). Twórca platformy chatbotowej SentiOne Automate oraz autor silnika NLU. Twórca pierwszej w Polsce platformy NLU opartej o deep learning. Autor i współautor wiodących architektur i metod trenowania sieci neuronowych które osiągają najlepsze wyniki na świecie w rozpoznawaniu intencji użytkownika (m.in. SOTA na ATIS). Autor czołowych polskich rozwiązań w zakresie NER i analizy sentymentu. Posiada sześć lat doświadczenia w tworzeniu rozwiązań end-to-end w dziedzinie AI i NLP, uczestniczył w pionierskich wdrożeniach na terenie kraju. Twórca części badawczej wniosków grantowych składanych przez SentiOne. Autor oraz współautor publikacji naukowych z obszaru ML i NLP.
W SentiOne odpowiada za kierowanie rozwojem firmy w zakresie AI oraz opracowanie nowych algorytmów, szczególnie w zakresie NLU. W wolnych chwilach zajmuje się dwójką dzieci i czyta książki fantasy.

dr Agnieszka Pluwak Koordynator grantu Senti Cognitive Services, product owner silnika NLU

Odpowiada za planowanie lingwistycznych i deweloperskich prac projektowych nad nowymi modelami semantycznymi, raportowanie, promocję i sprzedaż projektu SCS oraz publikacje naukowe. Współautorka wniosków grantowych w nowych programach SentiOne. Posiada dziesięć lat doświadczenia w pracy nad różnymi systemami NLP, w tym - wielojęzycznymi chatbotami, budową modeli semantycznych i składniowych. Doktor językoznawstwa korpusowego Instytutu Slawistyki PAN, autorka książki “Ramy semantyczne w tekstach umów najmu” oraz artykułów naukowych nt. przetwarzania języka potocznego i formalnego.

Michał Jędrzej Stańczyk Research engineer

...czyli Pan Dercz, inżynier matematyki stosowanej (Politechnika Gdańska). Zajmuje się implementacją i ewaluacją modeli symbolicznych (regułowych, proceduralnych, algebraicznych) oraz narzędzi do ich budowy i testowania, w szczególności języków dziedzinowych (DSL). Współautor patentu US9152623B2 “Natural language processing system and method”.

Sandra Dobrzyniak Starsza lingwistka

Ukończyła filologię romańską ze specjalizacja translatoryczną na Uniwersytecie Gdańskim. Współpracuje z działem R&D SentiOne od 2017 roku, gdzie zajmowała się językiem francuskim i włoskim. Odpowiada za opracowanie i anotację korpusów językowych przeznaczonych do uczenia maszynowego, semantyczna analizę wypowiedzi z mediów społecznościowych oraz weryfikacją modeli semantycznych. Wraz z zespołem wspiera tworzenie korpusów NLU wykorzystywanych do projektowania chatbotów.

Marta Dzielińska Manager działu lingwistycznego

Jej zadaniem w zespole jest koordynacja pracy lingwistów w dziale Research. Na co dzień zajmuje się analizą lingwistyczną dużej ilości danych, sporządzaniem raportów z testowania modeli semantycznych. Od początku 2020 roku współtworzy oraz usprawnia zbiory NLU wykorzystywane w projektach botowych. Współpracuje z firmą SentiOne od 2013 roku gdzie, przed przyłączeniem się do działu Research, wspierała dział analityczny w tworzeniu raportów z badania satysfakcji klientów oraz analizą mediów społecznościowych. Ukończyła studia filologii angielskiej drugiego stopnia ze specjalnością translatoryka oraz jednolite studia na kierunku psychologia na Uniwersytecie Gdańskim. Interesuje się szeroko rozumianą kulturą popularną oraz horrorem.

Monika Gęgotek Lingwistka

Ukończyła filologię czeską ze specjalizacją językoznawstwo na Uniwersytecie Wrocławskim oraz etnologię na Uniwersytecie Łódzkim. Współpracę z SentiOne rozpoczęła w dziale analitycznym, gdzie m.in. przygotowywała ilościowe i jakościowe raporty z badania opinii użytkowników na podstawie monitoringu internetu. W dziale Researchu zajmuje się testowaniem modeli semantycznych i językowych oraz analizą ich wyników, anotacją i tworzeniem korpusów tekstowych. Ponadto odpowiada za tłumaczenia wewnątrz aplikacji w parach językowych pl - cz oraz en - cz.

Mateusz Wyszecki Młodszy lingwista

Absolwent studiów magisterskich na kierunku filologii angielskiej, spec. przetwarzanie języka naturalnego. Odpowiada za oznaczanie korpusów przeznaczonych do uczenia maszynowego oraz projektowanie regułowych modeli językowych. Zajmuje się także ewaluacją wyników generowanych przez wspomniane modele.

Nat Niemczyk Młodszy lingwista

Ukończył studia filologii angielskiej drugiego stopnia ze specjalnością przetwarzanie języka naturalnego na Uniwersytecie Gdańskim. Odpowiada za tworzenie zasobów lingwistycznych, opracowywanie metodologii i oznaczanie korpusów tekstowych oraz tworzenie i dopracowywanie modeli regułowych. Weryfikuje również poprawność oznaczeń generowanych przez modele językowe.

Projekty badawcze

SentiDeepFusion 

Zastosowanie uczenia głębokiego w celu automatyzacji wielojęzycznej ekstrakcji informacji z tekstów potocznych dla interfejsów konwersacyjnych i analityki doświadczeń klienta

Wartość projektu: 24 357 995,15 zł

Wysokość dofinansowania: 18 836 158,78 zł

SentiCognitiveServices 

Nowa generacja usług do automatyzacji marketingu i obsługi sieci społecznościowych oparta o metody sztucznej inteligencji.

Wartość projektu: 11 699 568,70 zł

Wysokość dofinansowania: 8 682 464,57 zł

SentiConverse 

Rozwój i komercjalizacja interfejsu konwersacyjnego opartego o AI – w tym czatboty i rozpoznawanie intencji

Wartość projektu: 3 000 000,00 zł

Wysokość dofinansowania: 2 400 000,00 zł

Publikacje naukowe

Obuchowski, A., & Lew, M. (2020). Transformer-Capsule Model for Intent Detection (Student Abstract). Proceedings of the AAAI Conference on Artificial Intelligence, 34(10), 13885-13886. https://doi.org/10.1609/aaai.v34i10.7215

Lew M., Pęzik P.: A Sequential Child-Combination Tree-LSTM Network for Sentiment Analysis. In: Z. Vetulani and P. Paroubek (eds.) Proceedings of the 8th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, pp. 397–401, Poznań, Poland. Fundacja Uniwersytetu im. Adama Mickiewicza w Poznaniu, 2017.

Pluwak A., Korczynski W., Kisiel-Dorohinicki M.: Adapting a constituency parser to user-generated content in Polish opinion mining. In: Computer Science, vol.17 pp. 23-44, Kraków 2016.

Pluwak A.: Towards The Application of Speech Act Theory to Opinion Mining. In: Cognitive Studies| Études cognitives, Vol. 16 pp. 33-44, 2016.

Koesten L.-M., Kacprzak E., Tennison J.F.A., Simperl E.: The Trials and Tribulations of Working with Structured Data: a Study on Information Seeking Behaviour. In: CHI ’17- Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems, pp. 1277-1289, Denver, 2017.

Kacprzak E., Koesten L.-M., Ibáñez L.-D., Simperl E., Tennison J.: A Query Log Analysis of Dataset Search. In: Cabot, Jordi, de Virgilio, Roberto, Torlone, Riccardo (eds.) Web Engineering, 17th International Conference, ICWE 2017, Rome, Italy, June 5-8, 2017, Proceedings, pp. 429-436, Springer International Publishing, 2017.

Kacprzak E., Koesten L., Ibanez L.-D., Blount T., Tennison J., Simperl E.: Characterising dataset search — An analysis of search logs and data requests. In: Journal of Web Semantics, Vol. 55, pp. 37-55, 2019.

Kacprzak E., Giménez-García J. M., Piscopo A., Koesten L., Ibáñez L.-D., Tennison J., Simperl E.: Making Sense of Numerical Data-Semantic Labelling of Web Tables. In: EKAW 2018: Knowledge Engineering and Knowledge Management, pp. 163-178, 2018

Kacprzak E., Koesten L., Tennison J., Simperl E.: Characterising Dataset Search Queries. In: Companion Proceedings of the The Web Conference 2018, pp. 1485-1488, 2018.

Koesten L., Kacprzak E., Tennison J., Simperl E.: Collaborative Practices with Structured Data: Do Tools Support What Users Need? In: Proceedings of the 2019 CHI Conference on Human Factors in Computing, ACM, 2019.

Wystąpienia

Automated answer prediction in customer service FAQ conversations 

ML in PL Conference 2019

ML in PL Association is a non-profit organization devoted to fostering the machine learning community in Poland and promoting a deep understanding of ML methods.

Automatyczna analiza opinii w oparciu o 8 modeli semantycznych 

AI & NLP Day Conference 2020

AI & NLP Day gathers field experts, scientists and startups to discuss state-of-the-art knowledge in the area of AI and NLP.