Zastosowanie technologii
Grupa Azoty S.A.
Grupa Azoty posiada w swoich zasobach ogromne ilości danych oraz wszelkiego rodzaju dokumentów – często nieustrukturyzowanych, w różnych formatach oraz różnych szablonach z uwagi na ilość spółek wchodzących w skład Grupy. Utrudnia to zarządzanie nimi i sprawne znajdowanie potrzebnych w określonej chwili danych. Co więcej, analiza poufnych dokumentów wymaga zwykle zaangażowania zaufanych osób, których dostępność czasowa jest ograniczona. Brak inteligentnych systemów i platform do zarządzania wiedzą wydłużał proces podejmowania decyzji, jak również powodował ryzyka związane m.in. z powielaniem się projektów, braku ustrukturyzowanej wiedzy na temat licencji i patentów w Grupie, czasochłonną analizą materiałów naukowych, prawnych i prasowych.
W ramach współpracy zostało wytworzone e-repozytorium do zarządzania wiedzą, wyposażone w dedykowane wyszukiwarki (ekstraktory), automatycznie wydobywające z nieustrukturyzowanych dokumentów kluczowe informacje. Dzięki wykorzystaniu modeli machine learning, które zostały nauczone jak rozumieć i interpretować kontekst raportów B+R, patentów i analiz rynkowych, ich silniki automatycznie analizują tekst i wynajdują szczegółowe dane (takie jak daty, kwoty, nazwiska), jak również dłuższe fragmenty odpowiadające na pytania m.in. „czego dotyczył projekt?” lub „czy i dlaczego zakończył się sukcesem?”. Ponadto system został wyposażony w moduł przechowywania i przeglądania dokumentów, OCR i zaawansowane wyszukiwarki uwzględniające specyfikę̨ i fleksję (koniugacja, deklinacja, odmiana) dla języka polskiego i angielskiego. Dodatkowo wprowadzono dedykowane alarmy i powiadomienia, które mają czuwać nad wyeliminowaniem opóźnień (np. data wygaśnięcia patentu lub umowy). Ponadto opracowano całkowicie nowy sposób intuicyjnego zarządzania zbiorami tekstów, oparty na tagowaniu i etykietowaniu, co znacząco przyspiesza odnajdowanie poszukiwanego dokumentu. Dostęp do informacji w dokumencie zależy od roli użytkownika tak, by zagwarantować całkowite bezpieczeństwo danych.
Dzięki wdrożeniu repozytorium możliwy stał się dostęp do najważniejszych danych, jak i dokumentów z obszaru B+R (raporty, patenty, analizy) z dowolnego miejsca. Automatyczne ekstraktory najważniejszych danych oraz informacji z nieustrukturyzowanych materiałów pozwoliły zaoszczędzić czas analityków, którzy w przeciwnym razie pracę tę musieliby wykonać manualnie. Ustandaryzowany sposób przechowywania uporządkowanych danych znacząco przyspiesza porównywanie projektów, patentów i analiz między sobą, znajdowanie podobieństw, różnic, czy kontrolowanie ich przebiegu.
ul. Eugeniusza Kwiatkowskiego 8, 33-101 Tarnów