Podstawowe cechy Big Data opisuje tzw. model 5V:
- duża ilość danych (volume),
- duża prędkość przetwarzania danych (velocity),
- duża różnorodność danych (variety),
- weryfikacja danych (veracity),
- wartość danych dla użytkownika (value).
Wymienione cechy powodują, że tradycyjne narzędzia do zarządzania danymi nie są w stanie przechowywać ani efektywnie przetwarzać Big Data.
Zarządzanie i analiza danych zawsze przynosiły wymierne korzyści, a równocześnie stanowiły największe wyzwanie dla organizacji (niezależnie od ich wielkości i branży). Dlatego Big Data musi zostać poddana odpowiedniej analizie w celu znalezienia trendów i wyciągnięcia wniosków na temat zawartych w nich informacji. Zajmuje się tym analityka danych. Dziedzina ta ma różne zastosowania – od podstawowej analityki biznesowej (ang. Business Intelligence), poprzez raportowanie i przetwarzanie analityczne online, aż do zaawansowanej analizy z użyciem sztucznej inteligencji.
Podstawowe elementy
Do podstawowych elementów Big Data należą:
- uczenie maszynowe – odbywa się na podstawie wcześniejszych doświadczeń. Polega na zastosowaniu algorytmów i modeli statystycznych do nauczenia np. robota, jak wykonywać określone zadania bez wyraźnych instrukcji.
- przetwarzanie języka naturalnego – zdolność komputera do zrozumienia języka ludzkiego.
- analityka biznesowa (ang. Business Intelligence) – oparta na technologii metoda lub proces, która pozwala uzyskać wgląd w dane poprzez ich analizę i prezentację w taki sposób, aby użytkownicy końcowi (zazwyczaj kadra kierownicza wysokiego szczebla) mogli uzyskać z nich użyteczne spostrzeżenia i podjąć na ich podstawie świadome decyzje biznesowe.
- chmura obliczeniowa – dostarczanie usług obliczeniowych (serwerów, pamięci masowej, baz danych, sieci, oprogramowania, analityki, inteligencji oraz usług w chmurze), oferujących szybsze innowacje, elastyczne zasoby i korzyści skali.
Mechanizm działania
Technologie cyfrowe (aplikacje na telefony, media społecznościowe, strony www itp.) oraz procesy i maszyny produkcyjne codziennie generują ogromne ilości danych. Dane wytwarzane są również przez wiele innych źródeł m.in. sprzęt medyczny, elektroniczne bilety (np. lotnicze) oraz komputery w samochodzie, a także pochodzą z tekstu, dźwięku, wideo i obrazów. Wszystkie te informacje łączą się z innymi źródłami danych i stają się Big Data.
Big Data jest analizowana przez organizacje i firmy z różnych powodów, np. w celu odkrywania wzorców i trendów związanych z ludzkim zachowaniem oraz interakcją z technologią, które mogą być następnie wykorzystane do podejmowania decyzji wpływających na to, jak żyjemy, pracujemy i spędzamy wolny czas.
Powiązanie z innymi technologiami
Big Data jest powiązana z wieloma innymi technologiami, w tym z: Internetem Rzeczy, sztuczną inteligencją, analizą danych, chmurami do składowania i przetwarzania danych, obliczeniami kwantowymi, cyberbezpieczeństwem, Edge Computing, inteligentnymi chatbotami i wieloma innymi.
Użycie tych technologii pozwala na:
- zwiększenie szybkości różnych działań, np. przetwarzania danych; dostępu do danych, towarów i usług; podejmowania decyzji; oceny potencjalnej wartości klienta,
- zwiększenie wydajności, jakości i spójności przetwarzania danych,
- dostęp do zweryfikowanych i autentycznych danych,
- zwiększenie przychodów,
- elastyczność, przewidywanie potrzeb, dostarczanie odpowiednich produktów,
- personalizację usług,
- zmniejszenie ryzyka np. oszustw.
Znaczenie dla gospodarki
Big Data znajduje zastosowanie w wielu dziedzinach, w tym:
- Bankowości – np. ostrzeganie przed oszustami, raportowanie o ryzyku kredytowym w przedsiębiorstwie, analityka społeczna dla handlu.
- Komunikacji, mediach i rozrywce – np. gromadzenie, analiza i wykorzystanie wiedzy o konsumentach, wykorzystanie treści z mediów mobilnych i społecznościowych, tworzenie wzorców korzystania z treści medialnych.
- Sektorze opieki zdrowotnej – np. poprawa świadczenia usług oraz obsługi klientów, ograniczenie kosztów opieki zdrowotnej.
- Edukacji – np. mierzenie efektywności postępów i rozwoju.
- Przemyśle wytwórczym i zarządzaniem zasobami naturalnymi – np. obniżenie kosztów, zwiększenie efektywności, zwiększenie sprzedaży, zwiększenie szybkości wdrażania rozwiązań innowacyjnych, bardziej efektywne badania i rozwój.
- Ubezpieczeniach – np. dostosowanie produktów do potrzeb klienta, analiza i przewidywanie zachowań klientów.
- Handlu detalicznym i hurtowym – np. kontrola lojalności klientów, inwentaryzacja, wgląd w lokalne dane demograficzne gromadzone przez sklepy detaliczne i hurtowe.
- Transporcie – np. kontrola ruchu, planowanie tras, inteligentne systemy transportowe, zarządzanie komunikacją.
- Sektorze energetycznym i usługach komunalnych – np. analiza zużycia mediów, lepsze zarządzanie aktywami i pracownikami.