Ce este Big Data? Spre deosebire de ce ar putea sugera numele, nu este vorba neapărat de fișiere mari sau despre cunoștințe complete despre un anumit domeniu. Dar, pentru a înțelege mai bine semnificația acestui termen important, mai întâi să înțelegem ce sunt exact Datele și cum pot fi acestea MARI.
Ce sunt Datele?
Spre deosebire de informații, care pot implica înțelegere asupra unui anumit lucru, datele pot fi privite ca o măsurare a ceva, o valoare care descrie starea într-un anumit moment, fără nici o informație despre cât de mare sau mică este această valoare. Așadar, informațiile ar putea fi privite ca o comparație a datelor cu anumite referințe pe o perioadă anume de timp.
Să luăm cazul unui senzor de temperatură. Dacă îl plasăm într-un mediu necunoscut și obținem valoarea 32°C, aceasta este o valoare unică, o citire. Dar, ce putem învăța despre această valoare? Momentan nimic. Nu avem cu ce să comparăm valoarea, pentru a putea extrage informații utile de acolo. Nu știm în ce mediu funcționează acel senzor, care sunt valorile minime și maxime întâlnite acolo, sau valoarea medie a temperaturii.
Pentru a putea extrage informații despre mediul în sine, trebuie să folosim mai mulți senzori, plasați eficient, și trebuie să colectăm mai multe măsurători. Numărul de măsurători per unitate de timp se numește rezoluție, iar acest aspect este foarte important, deoarece pentru anumite aplicații s-ar putea să fie nevoie de o anumită rezoluție, suficient de mare, astfel încât mediul să se dezvăluie pe deplin.
Ce este Big Data?
Să ne imaginăm că avem de citit date de la mai mulți senzori dintr-o seră de legume. Pentru a înțelege mai bine condițiile de creștere a plantelor, sunt necesari mai multe tipuri de senzori, cum ar fi de temperatură, umiditate, nivel de iluminare și așa mai departe. Să presupunem că dispunem de 20 de astfel de senzori.
Suntem interesați să aflăm variația zilnică a tuturor senzorilor, așadar o rezoluție de 15 minute per citire ar trebui să fie potrivită. Aceasta înseamnă 96 de citiri per senzor pe zi, deci un total de 1920 de citiri zilnice per aplicație. Anual, dimensiunea bazei de date crește cu încă 700,000 de citiri. Volumul este deja copleșitor și crește exponențial pe măsură ce trece timpul. Aceasta explică ce este de fapt Big Data.
De ce este azi important Big Data?
Trăim într-o lume a informațiilor și suntem înconjurați de nenumărate sisteme care generează zilnic mulți petabiți de date. Colectarea și analiza acestor date este extrem de importantă în contextul optimizărilor ce pot fi aplicate pe sisteme, dar și în alte scopuri precum detectarea defectelor, securitatea cibernetică, detectarea intruziunilor, a fraudei și multe altele.
Concluzie
Un aspect important de remarcat este faptul că Big Data nu se limitează la Internet of Things (IoT), ci are multe alte aplicații și în alte domenii, cum ar fi serviciile bancare. Volumele uriașe de date sunt generate zilnic de fiecare sistem. De ce să nu folosim aceste date pentru a inspecta, depana și optimiza aceste sisteme?
Holisun poate oferi metodologii de Data Mining (analiză a datelor) precum și fluxuri de lucru complete ce permit analizarea, rezumarea de Big Data, precum și generarea de modele de învățare automată (Machine Learning) pe baza acestora. Cu astfel de modele se pot genera modele de Digital Twins, cu care se pot analiza sistemele chiar și din punctul de vedere al predicțiilor. Abordările de tip Big Data sunt implementate în unele dintre proiectele noastre de cercetare, cum ar fi BIECO, MUSNOMICS și SDK4ED.