Η επεξεργασία των big data και η κατηγοριοποίηση των στοιχείων που προκύπτουν αποτελεί την μεγάλη πρόκληση του σύγχρονου επιχειρείν, το οποίο καλείται πλέον να χρησιμοποιήσει τον θησαυρό των βάσεων δεδομένων (πελατολόγια κ.λπ) για εμπορικούς σκοπούς όπως είναι η προώθηση των πωλήσεων ή η οργάνωση των logistics.

Με τον όρο big data αναφερόμαστε σε δεδομένα που επιχειρήσεις και οργανισμούς συλλέγουν (ή μπορούν να συλλέξουν) σε πολύ μεγάλες ποσότητες. Η ανάλυσή τους μέχρι σήμερα είχε απασχολήσει μόνο ερευνητικά κέντρα και επιστήμονες, φαίνεται όμως ότι σταδιακά οι επιχειρήσεις αντιλαμβάνονται το θησαυρό που κρύβεται στα big data. 

 

Ποιοι διαθέτουν big data 

Τόσο μεγάλος όγκος δεδομένων είναι διαθέσιμος κυρίως σε μεγάλες εταιρείες: για παράδειγμα, μια εταιρεία κινητής τηλεφωνίας διαθέτει βάσεις δεδομένων, συνήθως διάσπαρτες, όπου υπάρχουν όλα τα στοιχεία των συνδρομητών της: ονόματα, επώνυμα, αριθμούς σταθερών και κινητών, ημερομηνίες αγορών, κεραίες τηλεφωνίας με μεγάλη κίνηση κ.α. Με τον ίδιο τρόπο, ένα σουπερμάρκετ διαθέτει τεράστιο όγκο δεδομένων σχετικά και αγορές και πωλήσεις.

Για την ώρα, τα δεδομένα αυτά στην καλύτερη περίπτωση χρησιμοποιούνται για την εξυπηρέτηση πελατών, όχι όμως και για τη λήψη στρατηγικών αποφάσεων. Σκεφτείτε όμως ότι για παράδειγμα στην περίπτωση του σουπερμάρκετ θα μπορούσε κανείς, μέσα από την ανάλυση των δεδομένων να δει αναλυτικά τις ώρες που έχει κίνηση ένα κατάστημα, πότε "φεύγουν" κυρίως λαχανικά και πότε γαλακτοκομικά προϊόντα, τι κατηγορίες πελατών προτιμούν βιολογικά προϊόντα και πλήθος άλλων στοιχείων. 

Φυσικά, τα περισσότερα δεδομένα αυτή τη στιγμή (και μάλιστα οργανωμένα με βέλτιστο τρόπο) διαθέτουν εταιρείες όπως η Google, η Facebook ή η Amazon. Από κοντά φυσικά βρίσκονται κράτη, ασφαλιστικοί και τραπεζικοί οργανισμοί, αλλά και ο χώρος της εκπαίδευσης. 

 

Οι προκλήσεις στην επεξεργασία των δεδομένων 

Ένα από τα σημαντικότερα ζητήματα που αντιμετωπίζει μια εταιρεία όταν αποφασίζει να συλλέξει και να αναλύσει big data είναι η ποικιλομορφία των στοιχείων αυτών. Επίσης, για να πετύχει κανείς την επεξεργασία τόσο μεγάλου όγκου δεδομένων απαιτούνται ειδικά εργαλεία και τεχνολογία, προκειμένου η όλη διαδικασία να μην καθυστερεί πάρα πολύ.

Ωστόσο, το πλέον σημαντικό είναι το να μπορεί κανείς να "οσφρανθεί" ιδέες και λύσεις που μπορούν να προκύψουν μέσα από την ανάλυση big data. Για να έχει ενδιαφέρον και αποτέλεσμα μια τόσο δαπανηρή διαδικασία, θα χρειαστεί εξειδικευμένο και κυρίως δημιουργικό ερευνητικό προσωπικό, το οποίο μπορεί να εντοπίζει προβλήματα, ερωτήματα και πιθανές λύσεις που μπορεί να προκύψουν. 

Στο πεδίο αυτό, νέα συστήματα κάνουν την εμφάνιση τους, τα οποία εστιάζουν στην έξυπνη αντιμετώπιση και υλοποίηση της ανάλυσης, αντιμετωπίζοντας τμηματικά τον όγκο των δεδομένων και εστιάζοντας σε υποτμήματα του.

Στο πεδίο αυτό, πρωτοπόροι είναι η IBM και η SAS, ενώ ανάμεσα στις άλλες λύσεις που υπάρχουν ξεχωρίζουν εκείνες της Alpine Data Labs, της Alteryx, της Angoss Software, της Dell, της Oracle, της SAP. Στο χώρο έχει μπει δυναμικά και η Microsoft, η οποία έχει αναπτύξει μια εύχρηστη και αποδοτική πλατφόρμα. 

 

Οι προοπτικές 

Σύμφωνα με όλους τους αναλυτές, ο χώρος της συλλογής, επεξεργασίας και ανάλυσης big data έχει πολύ θετικές προοπτικές. Σύμφωνα με έρευνα της Frost & Sullivan, η συνολική αγορά αναμένεται να αγγίξει σε αξία τα 122 δισ. δολάρια μέχρι το 2025, ενώ ο όγκος των αναλυόμενων δεδομένων την ίδια χρονιά θα φτάνει τα 100 Zettabytes. Σε έρευνα που έγινε σε ηγετικά στελέχη των αμερικανικών επιχειρήσεων, το 89% συμφωνεί ότι η ανάλυση big data θα αλλάξει ριζικά τον τρόπο λειτουργίας των επιχειρήσεων. 

Άλλη έρευνα της Wikibon υπολογίζει την αξία της αγοράς το ίδιο έτος στα 84 δισ. δολάρια, με μέσο όρο ετήσιας ανάπτυξης για την περίοδο 2011-2026 σε ποσοστό 17%. Σύμφωνα με την ίδια έρευνα, η αξία της αγοράς το 2014 ήταν 27,36 δισ. δολάρια, έναντι 19,6 δισ. δολαρίων το 2013. 

Στην Ελλάδα, τα βήματα που έχουν γίνει είναι πολύ περιορισμένα. Οι περισσότερες εταιρείες δεν έχουν αρχίσει καν να πειραματίζονται, ενώ το ελληνικό δημόσιο ακόμα ασχολείται με την ψηφιοποίηση των συστημάτων του και θα χρειαστεί αρκετά χρόνια για να αξιοποιήσει τα πλεονεκτήματα που υπάρχουν. 

Πολύ περιορισμένα είναι και τα βήματα της ελληνικής ακαδημαϊκής κοινότητας στο χώρο. Μόλις πρόσφατα, ο "Δημόκριτος" πέτυχε τη συμμετοχή του σε μεγάλο ερευνητικό consortium υπό την ηγεσία του Fraunhofer IAIS της Γερμανίας για την ανάπτυξη μιας πλατφόρμας λογισμικού η οποία ενσωματώνει σημαντικές τεχνολογίες Big Data προσαρμοσμένες στις ανάγκες των εμπλεκόμενων φορέων στους τομείς της Υγείας, Διατροφής, Ενέργειας, Μεταφορών, Περιβάλλοντος, Κοινωνικών Επιστημών και Ασφάλειας.