ΕΙΣΑΓΩΓΗ
Η εξέλιξη του τρόπου επικοινωνίας του ανθρώπου έχει να επιδείξει πολλές και ποικίλες μορφές ανταλλαγής πληροφορίας. Στην αρχή της εξέλιξής μας, επικοινωνούσαμε με τη γλώσσα του σώματος και διάφορες ζωώδεις κραυγές, η διάδοση της γνώσης περνούσε από γενιά σε γενιά μέσω της μίμησης των πρεσβύτερων από τους νεότερους και η εξάπλωσή της ακολουθούσε τις μετακινήσεις των φυλών από τόπο σε τόπο. Πολύ αργότερα, έκανε την εμφάνιση του ο υποτυπώδης γραπτός λόγος με σκαριφήματα στους βράχους των σπηλαίων και ακολούθησε ο οργανωμένος προφορικός λόγος, ενώ τα διάφορα σκαριφήματα συμπλήρωσαν τα γράμματα και η οργάνωσή τους σε λέξεις και προτάσεις με νόημα. Μέχρι σήμερα, η αποτύπωση των γραμμάτων στο χαρτί, σε συνδυασμό με σχέδια και φωτογραφίες για την απεικόνιση του φανταστικού και την αποτύπωση του υπαρκτού, αποτελούν το κύριο μέσω διάδοσης και διάσωσης της γνώσης των ανθρώπων. Ωστόσο, ο ηλεκτρισμός και οι τεχνολογίες που πηγάζουν από αυτόν, τείνουν να αλλάξουν ριζικά τον τρόπο με τον οποίο διαδίδεται και διατηρείται η πληροφορία σήμερα και με μια απλή παρατήρηση φαίνεται να το έχει επιτύχει. Η μετατροπή της πληροφορίας σε ηλεκτρισμό και ηλεκτρομαγνητικά κύματα, επέτρεψε την ταχύτατη διάδοσή της πέρα από κάθε σύνορο. Με την εξάπλωση όμως των ηλεκτρονικών υπολογιστών και τη μετατροπή της πληροφορίας από άναρχη ροή ηλεκτρονίων σε κωδικοποιημένους παλμούς ηλεκτρικής ενέργειας αντιληπτούς από τους ηλεκτρονικούς υπολογιστές, διαδικασία γνωστή ως ψηφιοποίηση, οδηγηθήκαμε σε μια νέα εποχή, όπου η πληροφορία δημιουργείται και αποτυπώνεται εξ αρχής με τρόπο αντιληπτό μόνο μέσω των ηλεκτρονικών υπολογιστών. Αυτός ο τρόπος έκφρασης της πληροφορίας είναι ο λεγόμενος ψηφιακός και δομείται από το 0 και 1. Μόνο με συνδυασμούς αυτών των δυο στοιχείων, που δηλώνουν αν θα περάσει ή όχι ηλεκτρικό ρεύμα από κάποιο κύκλωμα, οι ηλεκτρονικοί υπολογιστές είναι σε θέση να αποτυπώσουν και να αναπαράγουν οποιαδήποτε μορφή πληροφορίας. Από απλό κείμενο και αριθμούς, μέχρι εικόνες, ήχο, βίντεο και οτιδήποτε άλλα δεδομένα, όσο πολύπλοκα και αν είναι αυτά. Όλα περιγράφονται με αλληλουχίες των Bit, δηλαδή των δομικών στοιχείων της ψηφιακής αναπαράστασης, που δεν είναι άλλα από τα ψηφία 0 και 1.
Τα Bits λόγω της δυαδικής τους υπόστασης, οργανώνονται σε αλυσίδες με μέγεθος ανάλογο του 2 υψωμένου σε κάποια δύναμη. Έτσι, για να εκφραστεί κάποιος αριθμός από το 0 μέχρι το 255, ο ηλεκτρονικός υπολογιστής χρησιμοποιεί μια αλυσίδα με 8 Bit, όπου 1 Bit μπορεί να είναι ή το 0 ή το 1. Αυτό δικαιολογείται εύκολα από απλούς κανόνες της στατιστικής, ένας εκ των οποίων μας διδάσκει πως αν έχουμε 2 στοιχεία συνδυαζόμενα ανά 8, τότε οι πιθανοί συνδυασμοί που μπορούμε να έχουμε είναι 2 εις την ογδόη, δηλαδή 256 διαφορετικούς συνδυασμούς. Συνεπώς, αν ήταν να εκφράσουμε 256 διαφορετικά νούμερα από το 0 μέχρι το 255, θα μπορούσαμε να το πετύχουμε οργανώνοντας μηδενικά και άσους σε οκτάδες. Κατά τον τρόπο αυτό, το 0 θα απεικονίζονταν με 8 μηδενικά (00000000), το 1 με 7 μηδενικά και έναν άσο στο τέλος (00000001) και το 255 με 8 άσους (11111111). Το ίδιο συμβαίνει και για την αναπαράσταση μιας λέξεις, όπου το κάθε γράμμα εκφράζεται από έναν αριθμό από το 0 μέχρι το 255, μιας εικόνας, ενός τρισδιάστατου μοντέλου ή οτιδήποτε άλλο που η ψηφιακή του αναπαράσταση θα μας εξυπηρετούσε.
Αλληλουχίες από 0 και 1 δομούν τις εντολές και τα δεδομένα που είναι απαραίτητα για τη λειτουργία του ηλεκτρονικού υπολογιστή (Η/Υ), όπως επίσης και τις εντολές και τα δεδομένα που είναι απαραίτητα για την εργασία του ανθρώπου με τον ηλεκτρονικό υπολογιστή. Λειτουργικά συστήματα, προγράμματα επεξεργασίας δεδομένων όπως κείμενα, λογιστικά φίλα, εικόνες, ήχοι, βίντεο και λοιπά, όπως επίσης και τα δεδομένα τα ίδια, όλα περιγράφονται από τεράστιες αλυσίδες ψηφίων, τις οποίες κανείς δε μπορεί να τις συντάσσει από την αρχή, κάθε φορά που θα θέτει σε λειτουργία τον ηλεκτρονικό του υπολογιστή. Για το λόγω αυτό, οι πληροφορίες αυτές πρέπει να διατηρούνται σε κάποιο μέσο ψηφιακής αποθήκευσης. Στους πρώτους ηλεκτρονικούς υπολογιστές, η αποθήκευση των δεδομένων και των εντολών γίνονταν σε τρυπητές καρτέλες από χαρτόνι. Πολύ γρήγορα όμως, ο ολοένα αυξανόμενος όγκος των δεδομένων αφενός και η ανάγκη για ταχύτερους ρυθμούς επεξεργασίας τους αφετέρου, οδήγησαν στην εμφάνιση πληθώρας τεχνολογικών λύσεων για την ψηφιακή αποθήκευση της πληροφορίας. Οι χρήστες ηλεκτρονικών υπολογιστών σήμερα έχουν στη διάθεσή τους πάμπολλες λύσης για την ψηφιακή αποθήκευση των δεδομένων τους. Ωστόσο, η τεχνολογική προσέγγιση που ακολουθεί ο κάθε κατασκευαστής, ως την απάντησή του στο θέμα της ψηφιακής αποθήκευσης δεδομένων, μπορεί να είναι τόσο διαφορετικά υλοποιημένη σε σχέση με άλλες, ώστε να μην είναι η καταλληλότερη επιλογή για κάποια συγκεκριμένη εφαρμογή.
Σε αυτό το κεφάλαιο εξετάζονται διεξοδικά και παρουσιάζονται αναλυτικά πρακτικές και λύσεις αποθήκευσης και αρχειοθέτησης μεγάλων και πολύπλοκων δομών δεδομένων, όπως αυτές που παράγονται από την ψηφιοποίηση φυσικών αντικειμένων και χώρων. Τα δεδομένα που προκύπτουν από τη διαδικασία της ψηφιοποίησης, για αρχειακούς και επιστημονικούς λόγους, είναι ογκώδη αρχεία των οποίων το μέγεθος σχετίζεται άμεσα με την ανάλυση της ψηφιοποίησης σε συνδυασμό με τον αριθμό των διαστάσεων και χαρακτηριστικών προς ψηφιοποίηση.
Τα θέματα που προκύπτουν κατά την αποθήκευση και αρχειοθέτηση ψηφιοποιημένης πληροφορίας έγκεινται σε δύο κατηγορίες. Στην κατηγορία της αποθήκευσης και στην κατηγορία της ανάκτησης της πληροφορίας. Για κάθε μια από τις παραπάνω κατηγορίες υπάρχουν θέματα που σχετίζονται με τις φυσικές ιδιότητες του αποθηκευτικού μέσου και κατά συνέπεια της αποθηκευτικής συσκευής, όπως επίσης και θέματα που αφορούν τον τρόπο με τον οποίο οργανώνονται τα αποθηκευμένα δεδομένα, εν μέσω κάποιου λογισμικού ή κάποιου πρωτοκόλλου οργάνωσης αρχείων.
Μέσα αποθήκευσης ψηφιακών δεδομένων και συσκευές ανάγνωσης και εγγραφής τους
Οι σύγχρονοι ηλεκτρονικοί υπολογιστές κάνουν χρήση τουλάχιστον δύο επιπέδων για την αποθήκευση των δεδομένων που διαχειρίζονται. Το πρώτο επίπεδο είναι αυτό στο οποίο αποθηκεύονται τα δεδομένα για μικρό χρονικό διάστημα κατά την επεξεργασία τους από τον κεντρικό επεξεργαστή του υπολογιστή. Αυτός ο αποθηκευτικός χώρος πρέπει να είναι ταχύτατος έτσι ώστε η επεξεργασία των δεδομένων να γίνεται όσο το δυνατό γρηγορότερα. Αυτό το επίπεδο, το οποίο είναι γνωστό και ως πρωτεύων αποθηκευτικός χώρος, υλοποιείται στην κεντρική μνήμη (RAM: Random Access Memory – Μνήμη Τυχαίας Προσπέλασης) του ηλεκτρονικού υπολογιστή, η οποία είναι ταχύτατη αλλά ακριβή και χάνει την πληροφορία που έχει αποθηκευμένη με τη διακοπή τροφοδοσίας της με ηλεκτρικό ρεύμα. Για να μη χαθούν οι πληροφορίες που είναι αποθηκευμένες στη μνήμη RAM του ηλεκτρονικού υπολογιστή, αλλά και για να αυξηθεί η αποθηκευτική ικανότητα δεδομένων πέρα από την περιορισμένη και ακριβή χωρητικότητα που προσφέρει η κεντρική μνήμη, γίνεται χρήση ενός δεύτερου επιπέδου. Στο δεύτερο επίπεδο, οι πληροφορίες πρέπει να διατηρούνται και μετά την παύση τροφοδοσίας του συστήματος με ηλεκτρική ενέργεια, όπως επίσης και να παρέχονται, με μικρότερο κόστος, χώροι αποθήκευσης δεδομένων πολλαπλάσιου μέγεθος από αυτούς που προσφέρει η κεντρική μνήμη του υπολογιστή. Τα δεδομένα που αποθηκεύονται στο επίπεδο αυτό, πρέπει να είναι άμεσα διαθέσιμα για τις ανάγκες του χρήστη και του ηλεκτρονικού υπολογιστή και η γρήγορη μεταφορά τους στην κεντρική μνήμη εγγυημένη. Το δεύτερο επίπεδο, γνωστό και ως δευτερεύων αποθηκευτικός χώρος, εκπροσωπείται από τον σκληρό δίσκο του ηλεκτρονικού υπολογιστή, ο οποίος προσφέρει, σχετικά με μικρό κόστος, ευμεγέθεις αποθηκευτικούς χώρους, όπου τα δεδομένα μπορούν να διατηρηθούν για πολλά χρόνια, χωρίς καν την τροφοδοσία της αποθηκευτικής συσκευής με ηλεκτρικό ρεύμα.
Ο φρενήρης ρυθμός παραγωγής δεδομένων όμως, ανάγκασε πολλούς χρήστες υπολογιστών να καταφύγουν και σε τρίτο επίπεδο αποθήκευσης των δεδομένων τους. Σε αυτό το επίπεδο, η πληροφορία αποθηκεύεται σε κάποιο φτηνό αλλά αξιόπιστο αποθηκευτικό μέσο εκτός του ηλεκτρονικού υπολογιστή, το οποίο όμως για μείωση του κόστους είναι αργό. Η αποθήκευση στο τρίτο επίπεδο γίνεται είτε γιατί δεν χρησιμοποιείται η πληροφορία πολύ συχνά και υπάρχει ανάγκη απελευθέρωσης γρήγορου αποθηκευτικού χώρου στο δεύτερο επίπεδο αποθήκευσης του συστήματος, είτε για λόγους φτηνής εφεδρικής αποθήκευσης κρίσιμων δεδομένων, που η απώλεια τους λόγω δυσλειτουργίας του συστήματος ή κακής χρήσης δεν είναι επιθυμητή. Συνήθως για τις ανάγκες αποθήκευσης του τρίτου επιπέδου χρησιμοποιούνται οι μαγνητικές ή οπτικές ταινίες αποθήκευσης δεδομένων, οι οποίες θεωρούνται σήμερα ως το φτηνότερο αποθηκευτικό μέσω μεγάλης χωρητικότητας που διατίθεται στην αγορά πληροφορικής.
Ωστόσο υπάρχουν πολλά άλλα μέσα και πολλές άλλες πρακτικές για την αποθήκευση δεδομένων δευτέρου και τρίτου επιπέδου, που καθιστούν τη σωστή επιλογή τους επίπονη διαδικασία.
Η επιλογή του αποθηκευτικού μέσου για τις ανάγκες αποθήκευσης και αρχειοθέτησης όπως και για οποιαδήποτε άλλη εφαρμογή, είναι άμεσα συνυφασμένη με την ταχύτητα διάθεσης της αποθηκευμένης πληροφορίας προς τους χρήστες, αλλά και με τον όγκο της σε Megabytes. Η ταχύτητα διάθεσης των δεδομένων είναι παράγωγο του χρόνου πρόσβασης στα δεδομένα και του ρυθμού μεταφοράς των δεδομένων. Με τον όρο χρόνο πρόσβασης εννοείτε ο χρόνος που μεσολαβεί από την αίτηση του χρήστη για δεδομένα μέχρι τον εντοπισμό τους από την αποθηκευτική συσκευή. Όσο πιο μικρός είναι αυτός ο χρόνος τόσο πιο γρήγορη είναι η απόκριση της αποθηκευτικής συσκευής στις αιτήσεις του χρήστη για δεδομένα. Ωστόσο, ο χρόνος πρόσβασης από μόνος του δεν καθορίζει την ταχύτητα εξυπηρέτησης του χρήστη από την αποθηκευτική συσκευή. Εξίσου σημαντικός είναι και ο ρυθμός μεταφοράς των δεδομένων, ο οποίος καθορίζει το ποσό των δεδομένων που μπορεί να μεταφέρει μια αποθηκευτική συσκευή από το μέσο αποθήκευσης στη μνήμη του ηλεκτρονικού υπολογιστή ή αντίστροφα, μέσα σε ένα δευτερόλεπτο. Συνεπώς, η ταχύτητα μιας αποθηκευτικής συσκευή είναι ανάλογη με τον ρυθμό μεταφοράς των δεδομένων και αντιστρόφως ανάλογη προς το χρόνο πρόσβασης στα δεδομένα.
Τα αποθηκευτικά μέσα που είναι διαθέσιμα στην αγορά σήμερα χωρίζονται σε τρεις κατηγορίες, ανάλογα με τον τρόπο που αποθηκεύονται και ανακτώνται τα δεδομένα. Οι κατηγορίες αυτές προκύπτουν ύστερα από τις διαφορές στην αρχή λειτουργίας του κάθε αποθηκευτικού μέσου, έτσι τα αποθηκευτικά μέσα κατηγοριοποιούνται στα μαγνητικά, στα οπτικά και στα στερεής κατάστασης (solid state). Συνεπώς, αν τα δεδομένα ανακτώνται και αποθηκεύονται σε κάποιο φυσικό μέσο με χρήση του μαγνητισμού το μέσο αυτό θεωρείται μαγνητικό, στην περίπτωση χρήσης του φωτός θεωρείται οπτικό και στην περίπτωση χρήσης κυκλωμάτων μνήμης θεωρείται στερεής κατάστασης.