FT: Τα fake data και πώς οδηγούν σε λάθος πολιτικές αποφάσεις
Τα μεγάλα πολιτικά λάθη που στηρίχθηκαν σε εσφαλμένη ανάλυση δεδομένων και οι παρενέργειες των δημοσκοπήσεων. Η παρερμηνεία του μέσου όρου και η «χειραγώγηση» κατά τη διαδικασία συλλογής στοιχείων.
Wolfgang Münchau
Financial Times
Δεν αισθάνεστε καλά αν το αγαπημένο σας κόμμα ή ο πολιτικός σκοπός προηγείται στις δημοσκοπήσεις; Λοιπόν, προσέξτε. Τα στοιχεία (data) είναι εξίσου επιρρεπή σε παραποίηση και παρερμηνεία όσο και οι λέξεις, και ίσως ακόμα περισσότερο.
Στους τομείς που με ενδιαφέρουν, ευρωπαϊκή πολιτική και πολιτική οικονομία, τα ψεύτικα στοιχεία (fake data) έχουν γίνει μεγαλύτερο πρόβλημα από τις ψεύτικες ειδησεις (fake news) γιατί δίνουν στους πολιτικούς και τους παρατηρητές λάθος αίσθηση ασφάλειας και τους οδηγεί σε κακές αποφάσεις.
Το πιο χαρακτηριστικό παράδειγμα είναι ο πρώην Βρετανός πρωθυπουργός Ντέιβιντ Κάμερον, του οποίου η πεποίθηση ότι θα μπορούσε εύκολα να κερδίσει το δημοψήφισμα για το Brexit στηρίχθηκε σε διαθέσιμα δημοσκοπικά στοιχεία της εποχής. Οι κεντρώοι υπερμαχοι της Ευρώπης στην Ιταλία έχουν επίσης την τάση να διαβάζουν λάθος τη δημόσια διάθεση.
Το πρόβλημα με τα στατιστικά fake news δεν είναι ο διάβολος που γνωρίζουμε, όπως το διαβόητο επιχείρημα των 350 εκατομμυρίων στερλίνων στο λεωφορείο της καμπάνιας «Leave» στο βρετανικό δημοψήφισμα. Είναι το πιο διακριτικά αποπροσανατολιστικό.
Η «Dagbladet Information», μια δανέζικη εφημερίδα την προηγούμενη εβδομάδα δημοσίευσε ένα ασυνήθιστο θέμα, ότι η αξιοσέβαστη δημοσκόπηση «Ευρωβαρόμετρο» στηρίζεται σε ύποπτη δειγματοληψία. Το ποσοστό απαντήσεων στη Γερμανία, για παράδειγμα, είναι τόσο χαμηλό ώστε να κάνει το όποιο στατιστικό συμπέρασμα αμφισβητήσιμο. Η εφημερίδα επικαλείται στατιστικολόγο που πιστεύει ότι το λάθος στη δειγματοληψία παράγει μια φιλοευρωπαϊκή τάση στη δημοσκόπηση, και παρασύρει τους πολιτικούς στο να πιστεύουν ότι η στήριξη στην ΕΕ είναι μεγαλύτερη από αυτή που πραγματικά είναι.
Το πρόβλημα δεν είναι η σκόπιμη νόθευση, αλλά τα λάθος συμπεράσματα. Τα στοιχεία για το Brexit δεν παραπλάνησαν μόνο τον Κάμερον. Ηταν ο κύριος παράγοντας πίσω από τον εφησυχασμό της καμπάνιας Remain. Οι οπαδοί της εξακολουθούν να κάνουν το ίδιο λάθος τώρα, επικαλούμενοι μια επίμονη πλειοψηφία υπέρ τους.
Τα οικονομικά στοιχεία είναι επίσης επιρρεπή σε λάθος ανάγνωση. Αν είχες κοιτάξει το μέσο κατά κεφαλήν εισόδημα πριν το δημοψήφισμα για το Brexit, θα είχες χάσει την υποκείμενες οικονομικές εντάσεις στην βρετανική κοινωνία. Θα χρειάζονταν βαθύτερη ανάλυση για να ανακαλύψεις ότι το πραγματικό διαθέσιμο εισόδημα έχει βαλτώσει για τις περισσότερες από τις χαμηλές -και μεσαίες- εισοδηματικές ομάδες.
Οι στατιστικοί μέσοι όροι μπορούν να είναι κακοί φίλοι. Όταν ο Μπιλ Γκέιτς μπει σε μια παμπ, μόνο ένας χαζός θα συμπέραινε ότι το μέσο εισόδημα αυξήθηκε. Συνεχίζουμε, όμως, να κάνουμε συνεχώς το ίδιο λάθος σε καταστάσεις που είναι λιγότερο προφανείς.
Η υπερβολική εξάρτηση στο λάθος είδος στοιχείων εισέβαλε σε όλες τις πτυχές της ζωής μας. Ενα από τα πλέον παράλογα στατιστικά τα οποία έχω συναντήσει στη Μεγάλη Βρετανία είναι η κατάταξη των σχολείων της χώρας. Είναι ευρύτερα γνωστό ότι η επίτευξη υψηλών επιδόσεων διαταράσσεται σε μεγάλο βαθμό από παράγοντες όπως η ευμάρεια των γειτονιών και των πολιτικών επιλογών των σχολείων. Κι’ όμως κάποιοι γονείς αντιμετωπίζουν ακόμα αυτές τις στατιστικές ως αντικειμενικά αληθινές. Το χειρότερο είναι ότι κάποια σχολεία χειραγωγούν αυτές τις κατατάξεις εξαιρώντας παιδιά με χαμηλές επιδόσεις από δημόσιες εξετάσεις. Σε αυτή την περίπτωση η στατιστική δεν είναι απλά παραπλανητική αλλά ενθαρρύνει ανήθικες συμπεριφορές: τα σχολεία αποτυγχάνουν στο βασικό τους καθήκον, να εκπαιδεύσουν όλα τα παιδιά για μια κατάταξη.
Μπορεί να υπάρχουν κάποιες πολύτιμες πληροφορίες στην κατάταξη των σχολείων, όπως μπορεί να υπάρχουν και σε μια δημοσκόπηση. Τα καλύτερα στοιχεία είναι συχνότερα κάτω από τους τίτλους των πρωτοσέλιδων, αλλά αυτά συχνά δεν μεταδίδονται.
Ως καταναλωτές δημοσιευμένων δημοσκοπήσεων και άλλων πολιτικών στατιστικών, δεν πρέπει να λαμβάνουμε τα στοιχεία στην ονομαστική τους αξία αλλά, αντίθετα, να προσπαθήσουμε να καταλάβουμε το περιθώριο λάθους, τις δειγματοληπτικές μεθόδους και τις προσαρμογές που έγιναν από τους δημοσκόπους στα ακατέργαστα στοιχεία.
Όταν αναλύουμε τα δεδομένα, πρέπει να προσέχουμε τις χαλαρές συγκρίσεις με τα ιστορικά. Δεν υπάρχει λογικός λόγος να πιστέψουμε ότι η εκτίναξη της στήριξης στο Εργατικό Κόμμα παραμονές των εκλογών του 2017 θα επαναληφθεί το 2019. Απ’ όσα ξέρουμε, αυτές οι κάλπες μπορεί να καταλήξουν όπως το 1987, όταν η Μάργκαρετ Θάτσερ πέτυχε σαρωτική νίκη.
Οι χρηματοπιστωτικοί ρυθμιστές επίσης τείνουν να κάνουν το λάθος να σκέπτονται ότι η επόμενη κρίση θα είναι όπως η τελευταία.
Πώς πρέπει λοιπόν να χειριζόμαστε στοιχεία και στατιστικές σε τομείς που δεν είμαστε ειδικοί; Η πιο σημαντική συμβουλή μου είναι ως εργαλεία που βοηθούν να τίθενται ερωτήσεις, όχι ως απαντήσεις. Αν πρέπει να αναζητήσεις απαντήσεις από στοιχεία, εξασφάλισε ότι καταλαβαίνεις τα θέματα και ότι τα δεδομένα είναι επιβεβαιωμένα ανεξάρτητα, από ανθρώπους που δεν έχουν συμφέροντα στο παιχνίδι.
Αυτό που λέω εδώ είναι μια έκκληση για αντίληψη, όχι ένα παραλήρημα κατά των στατιστικών. Το αντίθετο. Είμαι θαυμαστής των μαθηματικών στατιστικών και του θεωρητικού τους υπόβαθρου. Η μοντέρνα στατιστική έχει βαθύ αντίκτυπο στην καθημερινή ζωή μας. Στηρίζομαι, για παράδειγμα, στην τεχνολογία της στατιστικής μετάφρασης της Google για να αποκτήσω πληροφορίες για τις εφημερίδες της Δανίας. Η πρόοδο στη στατιστική επιτρέπει στις κάμερες των smartphone μας να βλέπουν στο σκοτάδι ή στην συσκευή ιατρικής απεικόνισης να εντοπίσει μια ασθένεια.
Τα πολιτικά στοιχεία, όμως, είναι πολύ πιο αβέβαιης ποιότητας. Στην πολιτική συζήτηση, ειδικά στα μέσα κοινωνικής δικτύωσης, οι στατιστικές χρησιμοποιούνται σχεδόν αποκλειστικά για να επιβεβαιώσουν πολιτικές προτιμήσεις ή ως όπλο σε μια διαφωνία.
Στο βαθμό που τα πράγματα είναι έτσι, είμαστε καλύτερα χωρίς αυτές.
Διαβάστε επίσης:
Ο Μεγάλος αδερφός στα social media
Προσωπικά δεδομένα, το πετρέλαιο της εποχής μας
Ιστορική επιστήμη και mega data