Αναζήτηση αυτού του ιστολογίου

Πέμπτη 1 Νοεμβρίου 2012

Ερώτηση 10


Ερώτηση: Γιατί στον έλεγχο Χ τετράγωνο (καλής προσαρμογής), σε αντίθεση με τους υπόλοιπους ελέγχους, η απόρριψη της ερευνητικής υπόθεσης γίνεται όταν το παρατηρούμενο επίπεδο σημαντικότητας (significance) του ελέγχου είναι μεγαλύτερο από το χρησιμοποιούμενο επίπεδο σημαντικότητας (π.χ. 0.05);
Απάντηση
Η απάντηση στο ερώτημα αυτό δεν άπτεται της φύσης της στατιστικής ανάλυσης αλλά του μεθοδολογικού σχεδιασμού της εκάστοτε μελέτης και συγκεκριμένα της διατύπωσης των ερευνητικών υποθέσεων. Ειδικά στις κοινωνικές επιστήμες, αλλά και γενικότερα, οι ερευνητικές υποθέσεις είναι συνήθως αντίθετες με τις μηδενικές υποθέσεις των ελέγχων που χρησιμοποιούνται για την επιβεβαίωσή τους. Έτσι όταν απορρίπτεται η ισχύς της μηδενικής υπόθεσης, ο ερευνητής κάνει την παραδοχή ότι η ερευνητική υπόθεση της μελέτης ισχύει. Ως γνωστόν η μηδενική υπόθεση ενός ελέγχου απορρίπτεται (και άρα η ερευνητική υπόθεση γίνεται αποδεκτή) εάν το significance του ελέγχου είναι μικρότερο από το χρησιμοποιούμενο επίπεδο σημαντικότητας.

 Στον ακόλουθο πίνακα παρατηρούμε ορισμένα παραδείγματα ερευνητικών υποθέσεων και των αντίστοιχων μηδενικών υποθέσεων των ελέγχων.


Ερευνητική υπόθεση

Ανάλυση

Μηδενική Υπόθεση

Το φύλλο επηρεάζει το μέσο εισόδημα

T-test

Οι μέσοι όροι του εισοδήματος για τα δύο φύλλα είναι ίσοι

Το χρώμα της συσκευασία επηρεάζει τις πωλήσεις

ANOVA

Οι μέσοι όροι των πωλήσεων για τις 4 συσκευασίες διαφορετικών χρωμάτων είναι ίσοι

Η ικανοποίηση από μία αγορά (συνεχής) επηρεάζει την πρόθεση επαναγοράς (συνεχής)

Γραμμική

Παλινδρόμηση

Ο συντελεστής b της ανεξάρτητης μεταβλητής είναι διάφορος του μηδενός

 Στην περίπτωση του ελέγχου X τετράγωνο καλής προσαρμογής η ερευνητική υπόθεση της εκάστοτε μελέτης έχει την ίδια κατεύθυνση με τη μηδενική υπόθεση του στατιστικού ελέγχου. Συγκεκριμένα, η ερευνητική υπόθεση είναι ότι τα δεδομένα του δείγματος προσαρμόζονται (fit) στο ερευνητικό μοντέλο ενώ η μηδενική υπόθεση του ελέγχου είναι ότι η κατανομή των δεδομένων του δείγματος ταυτίζεται με την κατανομή που έχει υποθέσει ο ερευνητής για το ερευνητικό μοντέλο της μελέτης.

Παρασκευή 8 Ιουνίου 2012

Ερώτηση 9

Ερώτηση: Τι είναι η μέθοδος ελαχίστων τετραγώνων;

Απάντηση

Είναι μια μέθοδος που χρησιμοποιείται για την εκτίμηση παραμέτρων γραμμικών μοντέλων. Στην πιο απλή περίπτωση που έχουμε δύο μεταβλητές Χ και Υ και θέλουμε να διερευνήσουμε την μεταξύ τους γραμμική σχέση, κάθε παρατήρηση του δείγματος θα είναι μια δυάδα αριθμών, δηλαδή ένα σημείο στο διάγραμμα της Χ με την Υ. Η εξίσωση του γραμμικού μοντέλου που θέλουμε να βρούμε, θα συμβολίζεται στο διάγραμμα ως η ευθεία γραμμή* που θα είναι η πιο κοντινή στα σημεία που έχουν προκύψει από τις παρατηρήσεις του δείγματος.

*Θυμίζουμε: Μια εξίσωση γραμμικής παλινδρόμησης έχει τη μορφή Υ = α + β*Χ, η οποία στην αναλυτική γεωμετρία συμβολίζει μια ευθεία γραμμή.

Πώς λοιπόν βρίσκουμε τους συντελεστές της ευθείας αυτής; Προσθέτοντας τις αποστάσεις όλων των σημείων από την ευθεία και ελαχιστοποιώντας το άθροισμα που προκύπτει. Αν όμως προσθέσουμε απλά τις αποστάσεις το άθροισμα θα είναι 0, αφού τα μισά σημεία θα είναι πάνω από την ευθεία και τα άλλα μισά κάτω από την ευθεία. Έτσι αντί να ελαχιστοποιήσουμε το άθροισμα των αποστάσεων, ελαχιστοποιούμε το άθροισμα των τετραγώνων των αποστάσεων. Κάνοντας αυτό βρίσκουμε του συντελεστές α και β της ευθείας, δηλαδή τους συντελεστές α και β του γραμμικού μοντέλου.

Για την περίπτωση που δεν έχουμε 2 μεταβλητές αλλά περισσότερες, π.χ. Υ και Χ1, Χ2, Χ3, …., τότε η μέθοδος είναι ακριβώς η ίδια μόνο που χρησιμοποιείται γεωμετρία περισσοτέρων διαστάσεων.

Ερώτηση 8

Ερώτηση:Τι είναι η μέθοδος μέγιστης πιθανοφάνειας;


Απάντηση


Είναι μια μέθοδος που χρησιμοποιείται για την εκτίμηση παραμέτρων γραμμικών και μη γραμμικών μοντέλων. Η εκτίμηση μίας παραμέτρου (π.χ. μέσος όρος, διακύμανση) με τη μέθοδο μέγιστης πιθανοφάνειας βασίζεται στη μεγιστοποίηση της πιθανότητας P(E; θ) να παρατηρηθεί μια τιμή Ε της παραμέτρου δεδομένου ότι η εκτιμήτρια της παραμέτρου έχει την τιμή θ. Δηλαδή στην πιθανότητα να παρατηρηθεί μία απάντηση δεδομένου ότι ισχύει το μοντέλο που έχουμε υποθέσει. Έτσι, ακολουθώντας τη μέθοδο της μέγιστης πιθανοφάνειας η εκτιμούμενη τιμή μιας μεταβλητής είναι αυτή για την οποία μεγιστοποιείται η πιθανότητα να προκύψουν οι παρατηρήσεις που έχουμε συλλέξει στο δείγμα μας.

Για παράδειγμα, ας υποθέσουμε ότι έχουμε ένα μοντέλο παλινδρόμησης Υ = α + β*Χ και θέλουμε να εκτιμήσουμε τις παραμέτρους α και β με βάση ένα δείγμα 100 συνδυασμών Υ και Χ (π.χ. τις απαντήσεις σε 2 ερωτήσεις ενός ερωτηματολογίου). Ακολουθώντας τη μέθοδο μέγιστης πιθανοφάνειας οι παράμετροι α και β είναι αυτές που μεγιστοποιούν την πιθανότητα να εμφανιστούν οι 100 αυτοί συνδυασμοί, αν υποτεθεί ότι το μοντέλο Υ = α + β*Χ που επιλέξαμε είναι σωστό.

Τρίτη 22 Μαΐου 2012

Interesting Website 2

A very useful website for spss tutorials:

http://surveyresearch.weebly.com/note-on-spss-tutorials.html

Interesting Website 1

A very useful website for calculating the oprimal sample size for surveys:

http://www.surveysystem.com/sscalc.htm

Ερώτηση 7

Ερώτηση:Υπάρχει περίπτωση ένα δείγμα ευκολίας σε μια δημοσκόπηση να είναι πιο αντιπροσωπευτικό ενός υπό μελέτη πληθυσμού από ένα τυχαίο δείγμα;

Απάντηση
 


Ναι. Σε μια δημοσκόπηση (έρευνα πεδίου), ένα δείγμα, ακόμα και στην υποθετική περίπτωση που επιλεγεί με εντελώς τυχαίο τρόπο και είναι αρκετά μεγάλο ώστε να θεωρηθεί αντιπροσωπευτικό,υπόκειται σε ένα μεγάλο περιορισμό. Ο περιορισμός αυτός έγκειται στο βαθμό ανταπόκρισης, στο ποσοστό δηλαδή των ατόμων που συμμετείχαν στην έρευνα προς τον αριθμό αυτών που προσεγγίστηκαν. Χαμηλός βαθμός ανταπόκρισης μειώνει την αντιπροσωπευτικότητα του δείγματος. Συλλέγοντας με προσεκτικό τρόπο δείγματα ευκολίας και τηρώντας τις δημογραφικές (ή/και ψυχογραφικές) αναλογίες του πληθυσμού αυξάνεται ο βαθμός ανταπόκρισης και άρα, ceteris paribus, η αντιπροσωπευτικότητα του δείγματος. Προφανώς αυτό δε σημαίνει ότι τα δείγματα ευκολίας είναι εν γένει πιο αντιπροσωπευτικά από τα τυχαία. Το αντίθετο ισχύει. Απλά, σε ορισμένες λίγες περιπτώσεις (π.χ. όταν είναι εκ των προτέρων γνωστό ότι ο βαθμός ανταπόκρισης σε μια δειγματοληψία ευκολίας θα είναι πολύ μικρός) μια προσεκτική δειγματοληψία ευκολίας μπορεί να διατηρήσει υψηλά επίπεδα αντιπροσωπευτικότητας.




Κυριακή 20 Μαΐου 2012

Ερώτηση 6

Ερώτηση: Το δείγμα που προκύπτει από μια απλή τυχαία δειγματοληψία είναι το αντιπροσωπευτικότερο από κάθε άλλη μέθοδο δειγματοληψίας;

Απάντηση

Όχι. Παρόλο που το δείγμα που προκύπτει από μια απλή τυχαία δειγματοληψία είναι αυτό που ικανοποιεί περισσότερο από κάθε άλλο το κριτήριο της τυχαιότητας, υπάρχουν άλλες μέθοδοι τυχαίας δειγματοληψίας που οδηγούν σε αντιπροσωπευτικότερα του πληθυσμού δείγματα. Τέτοιες μέθοδοι είναι άλλες δειγματοληψίες που οδηγούν σε δείγματα πιθανότητας όπως η στρωματοποιημένη τυχαία δειγματοληψία, η δειγματοληψία κατά ομάδες (clusters) κ.α.
Ο λόγος για τον οποίο αυτές οι μέθοδοι οδηγούν σε αντιπροσωπευτικότερα δείγματα είναι ότι προκαθορίζονται ορισμένες αναλογίες του πληθυσμού (π.χ. φύλλο, γεωγραφική κατανομή) και έτσι το δείγμα δίνει μια πιο αντιπροσωπευτική εικόνα του πληθυσμού. Οι συγκεκριμένες δειγματοληπτικές μέθοδοι όμως παρόλο που αυξάνουν την αντιπροσωπευτικότητα του δείγματος δεν παραβιάζουν ούτε μειώνουν την ισχύ του κανόνα της τυχαιότητας του δείγματος.

Σάββατο 19 Μαΐου 2012

Ερώτηση 5

Ερώτηση: Σε μία ποσοτική έρευνα, όταν ένας στατιστικός έλεγχος δεν επιβεβαιώνει μια ερευνητική υπόθεση, αυτό σημαίνει ότι ισχύει το αντίθετο της πρότασης αυτής;
Απάντηση

Όχι. Ας πάρουμε το παράδειγμα στο οποίο διατυπώνεται μία υπόθεση ότι μία συνεχής μεταβλητή επηρεάζεται από μία διχοτομική (π.χ. το εισόδημα ενός ατόμου επηρεάζεται από το φύλλο του). Στην πραγματικότητα η υπόθεση αυτή μεταφράζεται στο ότι οι μέσοι όροι δύο δειγμάτων (άντρες, γυναίκες) είναι διαφορετικοί. Ο αντίστοιχος στατιστικός έλεγχος (π.χ. t-test) εμπεριέχει δύο υποθέσεις:
ü                  Τη μηδενική υπόθεση Η0 à ότι οι 2 μέσοι όροι είναι ίσοι και,

ü                  Την εναλλακτική υπόθεση Η1 à ότι οι 2 μέσοι όροι είναι διαφορετικοί

Όπως παρατηρούμε δηλαδή η μηδενική υπόθεση του ελέγχου είναι αντίθετη με την ερευνητική μας υπόθεση. Αυτό συμβαίνει εν γένει με την πλειονότητα των στατιστικών ελέγχων.
Αυτό που κάνει ένας στατιστικός έλεγχος είναι να ελέγχει αν απορρίπτεται η Η0 έναντι της Η1. Προσοχή: να ελέγχει αν η υπόθεση απορρίπτεται, όχι αν επιβεβαιώνεται. Ποια είναι η διαφορά; Η εξής απλή: αν ο έλεγχος απορρίψει την Η0 τότε πράγματι ισχύει η Η1. Αν όμως δεν την απορρίψει αυτό δεν σημαίνει ότι η Η0 ισχύει γενικά. Για ένα άλλο δείγμα ή μια άλλη εναλλακτική υπόθεση η Η0 μπορεί να μην ισχύει.
Με απλά λόγια, ο λόγος που ισχύει αυτό είναι ότι σύμφωνα με τους κανόνες της λογικής μία εξαίρεση αρκεί για να απορρίψει τη γενική ισχύ ενός κανόνα. Αντίθετα μία παρατήρηση που συμφωνεί με τον κανόνα δεν αρκεί για να αποδείξει τον κανόνα. Για παράδειγμα σε μια αίθουσα με 40 μαθητές αν διαλέξω τυχαία ένα άτομο και είναι κορίτσι δε σημαίνει ότι όλοι οι μαθητές είναι κορίτσια. Σημαίνει όμως σίγουρα ότι όλοι οι μαθητές δεν είναι αγόρια. Έτσι με ένα μόνο δείγμα δεν μπορώ να αποδείξω ότι κάτι ισχύει γενικά, μπορώ μόνο να αποδείξω ότι δεν ισχύει γενικά.
Έτσι στο παράδειγμά μας, αυτό που μπορώ να αποδείξω είναι ότι οι άντρες δεν έχουν γενικά ίδια εισοδήματα με τις γυναίκες, ότι δηλαδή ισχύει η Η1 υπόθεση του ελέγχου και κατ’ επέκταση η ερευνητική μου υπόθεση. Δεν μπορώ να αποδείξω ότι οι άντρες γενικά έχουν ίδια εισοδήματα με τις γυναίκες, ότι δηλαδή ισχύει η Η0.
Σημείωση: Ειδικά στις κοινωνικές επιστήμες, αλλά και γενικότερα, οι ερευνητικές υποθέσεις είναι συνήθως αντίθετες με τις μηδενικές υποθέσεις.

Ερώτηση 4

Ερώτηση:Γιατί οι μη παραμετρικοί έλεγχοι είναι λιγότερο ισχυροί αλλά πιο ευσταθείς από τους αντίστοιχους παραμετρικούς;

Απάντηση

Με απλά λόγια, οι παραμετρικοί έλεγχοι χρησιμοποιούν περισσότερη πληροφορία από τους μη παραμετρικούς. Αυτό συμβαίνει γιατί οι πρώτοι χρησιμοποιούν την πληροφορία που προέρχεται από το δείγμα συν την πληροφορία που προέρχεται από την υπόθεση ότι τα δεδομένα ακολουθούν κάποια κατανομή. Από τη μία πλευρά, αυτή η επιπλέον πληροφορία  προσδίδει στον έλεγχο μεγαλύτερη δυνατότητα (πιθανότητα) εύρεσης υπαρχουσών σχέσεων και άρα τον καθιστά πιο ισχυρό. Από την άλλη πλευρά, εφόσον υπάρχει η πιθανότητα η επιπλέον αυτή πληροφορία να μην ισχύει, με τη χρήση της πληροφορίας αυτή αυξάνεται αυτόματα η πιθανότητα το εύρημα του ελέγχου να μην ισχύει και άρα αυξάνεται η αστάθεια του ελέγχου.

Ερώτηση 3

Ερώτηση: Οι μη παραμετρικοί έλεγχοι χρησιμοποιούνται όταν οι μεταβλητές ή τα κατάλοιπα δεν ακολουθούν την κανονική κατανομή. Σωστό ή λάθος;
Απάντηση
Λάθος. Στην προηγούμενη πρόταση υπάρχουν δύο ανακρίβειες. Οι μη παραμετρικοί έλεγχοι χρησιμοποιούνται όταν ο ερευνητής δεν κάνει την υπόθεση ότι οι μεταβλητές ή τα κατάλοιπα (βλ. ερώτηση χ) ακολουθούν κάποια κατανομή (και όχι μόνο την κανονική κατανομή). Άρα, πρώτον: οι μη παραμετρικοί έλεγχοι δεν έχουν να κάνουν μόνο με την κανονική κατανομή. Όταν, κάποιος επιλέγει να χρησιμοποιήσει έναν τέτοιο έλεγχο δεν υποθέτει ότι τα δεδομένα του ακολουθούν οποιαδήποτε κατανομή, γι αυτό το λόγο οι έλεγχοι αυτοί λέγονται και ελεύθεροι κατανομών και δεύτερον: Το γεγονός ότι χρησιμοποιείται ένας μη παραμετρικός έλεγχος δε σημαίνει ότι τα κατάλοιπα δεν ακολουθούν καμία κατανομή. Τα κατάλοιπα, κατά πάσα πιθανότητα ακολουθούν κάποια κατανομή, αλλά είτε ο ερευνητής δεν γνωρίζει ποια είναι αυτή, είτε δεν υπάρχουν μέθοδοι ανάλυσης για την κατανομή που ακολουθούν τα δεδομένα, και έτσι ο ερευνητής δεν κάνει την αντίστοιχη υπόθεση.

Ερώτηση 2

Ερώτηση: Τι είναι η ευστάθεια (Robustness) ενός στατιστικού ελέγχου;

Απάντηση:

Η ευστάθεια ενός στατιστικού ελέγχου είναι το μέγεθος που εκφράζει την πιθανότητα το αποτέλεσμα του ελέγχου να είναι λανθασμένο λόγω της μη ισχύς (η μερικής ισχύς) των υποθέσεων στις οποίες βασίζεται ο έλεγχος (π.χ. κανονικότητα, ετεροσκεδαστικότητα). Η ευστάθεια δηλαδή εκφράζει το βαθμό στον οποίο το αποτέλεσμα ενός ελέγχου εξαρτάται από την ισχύ των βασικών υποθέσεων. Ceteris paribus Ένας στατιστικός έλεγχος με μεγάλη ευστάθεια είναι πιο αξιόπιστος καθώς βασίζεται σε λιγότερες υποθέσεις. Για παράδειγμα οι μη παραμετρικοί έλεγχοι είναι περισσότερο ευσταθείς από τους παραμετρικούς ελέγχους στους οποίους είναι απαραίτητη η διατύπωση της υπόθεσης της κανονικότητας.

Ερώτηση 1

Ερώτηση: Τι είναι η ισχύς ενός στατιστικού ελέγχου;


Απάντηση
 
Η ισχύς ενός στατιστικού ελέγχου ορίζεται ως η πιθανότητα ο έλεγχος να απορρίψει την μηδενική υπόθεση του ελέγχου όταν αυτή δεν ισχύει. Στην πραγματικότητα δηλαδή η ισχύς ενός ελέγχου υποδεικνύει το πόσο πιθανό είναι να είναι σωστός ένας έλεγχος που έχει απορρίψει μια υπόθεση. Για το λόγο αυτό οι έλεγχοι με μεγάλη ισχύ απορρίπτουν πιο δύσκολα μια υπόθεση από ότι οι έλεγχοι με μικρή ισχύ (π.χ. μη παραμετρικοί έλεγχοι). Η ισχύς δηλαδή είναι μέτρο για το πόσο αυστηρός είναι ένας έλεγχος.