Αναζήτηση αυτού του ιστολογίου

Πέμπτη 7 Μαρτίου 2013

Ερώτηση 14

Ερώτηση:  Σε μια ποσοτική έρευνα πεδίου (field study) με δομημένα ερωτηματολόγια, τα ερωτηματολόγια που συλλέχθηκαν στη προκαταρκτική έρευνα (pre-test) μπορεί να συμπεριληφθεί στο τελικό δείγμα;

Απάντηση
Το σωστό είναι να μην συμπεριλαμβάνονται, καθώς ο βασικός λόγος για τον οποίο πραγματοποιείται το pre-test είναι για τη διόρθωση και βελτίωση του ερευνητικού εργαλείου, δηλαδή του ερωτηματολογίου. Έτσι, αν το pre-test έχει λειτουργήσει σωστά, το τελικό ερωτηματολόγιο θα πρέπει να είναι διαφορετικό (έστω και ελάχιστα) από αυτό που χρησιμοποιήθηκε στην προκαταρκτική έρευνα. Δεδομένου ότι το εργαλείο που χρησιμοποιήθηκε για τις μετρήσεις θα είναι διαφορετικό θα προκύψει πρόβλημα με την εγκυρότητα περιεχομένου (content validity).
Αν για κάποιο λόγο ο ερευνητής αποφασίσει ότι τα ερωτηματολόγια του pre-test πρέπει να χρησιμοποιηθούν οπωσδήποτε στην τελική έρευνα θα πρέπει να ελεγχθούν τα ακόλουθα έτσι ώστε να εξασφαλιστεί η ελάχιστη δυνατή εγκυρότητα των αποτελεσμάτων:
- Έλεγχος για την εγκυρότητα κριτηρίου (π.χ. οι συντελεστές συσχέτισης μεταξύ των μεταβλητών να είναι ίδιοι για τα δύο δείγματα).
- Έλεγχος για την εγκυρότητα περιεχομένου (π.χ. μέσω της διερεύνησης της άποψης ακαδημαϊκών και ερευνητών για το κατά πόσο οι αρχικές ερωτήσεις μετρούν το ίδιο μέγεθος με τις τελικές).
- Έλεγχος για την διατήρησης της αντιπροσωπευτικότητας του δείγματος (π.χ. έλεγχος των δημογραφικών χαρακτηριστικών των δύο δειγμάτων).

Πέμπτη 21 Φεβρουαρίου 2013

Ερώτηση 13

Ερώτηση: Υπάρχουν στατιστικοί έλεγχοι για τη διερεύνηση της φοράς (κατεύθυνσης) της αιτιότητας (causality) της σχέσης μεταξύ δύο μεταβλητών.

Απάντηση

Όχι. Αυτή είναι μια πολύ συχνή παρανόηση η οποία γίνεται, ειδικά στο χώρο των κοινωνικών επιστημών.

Στην πραγματικότητα, η φορά της αιτιότητας μιας σχέσης είναι ένα καθαρά θεωρητικό μέγεθος το οποίο δεν μπορεί να διερευνηθεί μέσω κάποιου στατιστικού ελέγχου. Οι στατιστικοί έλεγχοι που περιλαμβάνουν αιτιακές σχέσεις  (π.χ. γραμμική παλινδρόμηση) ελέγχουν την ισχύ των ερευνητικών υποθέσεων που έχει αναπτύξει ο ερευνητής. Στην πραγματικότητα δηλαδή η φορά της αιτιότητας δε διερευνάται μέσω του στατιστικού ελέγχου, αλλά υποθέτεται από τον ερευνητή. Ακόμα και αν ο στατιστικός έλεγχος επιβεβαιώσει την υπόθεση του ερευνητή, αυτό δεν επιβεβαιώνει τη φορά της αιτιότητας καθώς δεν αποκλείει ότι η υπό μελέτη σχέση δεν ισχύει (και) με την αντίθετη φορά αιτιότητας.

Ειδικότερα στις κοινωνικές επιστήμες πολλές φορές ορισμένες σχέσεις μεταξύ μεταβλητών μπορούν να ισχύουν και με τις δύο κατευθύνσεις της αιτιότητας. Σε τέτοιες περιπτώσεις, ο πιο δόκιμος τρόπος διερεύνησης της σχέσης είναι με τη χρήση της χρονικής αιτιότητας. Παρατηρώντας δηλαδή ποια από τις δύο μεταβλητές αφορά το μέγεθος το οποίο προηγείται χρονικά.
 
Π.χ. Η σχέση μεταξύ της ικανοποίησης ενός εργαζόμενου από τη δουλειά του και της εργασιακής του επίδοσης. Ισχύει ότι ένας εργαζόμενος όταν ικανοποιείται από τη δουλειά του, θα αποδίδει καλύτερα. Ισχύει όμως και το αντίθετο. Όταν αποδίδει καλά, αισθάνεται καλύτερα και άρα πιο ικανοποιημένος. Άρα, για τη διατύπωση της αντίστοιχης ερευνητικής υπόθεσης θα πρέπει να χρησιμοποιηθεί η χρονική αιτιότητα.

Ερώτηση 12

Ερώτηση: Γιατί μερικές φορές οι βαθμοί ελευθερίας δεν είναι ακέραιοι αριθμοί;

Απάντηση

Μερικές φορές στο output ορισμένων στατιστικών πακέτων οι βαθμοί ελευθερίας δεν είναι ακέραιοι αριθμοί αλλά δεκαδικοί. Ο λόγος για την εμφάνιση αυτών των δεκαδικών βαθμών ελευθερίας είναι ότι συνήθως υπάρχουν δύο ή περισσότερα αθροίσματα τετραγώνων που όταν συνδυάζονται δεν οδηγούν σε t ή F κατανομές αλλά στις αντίστοιχες προσεγγίσεις τους (π.χ. Ανάλυση διακύμανσης με επαναλαμβανόμενες μετρήσεις). Σε τέτοιες περιπτώσεις προκειμένου να ξεπεραστούν τα προβλήματα με την ετερογένεια της διακύμανσης, χρησιμοποιείται ένας διορθωτικός συντελεστής (μεταξύ 0 και 1) που ονομάζεται έψιλον ο οποίος επηρεάζει τους βαθμούς ελευθερίας και σε πολλές περιπτώσεις οδηγεί σε μη ακέραιους βαθμούς ελευθερίας.

Παρασκευή 18 Ιανουαρίου 2013

Ερώτηση 11

Ερώτηση: Τι είναι η βαθμοί ελευθερίας;


Απάντηση

Οι βαθμοί ελευθερίας μίας στατιστικής ανάλυσης είναι ένας αριθμός, ο οποίος υποδηλώνει πόσες παράμετροι μπορούν να εκτιμηθούν από την ανάλυση. Δηλαδή για πόσες άγνωστες παραμέτρους μπορεί να βρεθεί μια μέση τιμή και μία τυπική απόκλιση. Για να μπορεί να γίνει αυτό θα πρέπει να μπορούν να υπολογιστούν πάνω από μία πιθανή τιμή της παραμέτρου,καθώς για να υπολογιστεί η τυπική απόκλιση χρειάζονται πάνω από μία τιμές.

Π.χ. αν έχουμε δύο μεταβλητές Χ και Υ και γνωρίζουμε ότι αυτές οι μεταβλητές έχουν γραμμική σχέση (δηλαδή Υ = α*Χ), βρείτε μια εκτίμηση του α.

1) Αν έχουμε δείγμα μεγέθους 1, δηλαδή μία δυάδα τιμών για τα Χ και Υ π.χ. Χ = 1 και Υ = 2, το α δεν μπορεί εκτιμηθεί.

2)Αν έχουμε δείγμα μεγέθους 2, δηλαδή δύο δυάδες τιμών, π.χ. (1,2) και (2,6) τότε η μέση τιμή του α είναι 2,5 και η τυπική απόκλιση 0,5αφού:

Εξίσωση 1η: Υ = α1*Χ => 2 = α1*1 => α1 = 2

Εξίσωση 2η: Υ = α2*Χ => 6 = α2*2 => α2 = 3

Άρα


Μέση τιμή α = 2,5 και Τυπική απόκλιση = 0,5

Γενικά: Για να μπορεί να εκτιμηθούν κάποιες παράμετροι πρέπει οι εξισώσεις να είναι περισσότερες κατά 1 από τις παραμέτρους. Τη διαφορά λοιπόν του αριθμού των εξισώσεων που σχηματίζονται από το δείγμα, με τον αριθμό των παραμέτρων που πρέπει να εκτιμηθούν, την ονομάζουμε Βαθμούς Ελευθερίας (DF).

DF = #Εξισώσεων - # Παραμέτρων, γι αυτό το λόγο πρέπει DF > 1

Πέμπτη 1 Νοεμβρίου 2012

Ερώτηση 10


Ερώτηση: Γιατί στον έλεγχο Χ τετράγωνο (καλής προσαρμογής), σε αντίθεση με τους υπόλοιπους ελέγχους, η απόρριψη της ερευνητικής υπόθεσης γίνεται όταν το παρατηρούμενο επίπεδο σημαντικότητας (significance) του ελέγχου είναι μεγαλύτερο από το χρησιμοποιούμενο επίπεδο σημαντικότητας (π.χ. 0.05);
Απάντηση
Η απάντηση στο ερώτημα αυτό δεν άπτεται της φύσης της στατιστικής ανάλυσης αλλά του μεθοδολογικού σχεδιασμού της εκάστοτε μελέτης και συγκεκριμένα της διατύπωσης των ερευνητικών υποθέσεων. Ειδικά στις κοινωνικές επιστήμες, αλλά και γενικότερα, οι ερευνητικές υποθέσεις είναι συνήθως αντίθετες με τις μηδενικές υποθέσεις των ελέγχων που χρησιμοποιούνται για την επιβεβαίωσή τους. Έτσι όταν απορρίπτεται η ισχύς της μηδενικής υπόθεσης, ο ερευνητής κάνει την παραδοχή ότι η ερευνητική υπόθεση της μελέτης ισχύει. Ως γνωστόν η μηδενική υπόθεση ενός ελέγχου απορρίπτεται (και άρα η ερευνητική υπόθεση γίνεται αποδεκτή) εάν το significance του ελέγχου είναι μικρότερο από το χρησιμοποιούμενο επίπεδο σημαντικότητας.

 Στον ακόλουθο πίνακα παρατηρούμε ορισμένα παραδείγματα ερευνητικών υποθέσεων και των αντίστοιχων μηδενικών υποθέσεων των ελέγχων.


Ερευνητική υπόθεση

Ανάλυση

Μηδενική Υπόθεση

Το φύλλο επηρεάζει το μέσο εισόδημα

T-test

Οι μέσοι όροι του εισοδήματος για τα δύο φύλλα είναι ίσοι

Το χρώμα της συσκευασία επηρεάζει τις πωλήσεις

ANOVA

Οι μέσοι όροι των πωλήσεων για τις 4 συσκευασίες διαφορετικών χρωμάτων είναι ίσοι

Η ικανοποίηση από μία αγορά (συνεχής) επηρεάζει την πρόθεση επαναγοράς (συνεχής)

Γραμμική

Παλινδρόμηση

Ο συντελεστής b της ανεξάρτητης μεταβλητής είναι διάφορος του μηδενός

 Στην περίπτωση του ελέγχου X τετράγωνο καλής προσαρμογής η ερευνητική υπόθεση της εκάστοτε μελέτης έχει την ίδια κατεύθυνση με τη μηδενική υπόθεση του στατιστικού ελέγχου. Συγκεκριμένα, η ερευνητική υπόθεση είναι ότι τα δεδομένα του δείγματος προσαρμόζονται (fit) στο ερευνητικό μοντέλο ενώ η μηδενική υπόθεση του ελέγχου είναι ότι η κατανομή των δεδομένων του δείγματος ταυτίζεται με την κατανομή που έχει υποθέσει ο ερευνητής για το ερευνητικό μοντέλο της μελέτης.

Παρασκευή 8 Ιουνίου 2012

Ερώτηση 9

Ερώτηση: Τι είναι η μέθοδος ελαχίστων τετραγώνων;

Απάντηση

Είναι μια μέθοδος που χρησιμοποιείται για την εκτίμηση παραμέτρων γραμμικών μοντέλων. Στην πιο απλή περίπτωση που έχουμε δύο μεταβλητές Χ και Υ και θέλουμε να διερευνήσουμε την μεταξύ τους γραμμική σχέση, κάθε παρατήρηση του δείγματος θα είναι μια δυάδα αριθμών, δηλαδή ένα σημείο στο διάγραμμα της Χ με την Υ. Η εξίσωση του γραμμικού μοντέλου που θέλουμε να βρούμε, θα συμβολίζεται στο διάγραμμα ως η ευθεία γραμμή* που θα είναι η πιο κοντινή στα σημεία που έχουν προκύψει από τις παρατηρήσεις του δείγματος.

*Θυμίζουμε: Μια εξίσωση γραμμικής παλινδρόμησης έχει τη μορφή Υ = α + β*Χ, η οποία στην αναλυτική γεωμετρία συμβολίζει μια ευθεία γραμμή.

Πώς λοιπόν βρίσκουμε τους συντελεστές της ευθείας αυτής; Προσθέτοντας τις αποστάσεις όλων των σημείων από την ευθεία και ελαχιστοποιώντας το άθροισμα που προκύπτει. Αν όμως προσθέσουμε απλά τις αποστάσεις το άθροισμα θα είναι 0, αφού τα μισά σημεία θα είναι πάνω από την ευθεία και τα άλλα μισά κάτω από την ευθεία. Έτσι αντί να ελαχιστοποιήσουμε το άθροισμα των αποστάσεων, ελαχιστοποιούμε το άθροισμα των τετραγώνων των αποστάσεων. Κάνοντας αυτό βρίσκουμε του συντελεστές α και β της ευθείας, δηλαδή τους συντελεστές α και β του γραμμικού μοντέλου.

Για την περίπτωση που δεν έχουμε 2 μεταβλητές αλλά περισσότερες, π.χ. Υ και Χ1, Χ2, Χ3, …., τότε η μέθοδος είναι ακριβώς η ίδια μόνο που χρησιμοποιείται γεωμετρία περισσοτέρων διαστάσεων.

Ερώτηση 8

Ερώτηση:Τι είναι η μέθοδος μέγιστης πιθανοφάνειας;


Απάντηση


Είναι μια μέθοδος που χρησιμοποιείται για την εκτίμηση παραμέτρων γραμμικών και μη γραμμικών μοντέλων. Η εκτίμηση μίας παραμέτρου (π.χ. μέσος όρος, διακύμανση) με τη μέθοδο μέγιστης πιθανοφάνειας βασίζεται στη μεγιστοποίηση της πιθανότητας P(E; θ) να παρατηρηθεί μια τιμή Ε της παραμέτρου δεδομένου ότι η εκτιμήτρια της παραμέτρου έχει την τιμή θ. Δηλαδή στην πιθανότητα να παρατηρηθεί μία απάντηση δεδομένου ότι ισχύει το μοντέλο που έχουμε υποθέσει. Έτσι, ακολουθώντας τη μέθοδο της μέγιστης πιθανοφάνειας η εκτιμούμενη τιμή μιας μεταβλητής είναι αυτή για την οποία μεγιστοποιείται η πιθανότητα να προκύψουν οι παρατηρήσεις που έχουμε συλλέξει στο δείγμα μας.

Για παράδειγμα, ας υποθέσουμε ότι έχουμε ένα μοντέλο παλινδρόμησης Υ = α + β*Χ και θέλουμε να εκτιμήσουμε τις παραμέτρους α και β με βάση ένα δείγμα 100 συνδυασμών Υ και Χ (π.χ. τις απαντήσεις σε 2 ερωτήσεις ενός ερωτηματολογίου). Ακολουθώντας τη μέθοδο μέγιστης πιθανοφάνειας οι παράμετροι α και β είναι αυτές που μεγιστοποιούν την πιθανότητα να εμφανιστούν οι 100 αυτοί συνδυασμοί, αν υποτεθεί ότι το μοντέλο Υ = α + β*Χ που επιλέξαμε είναι σωστό.