Ανάλυση της διακύμανσης. Πολυμεταβλητή ανάλυση διασποράς ANOVA μοντέλο συνιστωσών διακύμανσης

Ανάλυση της διακύμανσης

1. Έννοια της ανάλυσης διασποράς

Ανάλυση της διακύμανσηςείναι μια ανάλυση της μεταβλητότητας ενός χαρακτηριστικού υπό την επίδραση οποιωνδήποτε ελεγχόμενων μεταβλητών παραγόντων. Στην ξένη βιβλιογραφία, η ανάλυση διακύμανσης αναφέρεται συχνά ως ANOVA, η οποία μεταφράζεται ως ανάλυση μεταβλητότητας (Analysis of Variance).

Πρόβλημα ANOVAσυνίσταται στην απομόνωση μεταβλητότητας διαφορετικού είδους από τη γενική μεταβλητότητα ενός χαρακτηριστικού:

α) μεταβλητότητα λόγω της δράσης καθεμιάς από τις υπό μελέτη ανεξάρτητες μεταβλητές·

β) μεταβλητότητα λόγω της αλληλεπίδρασης των ανεξάρτητων μεταβλητών που μελετώνται.

γ) τυχαία μεταβλητότητα που οφείλεται σε όλες τις άλλες άγνωστες μεταβλητές.

Η μεταβλητότητα λόγω της δράσης των υπό μελέτη μεταβλητών και η αλληλεπίδρασή τους συσχετίζεται με την τυχαία μεταβλητότητα. Ένας δείκτης αυτής της σχέσης είναι το Fisher's F test.

Ο τύπος για τον υπολογισμό του κριτηρίου F περιλαμβάνει εκτιμήσεις διακυμάνσεων, δηλαδή τις παραμέτρους κατανομής του χαρακτηριστικού, επομένως το κριτήριο F είναι ένα παραμετρικό κριτήριο.

Όσο περισσότερο η μεταβλητότητα ενός χαρακτηριστικού οφείλεται στις υπό μελέτη μεταβλητές (παράγοντες) ή στην αλληλεπίδρασή τους, τόσο υψηλότερη εμπειρικές τιμές κριτηρίου.

Μηδέν η υπόθεση στην ανάλυση της διακύμανσης θα αναφέρει ότι οι μέσες τιμές του μελετημένου αποτελεσματικού χαρακτηριστικού είναι οι ίδιες σε όλες τις διαβαθμίσεις.

Εναλλακτική λύση η υπόθεση θα αναφέρει ότι οι μέσες τιμές του προκύπτοντος χαρακτηριστικού σε διαφορετικές διαβαθμίσεις του υπό μελέτη παράγοντα είναι διαφορετικές.

Η ανάλυση διακύμανσης μας επιτρέπει να δηλώσουμε μια αλλαγή σε ένα χαρακτηριστικό, αλλά δεν υποδεικνύει κατεύθυνσηαυτές οι αλλαγές.

Ας ξεκινήσουμε την εξέταση της ανάλυσης διασποράς με την απλούστερη περίπτωση, όταν μελετάμε τη δράση του μόνο έναςμεταβλητή (ένας παράγοντας).

2. Μονόδρομη ανάλυση διακύμανσης για άσχετα δείγματα

2.1. Σκοπός της μεθόδου

Η μέθοδος της μονοπαραγοντικής ανάλυσης διακύμανσης χρησιμοποιείται σε περιπτώσεις όπου οι αλλαγές σε ένα αποτελεσματικό χαρακτηριστικό μελετώνται υπό την επίδραση μεταβαλλόμενων συνθηκών ή διαβαθμίσεων ενός παράγοντα. Σε αυτή την έκδοση της μεθόδου, η επιρροή καθεμιάς από τις διαβαθμίσεις του παράγοντα είναι διαφορετικόςδείγματα θεμάτων. Πρέπει να υπάρχουν τουλάχιστον τρεις διαβαθμίσεις του παράγοντα. (Μπορεί να υπάρχουν δύο διαβαθμίσεις, αλλά σε αυτή την περίπτωση δεν θα μπορέσουμε να δημιουργήσουμε μη γραμμικές εξαρτήσεις και φαίνεται πιο λογικό να χρησιμοποιήσουμε απλούστερες).

Μια μη παραμετρική έκδοση αυτού του τύπου ανάλυσης είναι η δοκιμή Kruskal-Wallis H.

Υποθέσεις

H 0: Οι διαφορές μεταξύ των βαθμών παραγόντων (διαφορετικές συνθήκες) δεν είναι μεγαλύτερες από τις τυχαίες διαφορές σε κάθε ομάδα.

H 1: Οι διαφορές μεταξύ βαθμών παραγόντων (διαφορετικές συνθήκες) είναι μεγαλύτερες από τις τυχαίες διαφορές σε κάθε ομάδα.

2.2. Περιορισμοί Μονόδρομης Ανάλυσης Διακύμανσης για Μη Σχετικά Δείγματα

1. Η μονόδρομη ανάλυση διακύμανσης απαιτεί τουλάχιστον τρεις διαβαθμίσεις του παράγοντα και τουλάχιστον δύο υποκείμενα σε κάθε διαβάθμιση.

2. Το χαρακτηριστικό που προκύπτει πρέπει να κατανέμεται κανονικά στο υπό μελέτη δείγμα.

Είναι αλήθεια ότι συνήθως δεν υποδεικνύεται αν μιλάμε για την κατανομή του χαρακτηριστικού σε ολόκληρο το δείγμα της έρευνας ή σε εκείνο το τμήμα του που αποτελεί το σύμπλεγμα διασποράς.

3. Παράδειγμα επίλυσης προβλήματος χρησιμοποιώντας τη μέθοδο της μονόδρομης ανάλυσης διακύμανσης για άσχετα δείγματα χρησιμοποιώντας το παράδειγμα:

Σε τρεις διαφορετικές ομάδες των έξι ατόμων δόθηκαν λίστες με δέκα λέξεις. Οι λέξεις παρουσιάστηκαν στην πρώτη ομάδα με χαμηλή ταχύτητα - 1 λέξη ανά 5 δευτερόλεπτα, στη δεύτερη ομάδα με μέση ταχύτητα - 1 λέξη ανά 2 δευτερόλεπτα και στην τρίτη ομάδα με υψηλή ταχύτητα - 1 λέξη ανά δευτερόλεπτο. Η απόδοση αναπαραγωγής προβλέφθηκε ότι εξαρτάται από την ταχύτητα παρουσίασης της λέξης. Τα αποτελέσματα παρουσιάζονται στον Πίνακα. 1.

Αριθμός λέξεων που αναπαράχθηκαν Τραπέζι 1

Θέμα Αρ.

χαμηλή ταχύτητα

μέση ταχύτητα

υψηλή ταχύτητα

συνολικό ποσό

H 0: Διαφορές στο εύρος παραγωγής λέξεων μεταξύοι ομάδες δεν είναι πιο έντονες από τις τυχαίες διαφορές μέσακάθε ομάδα.

H1: Διαφορές στον όγκο παραγωγής λέξεων μεταξύοι ομάδες είναι πιο έντονες από τις τυχαίες διαφορές μέσακάθε ομάδα. Χρησιμοποιώντας τις πειραματικές τιμές που παρουσιάζονται στον Πίνακα. 1, θα καθορίσουμε ορισμένες τιμές που θα είναι απαραίτητες για τον υπολογισμό του κριτηρίου F.

Ο υπολογισμός των κύριων ποσοτήτων για μονόδρομη ανάλυση διασποράς παρουσιάζεται στον πίνακα:

πίνακας 2

Πίνακας 3

Ακολουθία πράξεων σε μονόδρομη ανάλυση διακύμανσης για άσχετα δείγματα

Συχνά που βρίσκεται σε αυτόν και στους επόμενους πίνακες, η ονομασία SS είναι μια συντομογραφία για το "άθροισμα τετραγώνων". Αυτή η συντομογραφία χρησιμοποιείται συχνότερα σε μεταφρασμένες πηγές.

SS γεγονόςσημαίνει τη μεταβλητότητα του χαρακτηριστικού λόγω της δράσης του υπό μελέτη παράγοντα·

SS γενικά- γενική μεταβλητότητα του χαρακτηριστικού.

μικρό C.A.-μεταβλητότητα λόγω μη καταγεγραμμένων παραγόντων, «τυχαία» ή «υπολειπόμενη» μεταβλητότητα.

Κυρία- «μέσο τετράγωνο», ή η μαθηματική προσδοκία του αθροίσματος των τετραγώνων, η μέση τιμή του αντίστοιχου SS.

df - ο αριθμός των βαθμών ελευθερίας, τους οποίους, όταν εξετάζουμε μη παραμετρικά κριτήρια, σημειώνουμε με ένα ελληνικό γράμμα v.

Συμπέρασμα: Το H 0 απορρίπτεται. Το H 1 γίνεται αποδεκτό. Οι διαφορές στην ανάκληση λέξεων μεταξύ των ομάδων ήταν μεγαλύτερες από τις τυχαίες διαφορές σε κάθε ομάδα (α=0,05). Άρα, η ταχύτητα παρουσίασης των λέξεων επηρεάζει τον όγκο της αναπαραγωγής τους.

Ένα παράδειγμα επίλυσης του προβλήματος στο Excel παρουσιάζεται παρακάτω:

Αρχικά δεδομένα:

Χρησιμοποιώντας την εντολή: Εργαλεία->Ανάλυση δεδομένων->Μονόδρομη ANOVA, έχουμε τα ακόλουθα αποτελέσματα:

Όπως έχει ήδη σημειωθεί, η μέθοδος διασποράς σχετίζεται στενά με στατιστικές ομαδοποιήσεις και προϋποθέτει ότι ο υπό μελέτη πληθυσμός χωρίζεται σε ομάδες ανάλογα με τα χαρακτηριστικά των παραγόντων, η επίδραση των οποίων πρέπει να μελετηθεί.

Με βάση την ανάλυση διακύμανσης, παράγονται τα ακόλουθα:

1. αξιολόγηση της αξιοπιστίας των διαφορών στα μέσα της ομάδας για ένα ή περισσότερα χαρακτηριστικά παραγόντων·

2. αξιολόγηση της αξιοπιστίας των αλληλεπιδράσεων παραγόντων.

3. αξιολόγηση των μερικών διαφορών μεταξύ ζευγών μέσων.

Η εφαρμογή της ανάλυσης διακύμανσης βασίζεται στον νόμο της αποσύνθεσης των διακυμάνσεων (παραλλαγών) ενός χαρακτηριστικού σε συνιστώσες.

Η συνολική διακύμανση D o του προκύπτοντος χαρακτηριστικού κατά την ομαδοποίηση μπορεί να αποσυντεθεί στα ακόλουθα στοιχεία:

1. να διαομαδοποιηθούν D m που σχετίζεται με ένα χαρακτηριστικό ομαδοποίησης.

2. για υπολειμματικά(εντός ομάδας) D B που δεν σχετίζεται με το χαρακτηριστικό ομαδοποίησης.

Η σχέση μεταξύ αυτών των δεικτών εκφράζεται ως εξής:

D o = D m + D in. (1.30)

Ας δούμε τη χρήση της ανάλυσης διασποράς με ένα παράδειγμα.

Ας υποθέσουμε ότι θέλετε να αποδείξετε εάν οι ημερομηνίες σποράς επηρεάζουν τις αποδόσεις του σιταριού. Τα αρχικά πειραματικά δεδομένα για την ανάλυση διασποράς παρουσιάζονται στον πίνακα. 8.

Πίνακας 8

Σε αυτό το παράδειγμα, N = 32, K = 4, l = 8.

Ας προσδιορίσουμε τη συνολική συνολική διακύμανση στην απόδοση, η οποία είναι το άθροισμα των τετραγωνικών αποκλίσεων των μεμονωμένων τιμών ενός χαρακτηριστικού από τον συνολικό μέσο όρο:

όπου N είναι ο αριθμός των πληθυσμιακών μονάδων. Y i – μεμονωμένες τιμές απόδοσης. Y o είναι η συνολική μέση απόδοση για ολόκληρο τον πληθυσμό.

Για να προσδιοριστεί η συνολική διακύμανση μεταξύ ομάδων, η οποία καθορίζει τη διακύμανση του αποτελεσματικού χαρακτηριστικού λόγω του παράγοντα που μελετάται, είναι απαραίτητο να γνωρίζουμε τις μέσες τιμές του αποτελεσματικού χαρακτηριστικού για κάθε ομάδα. Αυτή η συνολική διακύμανση ισούται με το άθροισμα των τετραγωνικών αποκλίσεων των μέσων όρων της ομάδας από τη συνολική μέση τιμή του χαρακτηριστικού, σταθμισμένη με τον αριθμό των πληθυσμιακών μονάδων σε κάθε ομάδα:

Η συνολική διακύμανση εντός της ομάδας ισούται με το άθροισμα των τετραγωνικών αποκλίσεων των μεμονωμένων τιμών ενός χαρακτηριστικού από τους μέσους όρους της ομάδας για κάθε ομάδα, αθροιζόμενοι σε όλες τις ομάδες του πληθυσμού.

Η επίδραση ενός παράγοντα στο προκύπτον χαρακτηριστικό εκδηλώνεται στη σχέση μεταξύ Dm και Dv: όσο ισχυρότερη είναι η επίδραση του παράγοντα στην τιμή του χαρακτηριστικού που μελετάται, τόσο μεγαλύτερο είναι το Dm και τόσο λιγότερο Dv.

Για να πραγματοποιηθεί η ανάλυση της διακύμανσης, είναι απαραίτητο να καθοριστούν οι πηγές διακύμανσης σε ένα χαρακτηριστικό, ο όγκος διακύμανσης ανά πηγή και να προσδιοριστεί ο αριθμός των βαθμών ελευθερίας για κάθε συστατικό της παραλλαγής.

Το μέγεθος της παραλλαγής έχει ήδη καθοριστεί· τώρα είναι απαραίτητο να προσδιοριστεί ο αριθμός των βαθμών ελευθερίας παραλλαγής. Αριθμός βαθμών ελευθερίας είναι ο αριθμός των ανεξάρτητων αποκλίσεων των μεμονωμένων τιμών ενός χαρακτηριστικού από τη μέση τιμή του. Ο συνολικός αριθμός βαθμών ελευθερίας, που αντιστοιχεί στο συνολικό άθροισμα των τετραγωνικών αποκλίσεων σε ANOVA, αποσυντίθεται σε συνιστώσες διακύμανσης. Έτσι, το συνολικό άθροισμα των τετραγωνικών αποκλίσεων D o αντιστοιχεί στον αριθμό των βαθμών ελευθερίας διακύμανσης ίσο με N – 1 = 31. Η ομαδική παραλλαγή D m αντιστοιχεί στον αριθμό των βαθμών ελευθερίας μεταβολής ίσου με K – 1 = 3. Η υπολειπόμενη διακύμανση εντός της ομάδας αντιστοιχεί στον αριθμό των βαθμών ελευθερίας μεταβολής ίσου με N – K = 28.


Τώρα, γνωρίζοντας το άθροισμα των τετραγωνικών αποκλίσεων και τον αριθμό των βαθμών ελευθερίας, μπορούμε να προσδιορίσουμε τις διακυμάνσεις για κάθε συνιστώσα. Ας υποδηλώσουμε αυτές τις διακυμάνσεις: d m - ομάδα και d σε - ενδοομάδα.

Αφού υπολογίσουμε αυτές τις διακυμάνσεις, θα προχωρήσουμε στον καθορισμό της σημασίας της επίδρασης του παράγοντα στο χαρακτηριστικό που προκύπτει. Για να γίνει αυτό, βρίσκουμε την αναλογία: d M / d B = F f,

Η ποσότητα F f, καλούμενη Κριτήριο Fisher , σε σύγκριση με τον πίνακα, πίνακας F. Όπως έχει ήδη σημειωθεί, εάν F f > F πίνακας, τότε η επίδραση του παράγοντα στο ενεργό χαρακτηριστικό έχει αποδειχθεί. Αν F f< F табл то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, следовательно, не доказывает с достаточной вероятностью влияние изучаемого фактора.

Η θεωρητική τιμή συνδέεται με την πιθανότητα και στον πίνακα η τιμή της δίνεται σε ένα ορισμένο επίπεδο πιθανότητας της κρίσης. Το παράρτημα περιέχει έναν πίνακα που σας επιτρέπει να ορίσετε την πιθανή τιμή του F για την πιθανότητα κρίσης, την πιο συχνά χρησιμοποιούμενη: το επίπεδο πιθανότητας της «μηδενικής υπόθεσης» είναι 0,05. Αντί για τις πιθανότητες της «μηδενικής υπόθεσης», ο πίνακας μπορεί να ονομαστεί πίνακας για την πιθανότητα 0,95 της σημασίας της επιρροής του παράγοντα. Η αύξηση του επιπέδου πιθανότητας απαιτεί υψηλότερη τιμή F του πίνακα για σύγκριση.

Η τιμή του πίνακα F εξαρτάται επίσης από τον αριθμό των βαθμών ελευθερίας των δύο διασπορών που συγκρίνονται. Εάν ο αριθμός των βαθμών ελευθερίας τείνει στο άπειρο, τότε ο πίνακας F τείνει προς τη μονάδα.

Ο πίνακας τιμών του πίνακα F κατασκευάζεται ως εξής: οι στήλες του πίνακα υποδεικνύουν τους βαθμούς ελευθερίας διακύμανσης για τη μεγαλύτερη διασπορά και οι σειρές υποδεικνύουν τους βαθμούς ελευθερίας για τη μικρότερη (εντός της ομάδας) διασπορά. Η τιμή του F βρίσκεται στην τομή της στήλης και της γραμμής των αντίστοιχων βαθμών ελευθερίας μεταβολής.

Έτσι, στο παράδειγμά μας, F f = 21,3/3,8 = 5,6. Η πινακοποιημένη τιμή του πίνακα F για πιθανότητα 0,95 και βαθμούς ελευθερίας, αντίστοιχα ίσες με 3 και 28, πίνακας F = 2,95.

Η τιμή του F f που λαμβάνεται πειραματικά υπερβαίνει τη θεωρητική τιμή ακόμη και για πιθανότητα 0,99. Κατά συνέπεια, η εμπειρία με πιθανότητα μεγαλύτερη από 0,99 αποδεικνύει την επίδραση του παράγοντα που μελετήθηκε στην απόδοση, δηλαδή η εμπειρία μπορεί να θεωρηθεί αξιόπιστη, αποδεδειγμένη και επομένως ο χρόνος σποράς έχει σημαντικό αντίκτυπο στην απόδοση του σιταριού. Η βέλτιστη περίοδος σποράς θα πρέπει να θεωρείται η περίοδος από τις 10 έως τις 15 Μαΐου, καθώς κατά τη διάρκεια αυτής της περιόδου σποράς επιτεύχθηκαν τα καλύτερα αποτελέσματα απόδοσης.

Εξετάσαμε τη μέθοδο ανάλυσης διασποράς κατά την ομαδοποίηση κατά ένα χαρακτηριστικό και την τυχαία κατανομή των αντιγράφων εντός της ομάδας. Ωστόσο, συμβαίνει συχνά το πειραματικό οικόπεδο να έχει κάποιες διαφορές στη γονιμότητα του εδάφους κ.λπ. Επομένως, μπορεί να προκύψει μια κατάσταση ότι μεγαλύτερος αριθμός οικοπέδων μιας από τις επιλογές θα πέσει στο καλύτερο μέρος και οι δείκτες του θα υπερεκτιμηθούν και της άλλης επιλογής - κατά το χειρότερο μέρος, και τα αποτελέσματα σε αυτήν την περίπτωση φυσικά θα είναι χειρότερα, δηλαδή υποτιμημένα.

Για να αποκλειστεί η παραλλαγή που προκαλείται από λόγους που δεν σχετίζονται με το πείραμα, είναι απαραίτητο να απομονωθεί η διακύμανση που υπολογίζεται από τα αντίγραφα (μπλοκ) από τη διακύμανση εντός της ομάδας (υπολειπόμενη).

Το συνολικό άθροισμα των τετραγωνικών αποκλίσεων χωρίζεται σε αυτή την περίπτωση σε 3 συνιστώσες:

D o = D m + D επανάληψη + D ανάπαυση. (1.33)

Για το παράδειγμά μας, το άθροισμα των τετραγωνικών αποκλίσεων που προκαλούνται από τις επαναλήψεις θα είναι ίσο με:

Επομένως, το πραγματικό τυχαίο άθροισμα των τετραγωνικών αποκλίσεων θα είναι ίσο με:

D υπόλοιπο = D σε – D επανάληψη; D ανάπαυση = 106 – 44 = 62.

Για την υπολειπόμενη διασπορά, ο αριθμός των βαθμών ελευθερίας θα είναι ίσος με 28 – 7 = 21. Τα αποτελέσματα της ανάλυσης διασποράς παρουσιάζονται στον πίνακα. 9.

Πίνακας 9

Δεδομένου ότι οι πραγματικές τιμές του κριτηρίου F για πιθανότητα 0,95 υπερβαίνουν τις πινακοποιημένες, η επίδραση των ημερομηνιών σποράς και των επαναλήψεων στην απόδοση του σίτου θα πρέπει να θεωρείται σημαντική. Η εξεταζόμενη μέθοδος κατασκευής ενός πειράματος, όταν η τοποθεσία χωρίζεται προκαταρκτικά σε μπλοκ με σχετικά ευθυγραμμισμένες συνθήκες και οι δοκιμασμένες επιλογές κατανέμονται εντός του μπλοκ με τυχαία σειρά, ονομάζεται μέθοδος τυχαιοποιημένων μπλοκ.

Χρησιμοποιώντας την ανάλυση διακύμανσης, μπορείτε να μελετήσετε την επίδραση όχι μόνο ενός παράγοντα στο αποτέλεσμα, αλλά δύο ή περισσότερων. Η ανάλυση διασποράς σε αυτή την περίπτωση θα κληθεί πολυμεταβλητή ανάλυση διασποράς .

Αμφίδρομη ANOVA διαφέρει από δύο μονοπαράγοντες στο ότι μπορεί να απαντήσει στις ακόλουθες ερωτήσεις:

1. 1 Ποια είναι η επίδραση και των δύο παραγόντων μαζί;

2. Ποιος είναι ο ρόλος του συνδυασμού αυτών των παραγόντων;

Ας εξετάσουμε μια ανάλυση διακύμανσης του πειράματος, στην οποία είναι απαραίτητο να προσδιοριστεί η επίδραση όχι μόνο των ημερομηνιών σποράς, αλλά και των ποικιλιών στην απόδοση σιταριού (Πίνακας 10).

Πίνακας 10. Πειραματικά δεδομένα για την επίδραση των ημερομηνιών και των ποικιλιών σποράς στην απόδοση του σίτου

είναι το άθροισμα των τετραγωνικών αποκλίσεων των μεμονωμένων τιμών από τον συνολικό μέσο όρο.

Διακύμανση στην κοινή επίδραση του χρόνου σποράς και της ποικιλίας

είναι το άθροισμα των τετραγωνικών αποκλίσεων του μέσου όρου της υποομάδας από τον συνολικό μέσο όρο, σταθμισμένο με τον αριθμό των επαναλήψεων, δηλαδή κατά 4.

Υπολογισμός διακύμανσης με βάση την επίδραση μόνο του χρόνου σποράς:

Η υπολειπόμενη διακύμανση ορίζεται ως η διαφορά μεταξύ της συνολικής διακύμανσης και της διακύμανσης στην κοινή επίδραση των παραγόντων που μελετήθηκαν:

D ανάπαυση = D o – D ps = 170 – 96 = 74.

Όλοι οι υπολογισμοί μπορούν να παρουσιαστούν με τη μορφή πίνακα (Πίνακας 11).

Πίνακας 11. Αποτελέσματα ανάλυσης διασποράς

Τα αποτελέσματα της ανάλυσης διακύμανσης δείχνουν ότι η επίδραση των παραγόντων που μελετήθηκαν, δηλαδή του χρόνου σποράς και της ποικιλίας, στην απόδοση σιταριού είναι σημαντική, καθώς τα πραγματικά κριτήρια F για καθέναν από τους παράγοντες υπερβαίνουν σημαντικά αυτά που βρέθηκαν στον πίνακα για τους αντίστοιχους βαθμούς. ελευθερίας, και ταυτόχρονα με αρκετά μεγάλη πιθανότητα (p = 0,99). Η επίδραση ενός συνδυασμού παραγόντων σε αυτή την περίπτωση απουσιάζει, αφού οι παράγοντες είναι ανεξάρτητοι μεταξύ τους.

Η ανάλυση της επίδρασης τριών παραγόντων στο αποτέλεσμα πραγματοποιείται σύμφωνα με την ίδια αρχή όπως για δύο παράγοντες, μόνο στην περίπτωση αυτή θα υπάρχουν τρεις διακυμάνσεις για τους παράγοντες και τέσσερις διακυμάνσεις για το συνδυασμό των παραγόντων. Με την αύξηση του αριθμού των παραγόντων, ο όγκος της εργασίας υπολογισμού αυξάνεται απότομα και, επιπλέον, καθίσταται δύσκολη η τακτοποίηση των αρχικών πληροφοριών σε έναν πίνακα συνδυασμού. Επομένως, δεν είναι σκόπιμο να μελετηθεί η επίδραση πολλών παραγόντων στο αποτέλεσμα χρησιμοποιώντας ανάλυση διασποράς. είναι καλύτερο να λάβετε έναν μικρότερο αριθμό, αλλά επιλέξτε τους πιο σημαντικούς παράγοντες από την άποψη της οικονομικής ανάλυσης.

Συχνά ο ερευνητής έχει να αντιμετωπίσει τα λεγόμενα σύμπλοκα δυσανάλογης διασποράς, δηλαδή αυτά στα οποία δεν τηρείται η αναλογικότητα του αριθμού των παραλλαγών.

Σε τέτοια συμπλέγματα, η διακύμανση στη συνολική επίδραση των παραγόντων δεν είναι ίση με το άθροισμα της διακύμανσης μεταξύ των παραγόντων και της διακύμανσης στο συνδυασμό των παραγόντων. Διαφέρει κατά ένα ποσό ανάλογα με τον βαθμό σύνδεσης μεταξύ επιμέρους παραγόντων που προκύπτουν ως αποτέλεσμα παραβίασης της αναλογικότητας.

Στην περίπτωση αυτή, προκύπτουν δυσκολίες στον προσδιορισμό του βαθμού επιρροής κάθε παράγοντα, αφού το άθροισμα των επιμέρους επιρροών δεν είναι ίσο με τη συνολική επιρροή.

Ένας από τους τρόπους μείωσης ενός δυσανάλογου συμπλέγματος σε μια ενιαία δομή είναι η αντικατάστασή του με ένα αναλογικό σύμπλοκο, στο οποίο οι συχνότητες υπολογίζονται κατά μέσο όρο σε ομάδες. Όταν γίνει μια τέτοια αντικατάσταση, το πρόβλημα επιλύεται σύμφωνα με τις αρχές των αναλογικών συμπλεγμάτων.

Η ανάλυση διακύμανσης είναι ένα σύνολο στατιστικών μεθόδων που έχουν σχεδιαστεί για να ελέγξουν υποθέσεις σχετικά με τη σχέση μεταξύ ορισμένων χαρακτηριστικών και μελετημένων παραγόντων που δεν έχουν ποσοτική περιγραφή, καθώς και να καθορίσουν τον βαθμό επιρροής των παραγόντων και την αλληλεπίδρασή τους. Στην εξειδικευμένη βιβλιογραφία ονομάζεται συχνά ANOVA (από την αγγλική ονομασία Analysis of Variations). Αυτή η μέθοδος αναπτύχθηκε για πρώτη φορά από τον R. Fischer το 1925.

Είδη και κριτήρια ανάλυσης διασποράς

Αυτή η μέθοδος χρησιμοποιείται για τη μελέτη της σχέσης μεταξύ ποιοτικών (ονομαστικών) χαρακτηριστικών και μιας ποσοτικής (συνεχούς) μεταβλητής. Στην ουσία ελέγχει την υπόθεση για την ισότητα των αριθμητικών μέσων πολλών δειγμάτων. Έτσι, μπορεί να θεωρηθεί ως παραμετρικό κριτήριο για τη σύγκριση των κέντρων πολλών δειγμάτων ταυτόχρονα. Εάν αυτή η μέθοδος χρησιμοποιείται για δύο δείγματα, τα αποτελέσματα της ανάλυσης διακύμανσης θα είναι πανομοιότυπα με τα αποτελέσματα του Student's t-test. Ωστόσο, σε αντίθεση με άλλα κριτήρια, αυτή η μελέτη μας επιτρέπει να μελετήσουμε το πρόβλημα με περισσότερες λεπτομέρειες.

Η ανάλυση διασποράς στις στατιστικές βασίζεται στο νόμο: το άθροισμα των τετραγωνικών αποκλίσεων του συνδυασμένου δείγματος είναι ίσο με το άθροισμα των τετραγωνικών αποκλίσεων εντός ομάδας και το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ ομάδων. Η μελέτη χρησιμοποιεί το τεστ Fisher για να καθορίσει τη σημασία της διαφοράς μεταξύ των διακυμάνσεων μεταξύ των ομάδων και των διακυμάνσεων εντός της ομάδας. Ωστόσο, οι απαραίτητες προϋποθέσεις για αυτό είναι η κανονικότητα της κατανομής και η ομοσκεδαστικότητα (ισότητα διακυμάνσεων) των δειγμάτων. Υπάρχουν μονομεταβλητή (μονοπαραγοντική) ανάλυση διακύμανσης και πολυμεταβλητή (πολυπαραγοντική). Το πρώτο εξετάζει την εξάρτηση της υπό μελέτη αξίας από ένα χαρακτηριστικό, το δεύτερο - από πολλά ταυτόχρονα, και επίσης μας επιτρέπει να προσδιορίσουμε τη σύνδεση μεταξύ τους.

Παράγοντες

Οι παράγοντες είναι ελεγχόμενες συνθήκες που επηρεάζουν το τελικό αποτέλεσμα. Το επίπεδο ή η μέθοδος επεξεργασίας του είναι μια τιμή που χαρακτηρίζει μια συγκεκριμένη εκδήλωση αυτής της κατάστασης. Αυτοί οι αριθμοί παρουσιάζονται συνήθως σε μια ονομαστική ή τακτική κλίμακα μέτρησης. Συχνά οι τιμές εξόδου μετρώνται σε ποσοτικές ή τακτικές κλίμακες. Στη συνέχεια, προκύπτει το πρόβλημα της ομαδοποίησης των δεδομένων εξόδου σε έναν αριθμό παρατηρήσεων που αντιστοιχούν σε περίπου τις ίδιες αριθμητικές τιμές. Εάν ο αριθμός των ομάδων θεωρείται υπερβολικά μεγάλος, τότε ο αριθμός των παρατηρήσεων σε αυτές μπορεί να είναι ανεπαρκής για να ληφθούν αξιόπιστα αποτελέσματα. Εάν θεωρήσετε τον αριθμό πολύ μικρό, αυτό μπορεί να οδηγήσει στην απώλεια σημαντικών χαρακτηριστικών της επιρροής στο σύστημα. Ο συγκεκριμένος τρόπος ομαδοποίησης δεδομένων εξαρτάται από την ποσότητα και τη φύση της διακύμανσης των τιμών. Ο αριθμός και το μέγεθος των διαστημάτων στη μονομεταβλητή ανάλυση καθορίζονται συχνότερα από την αρχή των ίσων διαστημάτων ή την αρχή των ίσων συχνοτήτων.

Ανάλυση προβλημάτων διακύμανσης

Έτσι, υπάρχουν περιπτώσεις που πρέπει να συγκρίνετε δύο ή περισσότερα δείγματα. Τότε είναι σκόπιμο να χρησιμοποιηθεί η ανάλυση διασποράς. Το όνομα της μεθόδου υποδηλώνει ότι εξάγονται συμπεράσματα με βάση τη μελέτη των συνιστωσών διακύμανσης. Η ουσία της μελέτης είναι ότι η συνολική αλλαγή του δείκτη χωρίζεται σε συστατικά μέρη που αντιστοιχούν στη δράση κάθε μεμονωμένου παράγοντα. Ας εξετάσουμε έναν αριθμό προβλημάτων που επιλύονται με τυπική ανάλυση διασποράς.

Παράδειγμα 1

Το συνεργείο διαθέτει μια σειρά από αυτόματες μηχανές που παράγουν ένα συγκεκριμένο ανταλλακτικό. Το μέγεθος κάθε εξαρτήματος είναι μια τυχαία μεταβλητή που εξαρτάται από τη ρύθμιση κάθε μηχανής και τις τυχαίες αποκλίσεις που εμφανίζονται κατά τη διαδικασία κατασκευής των εξαρτημάτων. Είναι απαραίτητο να προσδιοριστεί, με βάση τα δεδομένα μέτρησης των διαστάσεων των εξαρτημάτων, εάν τα μηχανήματα είναι διαμορφωμένα με τον ίδιο τρόπο.

Παράδειγμα 2

Κατά την κατασκευή μιας ηλεκτρικής συσκευής χρησιμοποιούνται διάφοροι τύποι μονωτικού χαρτιού: πυκνωτής, ηλεκτρικός κ.λπ. Η συσκευή μπορεί να εμποτιστεί με διάφορες ουσίες: εποξειδική ρητίνη, βερνίκι, ρητίνη ML-2 κ.λπ. Οι διαρροές μπορούν να εξαλειφθούν υπό κενό αυξημένη πίεση, με θέρμανση. Ο εμποτισμός μπορεί να γίνει με εμβάπτιση σε βερνίκι, κάτω από συνεχή ροή βερνικιού κ.λπ. Η ηλεκτρική συσκευή στο σύνολό της είναι γεμάτη με μια συγκεκριμένη ένωση, της οποίας υπάρχουν πολλές επιλογές. Οι δείκτες ποιότητας είναι η ηλεκτρική αντοχή της μόνωσης, η θερμοκρασία υπερθέρμανσης της περιέλιξης στον τρόπο λειτουργίας και πολλά άλλα. Κατά την ανάπτυξη της τεχνολογικής διαδικασίας κατασκευής συσκευών, είναι απαραίτητο να προσδιοριστεί πώς καθένας από τους αναφερόμενους παράγοντες επηρεάζει την απόδοση της συσκευής.

Παράδειγμα 3

Το αμαξοστάσιο των τρόλεϊ εξυπηρετεί πολλές διαδρομές τρόλεϊ. Λειτουργούν τρόλεϊ διαφόρων τύπων και 125 ελεγκτές εισπράττουν ναύλους. Η διαχείριση της αποθήκης ενδιαφέρεται για το ερώτημα: πώς να συγκρίνουν τους οικονομικούς δείκτες της εργασίας κάθε ελεγκτή (έσοδα) λαμβάνοντας υπόψη διαφορετικές διαδρομές και διαφορετικούς τύπους τρόλεϊ; Πώς να προσδιορίσετε την οικονομική σκοπιμότητα της παραγωγής τρόλεϊ ενός συγκεκριμένου τύπου σε μια συγκεκριμένη διαδρομή; Πώς να καθορίσετε εύλογες απαιτήσεις για το ποσό των εσόδων που φέρνει ένας αγωγός σε κάθε διαδρομή σε διάφορους τύπους τρόλεϊ;

Το καθήκον της επιλογής μιας μεθόδου είναι πώς να αποκτήσετε τις μέγιστες πληροφορίες σχετικά με την επίδραση κάθε παράγοντα στο τελικό αποτέλεσμα, να καθορίσετε τα αριθμητικά χαρακτηριστικά μιας τέτοιας επιρροής, την αξιοπιστία τους με ελάχιστο κόστος και στο συντομότερο δυνατό χρόνο. Οι μέθοδοι ανάλυσης διασποράς επιτρέπουν την επίλυση τέτοιων προβλημάτων.

Μονομεταβλητή ανάλυση

Σκοπός της μελέτης είναι να αξιολογήσει το μέγεθος της επιρροής μιας συγκεκριμένης περίπτωσης στην αναλυόμενη ανασκόπηση. Ένας άλλος σκοπός της μονομεταβλητής ανάλυσης μπορεί να είναι η σύγκριση δύο ή περισσότερων περιστάσεων μεταξύ τους για να προσδιοριστεί η διαφορά στον αντίκτυπό τους στην ανάκληση. Εάν η μηδενική υπόθεση απορριφθεί, τότε το επόμενο βήμα είναι η ποσοτικοποίηση και η κατασκευή διαστημάτων εμπιστοσύνης για τα ληφθέντα χαρακτηριστικά. Στην περίπτωση που η μηδενική υπόθεση δεν μπορεί να απορριφθεί, συνήθως γίνεται αποδεκτή και εξάγεται συμπέρασμα σχετικά με τη φύση της επιρροής.

Η μονόδρομη ανάλυση διακύμανσης μπορεί να γίνει ένα μη παραμετρικό ανάλογο της μεθόδου κατάταξης Kruskal-Wallis. Αναπτύχθηκε από τον Αμερικανό μαθηματικό William Kruskal και τον οικονομολόγο Wilson Wallis το 1952. Αυτό το κριτήριο έχει σχεδιαστεί για να ελέγξει τη μηδενική υπόθεση της ισότητας των επιπτώσεων στα δείγματα που μελετήθηκαν με άγνωστες αλλά ίσες μέσες τιμές. Στην περίπτωση αυτή, ο αριθμός των δειγμάτων πρέπει να είναι μεγαλύτερος από δύο.

Το κριτήριο Jonckheere-Terpstra προτάθηκε ανεξάρτητα από τον Ολλανδό μαθηματικό T. J. Terpstra το 1952 και τον Βρετανό ψυχολόγο E. R. Jonckheere το 1954. Χρησιμοποιείται όταν είναι γνωστό εκ των προτέρων ότι οι υπάρχουσες ομάδες αποτελεσμάτων ταξινομούνται από την αύξηση της επιρροής του υπό μελέτη παράγοντα, ο οποίος μετράται σε τακτική κλίμακα.

M - Το τεστ Bartlett, που προτάθηκε από τον Βρετανό στατιστικολόγο Maurice Stevenson Bartlett το 1937, χρησιμοποιείται για τον έλεγχο της μηδενικής υπόθεσης σχετικά με την ισότητα των διακυμάνσεων πολλών φυσιολογικών πληθυσμών από τους οποίους λαμβάνονται τα δείγματα υπό μελέτη, που έχουν γενικά διαφορετικά μεγέθη (ο αριθμός του καθενός το δείγμα πρέπει να είναι τουλάχιστον τέσσερα).

G - Το τεστ Cochran, το οποίο ανακαλύφθηκε από τον Αμερικανό William Gemmell Cochran το 1941. Χρησιμοποιείται για τον έλεγχο της μηδενικής υπόθεσης σχετικά με την ισότητα των διακυμάνσεων των κανονικών πληθυσμών σε ανεξάρτητα δείγματα ίσου μεγέθους.

Το μη παραμετρικό τεστ Levene, που προτάθηκε από τον Αμερικανό μαθηματικό Howard Levene το 1960, είναι μια εναλλακτική λύση στο τεστ Bartlett σε συνθήκες όπου δεν υπάρχει εμπιστοσύνη ότι τα υπό μελέτη δείγματα υπόκεινται σε κανονική κατανομή.

Το 1974, οι Αμερικανοί στατιστικολόγοι Morton B. Brown και Alan B. Forsythe πρότειναν ένα τεστ (δοκιμή Brown-Forsyth) που είναι ελαφρώς διαφορετικό από το τεστ του Levene.

Ανάλυση δύο παραγόντων

Η αμφίδρομη ανάλυση διακύμανσης χρησιμοποιείται για σχετικά κανονικά κατανεμημένα δείγματα. Στην πράξη, χρησιμοποιούνται συχνά σύνθετοι πίνακες αυτής της μεθόδου, ιδιαίτερα εκείνοι στους οποίους κάθε κελί περιέχει ένα σύνολο δεδομένων (επαναλαμβανόμενες μετρήσεις) που αντιστοιχούν σε τιμές σταθερού επιπέδου. Εάν δεν πληρούνται οι υποθέσεις που απαιτούνται για την εφαρμογή αμφίδρομης ανάλυσης διακύμανσης, χρησιμοποιήστε το μη παραμετρικό τεστ κατάταξης Friedman (Friedman, Kendall and Smith), που αναπτύχθηκε από τον Αμερικανό οικονομολόγο Milton Friedman στα τέλη του 1930. Αυτή η δοκιμή δεν εξαρτάται από τον τύπο της διανομής.

Υποτίθεται μόνο ότι η κατανομή των τιμών είναι πανομοιότυπη και συνεχής και ότι οι ίδιες είναι ανεξάρτητες η μία από την άλλη. Κατά τον έλεγχο της μηδενικής υπόθεσης, τα δεδομένα εξόδου παρουσιάζονται με τη μορφή ενός ορθογώνιου πίνακα, στον οποίο οι σειρές αντιστοιχούν στα επίπεδα του παράγοντα Β και οι στήλες αντιστοιχούν στα επίπεδα του Α. Κάθε κελί του πίνακα (μπλοκ) μπορεί να είναι το αποτέλεσμα μετρήσεων παραμέτρων σε ένα αντικείμενο ή σε μια ομάδα αντικειμένων με σταθερές τιμές των επιπέδων και των δύο παραγόντων. Στην περίπτωση αυτή, τα αντίστοιχα δεδομένα παρουσιάζονται ως οι μέσες τιμές μιας συγκεκριμένης παραμέτρου για όλες τις διαστάσεις ή τα αντικείμενα του υπό μελέτη δείγματος. Για να εφαρμοστεί το κριτήριο εξόδου, είναι απαραίτητο να περάσουμε από τα άμεσα αποτελέσματα των μετρήσεων στην κατάταξή τους. Η κατάταξη πραγματοποιείται για κάθε σειρά ξεχωριστά, δηλαδή οι τιμές ταξινομούνται για κάθε σταθερή τιμή.

Το τεστ του Page (L-test), που προτάθηκε από τον Αμερικανό στατιστικολόγο E. B. Page το 1963, έχει σχεδιαστεί για να ελέγξει τη μηδενική υπόθεση. Για μεγάλα δείγματα, χρησιμοποιείται η προσέγγιση του Page. Αυτοί, με την επιφύλαξη της πραγματικότητας των αντίστοιχων μηδενικών υποθέσεων, υπακούουν στην τυπική κανονική κατανομή. Στην περίπτωση που οι σειρές του πίνακα προέλευσης έχουν τις ίδιες τιμές, είναι απαραίτητο να χρησιμοποιηθούν μέσες βαθμολογίες. Σε αυτή την περίπτωση, η ακρίβεια των συμπερασμάτων θα είναι χειρότερη, όσο μεγαλύτερος είναι ο αριθμός τέτοιων αγώνων.

Q - Το κριτήριο του Cochran, που προτάθηκε από τον W. Cochran το 1937. Χρησιμοποιείται σε περιπτώσεις όπου ομάδες ομοιογενών υποκειμένων εκτίθενται σε επιρροές, ο αριθμός των οποίων υπερβαίνει τις δύο και για τις οποίες είναι δυνατές δύο επιλογές για ανατροφοδότηση - υπό όρους αρνητικές (0) και υπό όρους θετικό (1) . Η μηδενική υπόθεση συνίσταται στην ισότητα των αποτελεσμάτων της θεραπείας. Η αμφίδρομη ανάλυση διακύμανσης καθιστά δυνατό τον προσδιορισμό της ύπαρξης επιπτώσεων θεραπείας, αλλά δεν καθιστά δυνατό τον προσδιορισμό για ποιες συγκεκριμένες στήλες υπάρχει αυτό το αποτέλεσμα. Για την επίλυση αυτού του προβλήματος, χρησιμοποιείται η μέθοδος πολλαπλών εξισώσεων Scheffe για σχετικά δείγματα.

Πολυμεταβλητή ανάλυση

Το πρόβλημα της πολυμεταβλητής ανάλυσης διακύμανσης προκύπτει όταν χρειάζεται να προσδιορίσετε την επίδραση δύο ή περισσότερων συνθηκών σε μια συγκεκριμένη τυχαία μεταβλητή. Η μελέτη περιλαμβάνει την παρουσία μιας εξαρτημένης τυχαίας μεταβλητής, που μετράται σε μια κλίμακα διαφοράς ή αναλογίας, και πολλών ανεξάρτητων μεταβλητών, καθεμία από τις οποίες εκφράζεται σε μια κλίμακα ονοματοδοσίας ή κατάταξης. Η ανάλυση διακύμανσης δεδομένων είναι ένα αρκετά ανεπτυγμένο τμήμα μαθηματικών στατιστικών, το οποίο έχει πολλές επιλογές. Η έννοια της έρευνας είναι κοινή τόσο για μονοπαραγοντικό όσο και για πολυπαραγοντικό. Η ουσία της έγκειται στο γεγονός ότι η συνολική διακύμανση χωρίζεται σε συνιστώσες, που αντιστοιχεί σε μια ορισμένη ομαδοποίηση δεδομένων. Κάθε ομαδοποίηση δεδομένων έχει το δικό της μοντέλο. Εδώ θα εξετάσουμε μόνο τις βασικές διατάξεις που είναι απαραίτητες για την κατανόηση και την πρακτική χρήση των πιο χρησιμοποιούμενων επιλογών του.

Η ανάλυση διακύμανσης των παραγόντων απαιτεί μια αρκετά προσεκτική στάση στη συλλογή και παρουσίαση των δεδομένων εισόδου, και ιδιαίτερα στην ερμηνεία των αποτελεσμάτων. Σε αντίθεση με μια δοκιμή ενός παράγοντα, τα αποτελέσματα της οποίας μπορούν να τοποθετηθούν υπό όρους σε μια συγκεκριμένη σειρά, τα αποτελέσματα μιας δοκιμής δύο παραγόντων απαιτούν μια πιο περίπλοκη παρουσίαση. Η κατάσταση γίνεται ακόμη πιο περίπλοκη όταν υπάρχουν τρεις, τέσσερις ή περισσότερες περιστάσεις. Εξαιτίας αυτού, είναι αρκετά σπάνιο να συμπεριληφθούν περισσότερες από τρεις (τέσσερις) συνθήκες σε ένα μοντέλο. Ένα παράδειγμα θα ήταν η εμφάνιση συντονισμού σε μια ορισμένη τιμή χωρητικότητας και επαγωγής ενός ηλεκτρικού κύκλου. η εκδήλωση μιας χημικής αντίδρασης με ένα ορισμένο σύνολο στοιχείων από τα οποία είναι κατασκευασμένο το σύστημα. την εμφάνιση ανώμαλων επιπτώσεων σε πολύπλοκα συστήματα κάτω από μια συγκεκριμένη σύμπτωση περιστάσεων. Η παρουσία της αλληλεπίδρασης μπορεί να αλλάξει ριζικά το μοντέλο του συστήματος και μερικές φορές να οδηγήσει σε επανεξέταση της φύσης των φαινομένων με τα οποία ασχολείται ο πειραματιστής.

Πολυμεταβλητή ανάλυση διακύμανσης με επαναλαμβανόμενα πειράματα

Τα δεδομένα μετρήσεων μπορούν πολύ συχνά να ομαδοποιηθούν όχι κατά δύο, αλλά από έναν μεγαλύτερο αριθμό παραγόντων. Έτσι, εάν λάβουμε υπόψη την ανάλυση διασποράς της διάρκειας ζωής των ελαστικών τροχών τρόλεϊ λαμβάνοντας υπόψη τις συνθήκες (το εργοστάσιο κατασκευής και τη διαδρομή στην οποία λειτουργούν τα ελαστικά), τότε μπορούμε να ξεχωρίσουμε ως ξεχωριστή συνθήκη την εποχή κατά την οποία λειτουργούν ελαστικά (δηλαδή: χειμερινή και θερινή λειτουργία). Ως αποτέλεσμα, θα έχουμε πρόβλημα της μεθόδου των τριών παραγόντων.

Εάν υπάρχουν περισσότερες προϋποθέσεις, η προσέγγιση είναι η ίδια όπως στην ανάλυση δύο παραγόντων. Σε όλες τις περιπτώσεις προσπαθούν να απλοποιήσουν το μοντέλο. Το φαινόμενο της αλληλεπίδρασης δύο παραγόντων δεν εμφανίζεται τόσο συχνά και η τριπλή αλληλεπίδραση εμφανίζεται μόνο σε εξαιρετικές περιπτώσεις. Συμπεριλάβετε εκείνες τις αλληλεπιδράσεις για τις οποίες υπάρχουν προηγούμενες πληροφορίες και καλοί λόγοι για να τις λάβετε υπόψη στο μοντέλο. Η διαδικασία εντοπισμού μεμονωμένων παραγόντων και λήψης τους υπόψη είναι σχετικά απλή. Ως εκ τούτου, υπάρχει συχνά η επιθυμία να τονιστούν περισσότερες περιστάσεις. Δεν πρέπει να παρασυρθείς με αυτό. Όσο περισσότερες συνθήκες, τόσο λιγότερο αξιόπιστο γίνεται το μοντέλο και τόσο μεγαλύτερη είναι η πιθανότητα λάθους. Το ίδιο το μοντέλο, το οποίο περιλαμβάνει μεγάλο αριθμό ανεξάρτητων μεταβλητών, γίνεται αρκετά περίπλοκο στην ερμηνεία και άβολο για πρακτική χρήση.

Γενική ιδέα της ανάλυσης διασποράς

Η ανάλυση της διακύμανσης στα στατιστικά είναι μια μέθοδος λήψης αποτελεσμάτων παρατήρησης που εξαρτώνται από διάφορες συνθήκες ταυτόχρονα λειτουργίας και αξιολόγησης της επιρροής τους. Μια ελεγχόμενη μεταβλητή που αντιστοιχεί στη μέθοδο επιρροής στο αντικείμενο μελέτης και αποκτά μια ορισμένη τιμή σε μια συγκεκριμένη χρονική περίοδο ονομάζεται παράγοντας. Μπορούν να είναι ποιοτικές και ποσοτικές. Τα επίπεδα ποσοτικών συνθηκών αποκτούν ένα ορισμένο νόημα σε μια αριθμητική κλίμακα. Παραδείγματα είναι η θερμοκρασία, η πίεση πίεσης, η ποσότητα της ουσίας. Ποιοτικοί παράγοντες είναι διαφορετικές ουσίες, διαφορετικές τεχνολογικές μέθοδοι, συσκευές, πληρωτικά. Τα επίπεδά τους αντιστοιχούν σε μια κλίμακα ονομάτων.

Η ποιότητα μπορεί επίσης να περιλαμβάνει τον τύπο του υλικού συσκευασίας και τις συνθήκες αποθήκευσης της δοσολογικής μορφής. Είναι επίσης λογικό να συμπεριληφθεί ο βαθμός λείανσης των πρώτων υλών, η κλασματική σύνθεση των κόκκων, που έχουν ποσοτική σημασία, αλλά είναι δύσκολο να ρυθμιστούν εάν χρησιμοποιείται ποσοτική κλίμακα. Ο αριθμός των ποιοτικών παραγόντων εξαρτάται από τον τύπο της δοσολογικής μορφής, καθώς και από τις φυσικές και τεχνολογικές ιδιότητες των φαρμακευτικών ουσιών. Για παράδειγμα, τα δισκία μπορούν να ληφθούν από κρυσταλλικές ουσίες με άμεση συμπίεση. Σε αυτή την περίπτωση, αρκεί να επιλέξετε ολισθαίνουσες και λιπαντικές ουσίες.

Παραδείγματα παραγόντων ποιότητας για διαφορετικούς τύπους δοσολογικών μορφών

  • Βάμματα.Σύνθεση εκχυλίσματος, τύπος εκχυλιστή, μέθοδος παρασκευής πρώτης ύλης, μέθοδος παραγωγής, μέθοδος διήθησης.
  • Εκχυλίσματα (υγρό, παχύρρευστο, ξηρό).Σύνθεση του εκχυλιστικού, μέθοδος εκχύλισης, τύπος εγκατάστασης, μέθοδος αφαίρεσης του εκχυλιστικού και ουσιών έρματος.
  • Χάπια.Σύνθεση εκδόχων, πληρωτικών, αποσαθρωτικών, συνδετικών, λιπαντικών και λιπαντικών. Τρόπος λήψης δισκίων, τύπος τεχνολογικού εξοπλισμού. Τύπος κελύφους και τα συστατικά του, σχηματιστές φιλμ, χρωστικές, βαφές, πλαστικοποιητές, διαλύτες.
  • Ενέσιμα διαλύματα.Τύπος διαλύτη, μέθοδος διήθησης, φύση σταθεροποιητών και συντηρητικών, συνθήκες αποστείρωσης, μέθοδος πλήρωσης αμπούλων.
  • Υπόθετα.Σύνθεση βάσης υποθέτων, μέθοδος παραγωγής υπόθετων, πληρωτικά, συσκευασία.
  • Αλοιφές.Σύνθεση βάσης, δομικά συστατικά, τρόπος παρασκευής της αλοιφής, τύπος εξοπλισμού, συσκευασία.
  • Κάψουλες.Τύπος υλικού κελύφους, μέθοδος παραγωγής καψουλών, τύπος πλαστικοποιητή, συντηρητικό, βαφή.
  • Liniments.Τρόπος παρασκευής, σύνθεση, τύπος εξοπλισμού, τύπος γαλακτωματοποιητή.
  • Αναστολές.Τύπος διαλύτη, τύπος σταθεροποιητή, μέθοδος διασποράς.

Παραδείγματα παραγόντων ποιότητας και τα επίπεδά τους που μελετήθηκαν κατά τη διαδικασία κατασκευής δισκίων

  • Μπέικιν πάουντερ.Άμυλο πατάτας, λευκή άργιλος, μείγμα διττανθρακικού νατρίου με κιτρικό οξύ, βασικό ανθρακικό μαγνήσιο.
  • Δεσμικό διάλυμα.Νερό, πάστα αμύλου, σιρόπι ζάχαρης, διάλυμα μεθυλοκυτταρίνης, διάλυμα υδροξυπροπυλομεθυλοκυτταρίνης, διάλυμα πολυβινυλοπυρρολιδόνης, διάλυμα πολυβινυλικής αλκοόλης.
  • Συρόμενη ουσία. Aerosil, άμυλο, ταλκ.
  • Γεμιστικό.Ζάχαρη, γλυκόζη, λακτόζη, χλωριούχο νάτριο, φωσφορικό ασβέστιο.
  • Λιπαντική ουσία.Στεατικό οξύ, πολυαιθυλενογλυκόλη, παραφίνη.

Μοντέλα ανάλυσης διασποράς στη μελέτη του επιπέδου ανταγωνιστικότητας του κράτους

Ένα από τα πιο σημαντικά κριτήρια για την αξιολόγηση της κατάστασης ενός κράτους, βάσει του οποίου αξιολογείται το επίπεδο της ευημερίας και της κοινωνικοοικονομικής του ανάπτυξης, είναι η ανταγωνιστικότητα, δηλαδή ένα σύνολο ιδιοτήτων εγγενών στην εθνική οικονομία που καθορίζουν την κατάσταση του κράτους. ικανότητα ανταγωνισμού με άλλες χώρες. Έχοντας καθορίσει τη θέση και τον ρόλο του κράτους στην παγκόσμια αγορά, είναι δυνατό να δημιουργηθεί μια σαφής στρατηγική για τη διασφάλιση της οικονομικής ασφάλειας σε διεθνή κλίμακα, επειδή είναι το κλειδί για τις θετικές σχέσεις μεταξύ της Ρωσίας και όλων των παραγόντων στην παγκόσμια αγορά: επενδυτές , πιστωτές και κυβερνήσεις.

Για να συγκριθεί το επίπεδο ανταγωνιστικότητας των κρατών, οι χώρες κατατάσσονται χρησιμοποιώντας σύνθετους δείκτες που περιλαμβάνουν διάφορους σταθμισμένους δείκτες. Οι δείκτες αυτοί βασίζονται σε βασικούς παράγοντες που επηρεάζουν την οικονομική, πολιτική κ.λπ. κατάσταση. Ένα σύνολο μοντέλων για τη μελέτη της κρατικής ανταγωνιστικότητας περιλαμβάνει τη χρήση μεθόδων πολυμεταβλητής στατιστικής ανάλυσης (ιδίως, ανάλυση διασποράς (στατιστικές), οικονομετρική μοντελοποίηση, λήψη αποφάσεων) και περιλαμβάνει τα ακόλουθα κύρια στάδια:

  1. Διαμόρφωση συστήματος δεικτών.
  2. Εκτίμηση και πρόβλεψη δεικτών κρατικής ανταγωνιστικότητας.
  3. Σύγκριση δεικτών ανταγωνιστικότητας κρατών.

Τώρα ας δούμε το περιεχόμενο των μοντέλων καθενός από τα στάδια αυτού του συγκροτήματος.

Στο πρώτο στάδιοχρησιμοποιώντας μεθόδους μελέτης ειδικών, διαμορφώνεται ένα καλά τεκμηριωμένο σύνολο οικονομικών δεικτών για την αξιολόγηση της ανταγωνιστικότητας του κράτους, λαμβάνοντας υπόψη τις ιδιαιτερότητες της ανάπτυξής του με βάση διεθνείς αξιολογήσεις και δεδομένα από στατιστικές υπηρεσίες, που αντικατοπτρίζουν την κατάσταση του συστήματος στο σύνολό του και τις διαδικασίες του. Η επιλογή αυτών των δεικτών δικαιολογείται από την ανάγκη επιλογής εκείνων που πληρέστερα, από πρακτική άποψη, μας επιτρέπουν να προσδιορίσουμε το επίπεδο του κράτους, την επενδυτική του ελκυστικότητα και τη δυνατότητα σχετικού εντοπισμού των υφιστάμενων πιθανών και πραγματικών απειλών.

Οι κύριοι δείκτες των διεθνών συστημάτων αξιολόγησης είναι οι δείκτες:

  1. Παγκόσμια Ανταγωνιστικότητα (GC).
  2. Οικονομική ελευθερία (IES).
  3. Ανθρώπινη Ανάπτυξη (HDI).
  4. Αντιλήψεις για τη Διαφθορά (CPC).
  5. Εσωτερικές και εξωτερικές απειλές (IETH).
  6. Διεθνές Δυναμικό Επιρροής (IPIP).

Δεύτερη φάσηπροβλέπει την αξιολόγηση και την πρόβλεψη των δεικτών κρατικής ανταγωνιστικότητας σύμφωνα με τις διεθνείς αξιολογήσεις για τις 139 χώρες του κόσμου που μελετώνται.

Τρίτο στάδιοπροβλέπει σύγκριση των συνθηκών ανταγωνιστικότητας των κρατών χρησιμοποιώντας μεθόδους ανάλυσης συσχέτισης και παλινδρόμησης.

Χρησιμοποιώντας τα αποτελέσματα της μελέτης, είναι δυνατό να προσδιοριστεί η φύση των διαδικασιών γενικά και για μεμονωμένα στοιχεία της ανταγωνιστικότητας του κράτους. ελέγξτε την υπόθεση για την επίδραση παραγόντων και τις σχέσεις τους στο κατάλληλο επίπεδο σημασίας.

Η εφαρμογή του προτεινόμενου συνόλου μοντέλων θα επιτρέψει όχι μόνο την αξιολόγηση της τρέχουσας κατάστασης του επιπέδου ανταγωνιστικότητας και της ελκυστικότητας των επενδύσεων των κρατών, αλλά και την ανάλυση των ελλείψεων διαχείρισης, την πρόληψη λαθών λανθασμένων αποφάσεων και την πρόληψη της ανάπτυξης κρίσης στην κατάσταση.

Μονόδρομη ανάλυση διασποράς.

Έννοια και μοντέλα ανάλυσης διασποράς.

Θέμα 13. Ανάλυση διασποράς

Διάλεξη 1. Ερωτήσεις:

Η ανάλυση της διακύμανσης, ως μέθοδος έρευνας, εμφανίστηκε στα έργα του R. Fischer (1918-1935) σε σχέση με την έρευνα στη γεωργία για τον προσδιορισμό των συνθηκών υπό τις οποίες η δοκιμασμένη ποικιλία γεωργικής καλλιέργειας παράγει τη μέγιστη απόδοση. Η ανάλυση διακύμανσης αναπτύχθηκε περαιτέρω στα έργα του Yeats. Η ανάλυση διακύμανσης μας επιτρέπει να απαντήσουμε στο ερώτημα εάν ορισμένοι παράγοντες έχουν σημαντική επίδραση στη μεταβλητότητα ενός παράγοντα, οι τιμές του οποίου μπορούν να ληφθούν ως αποτέλεσμα της εμπειρίας. Κατά τον έλεγχο στατιστικών υποθέσεων, θεωρούνται τυχαίες διακυμάνσεις στους παράγοντες που μελετώνται. Στην ανάλυση της διακύμανσης, ένας ή περισσότεροι παράγοντες αλλάζουν με δεδομένο τρόπο και αυτές οι αλλαγές μπορούν να επηρεάσουν τα αποτελέσματα των παρατηρήσεων. Η μελέτη μιας τέτοιας επιρροής είναι ο σκοπός της ανάλυσης διασποράς.

Επί του παρόντος, υπάρχει μια ολοένα και πιο διαδεδομένη χρήση της ανάλυσης διασποράς στα οικονομικά, την κοινωνιολογία, τη βιολογία κ.λπ., ειδικά μετά την εμφάνιση του λογισμικού που εξάλειψε τα προβλήματα της δυσκινησίας των στατιστικών υπολογισμών.

Σε πρακτικές δραστηριότητες, σε διάφορους τομείς της επιστήμης, ερχόμαστε συχνά αντιμέτωποι με την ανάγκη να αξιολογήσουμε την επίδραση διαφόρων παραγόντων σε ορισμένους δείκτες. Συχνά αυτοί οι παράγοντες έχουν ποιοτικό χαρακτήρα (για παράδειγμα, ένας ποιοτικός παράγοντας που επηρεάζει το οικονομικό αποτέλεσμα μπορεί να είναι η εισαγωγή ενός νέου συστήματος διαχείρισης παραγωγής) και τότε η ανάλυση διακύμανσης αποκτά ιδιαίτερη αξία, καθώς γίνεται η μόνη στατιστική μέθοδος έρευνας που δίνει τέτοια μια αξιολόγηση.

Η ανάλυση διακύμανσης καθιστά δυνατό τον προσδιορισμό του εάν ένας ή ο άλλος από τους υπό εξέταση παράγοντες έχει σημαντική επίδραση στη μεταβλητότητα ενός χαρακτηριστικού, καθώς και τον ποσοτικό προσδιορισμό του «ειδικού βάρους» κάθε πηγής μεταβλητότητας στο σύνολό τους. Αλλά η ανάλυση διακύμανσης μας επιτρέπει να δώσουμε μια θετική απάντηση μόνο για την παρουσία σημαντικής επιρροής, διαφορετικά το ερώτημα παραμένει ανοιχτό και απαιτεί πρόσθετη έρευνα (τις περισσότερες φορές, αύξηση του αριθμού των πειραμάτων).

Οι ακόλουθοι όροι χρησιμοποιούνται στην ανάλυση διασποράς.

Ο παράγοντας (Χ) είναι κάτι που πιστεύουμε ότι θα πρέπει να επηρεάσει το αποτέλεσμα (αποτελεσματικό χαρακτηριστικό) Y.

Επίπεδο παράγοντα (ή μέθοδος επεξεργασίας, μερικές φορές κυριολεκτικά, για παράδειγμα - μέθοδος άροσης) - τιμές (X, i = 1,2,...I) που μπορεί να λάβει ο παράγοντας.

Απόκριση – η τιμή του μετρούμενου χαρακτηριστικού (τιμή αποτελέσματος Y).

Η τεχνική ANOVA ποικίλλει ανάλογα με τον αριθμό των ανεξάρτητων παραγόντων που μελετώνται. Εάν οι παράγοντες που προκαλούν μεταβλητότητα στη μέση τιμή ενός χαρακτηριστικού ανήκουν σε μία πηγή, τότε έχουμε μια απλή ομαδοποίηση ή ανάλυση διακύμανσης ενός παράγοντα και, κατά συνέπεια, μια διπλή ομαδοποίηση - ανάλυση διακύμανσης δύο παραγόντων, τριών παραγόντων ανάλυση διακύμανσης, ..., m-factor. Οι παράγοντες στην πολυμεταβλητή ανάλυση συνήθως υποδηλώνονται με λατινικά γράμματα: A, B, C κ.λπ.



Το καθήκον της ανάλυσης διακύμανσης είναι να μελετήσει την επίδραση ορισμένων παραγόντων (ή επιπέδων παραγόντων) στη μεταβλητότητα των μέσων τιμών των παρατηρούμενων τυχαίων μεταβλητών.

Η ουσία της ανάλυσης διασποράς. Η ανάλυση διακύμανσης αποτελείται από την απομόνωση και την αξιολόγηση μεμονωμένων παραγόντων που προκαλούν μεταβλητότητα. Για το σκοπό αυτό, η συνολική διακύμανση του παρατηρούμενου μερικού πληθυσμού (ολική διακύμανση του χαρακτηριστικού), που προκαλείται από όλες τις πηγές μεταβλητότητας, αποσυντίθεται σε συνιστώσες διακύμανσης που δημιουργούνται από ανεξάρτητους παράγοντες. Κάθε ένα από αυτά τα στοιχεία παρέχει μια εκτίμηση της διακύμανσης , ,..., που προκαλείται από μια συγκεκριμένη πηγή μεταβλητότητας, στο συνολικό πληθυσμό. Για να ελεγχθεί η σημασία αυτών των εκτιμήσεων διασποράς συνιστωσών, συγκρίνονται με τη συνολική διακύμανση στον πληθυσμό (δοκιμή Fisher).

Για παράδειγμα, στην ανάλυση δύο παραγόντων παίρνουμε μια αποσύνθεση της μορφής:

Ολική διακύμανση του υπό μελέτη γνωρίσματος C;

Το μερίδιο διακύμανσης που προκαλείται από την επίδραση του παράγοντα Α.

Το μερίδιο διακύμανσης που προκαλείται από την επίδραση του παράγοντα Β.

Το ποσοστό διακύμανσης που προκαλείται από την αλληλεπίδραση των παραγόντων Α και Β.

Το μερίδιο της διακύμανσης που προκαλείται από μη καταγεγραμμένες τυχαίες αιτίες (τυχαία διακύμανση).

Στην ανάλυση της διακύμανσης, λαμβάνεται υπόψη η υπόθεση: H 0 - κανένας από τους υπό εξέταση παράγοντες δεν έχει επίδραση στη μεταβλητότητα του χαρακτηριστικού. Η σημασία κάθε εκτίμησης διακύμανσης ελέγχεται από την τιμή του λόγου της προς την εκτίμηση τυχαίας διακύμανσης και συγκρίνεται με την αντίστοιχη κρίσιμη τιμή, στο επίπεδο σημαντικότητας a, χρησιμοποιώντας πίνακες κρίσιμων τιμών της κατανομής Fisher-Snedecor F (Παράρτημα 4) . Η υπόθεση H 0 σχετικά με τη μία ή την άλλη πηγή μεταβλητότητας απορρίπτεται εάν υπολογιστεί η F. >F cr. (για παράδειγμα, για τον παράγοντα Β: S B 2 /S ε 2 >F cr.).

Η ανάλυση διακύμανσης εξετάζει πειράματα 3 τύπων:

α) πειράματα στα οποία όλοι οι παράγοντες έχουν συστηματικά (σταθερά) επίπεδα.

β) πειράματα στα οποία όλοι οι παράγοντες έχουν τυχαία επίπεδα.

γ) πειράματα στα οποία υπάρχουν παράγοντες που έχουν τυχαία επίπεδα, καθώς και παράγοντες που έχουν σταθερά επίπεδα.

Οι περιπτώσεις α), β), γ) αντιστοιχούν σε τρία μοντέλα που λαμβάνονται υπόψη στην ανάλυση διασποράς.

Τα δεδομένα εισόδου για την ανάλυση διασποράς παρουσιάζονται συνήθως με τη μορφή του παρακάτω πίνακα:

Αριθμός παρατήρησης j Επίπεδα παραγόντων
Α'1 Α2 A r
Χ 11 Χ 21 X p1
Χ 12 Χ 22 Xp2
Χ 13 Χ 23 X p3
. . .
. . .
. . .
n X 1n X2n Xpn
ΑΠΟΤΕΛΕΣΜΑΤΑ

Θεωρήστε έναν μόνο παράγοντα που παίρνει p διαφορετικά επίπεδα και υποθέστε ότι σε κάθε επίπεδο γίνονται n παρατηρήσεις, δίνοντας N=np παρατηρήσεις. (Θα περιοριστούμε στην εξέταση του πρώτου μοντέλου ανάλυσης διασποράς - όλοι οι παράγοντες έχουν σταθερά επίπεδα.)

Έστω τα αποτελέσματα με τη μορφή X ij (i=1,2…,р; j=1,2,…,n).

Θεωρείται ότι για κάθε επίπεδο n παρατηρήσεων υπάρχει ένας μέσος όρος, ο οποίος ισούται με το άθροισμα του συνολικού μέσου όρου και τη διακύμανσή του λόγω του επιλεγμένου επιπέδου:

όπου m είναι ο συνολικός μέσος όρος.

A i - αποτέλεσμα που προκαλείται από το επίπεδο i – m του παράγοντα.

e ij – διακύμανση των αποτελεσμάτων σε επίπεδο μεμονωμένου παράγοντα. Ο όρος e ij λαμβάνει υπόψη όλους τους ανεξέλεγκτους παράγοντες.

Αφήστε τις παρατηρήσεις σε επίπεδο σταθερού παράγοντα να κατανέμονται κανονικά γύρω από τη μέση τιμή m + A i με κοινή διακύμανση s 2 .

Στη συνέχεια (η τελεία αντί του δείκτη υποδηλώνει τον μέσο όρο των αντίστοιχων παρατηρήσεων σε αυτόν τον δείκτη):

A.X ij – X.. = (X i . – X..) + (X ij – X i .). (12.3)

Αφού τετραγωνίσουμε και τις δύο πλευρές της εξίσωσης και αθροίσουμε το i και το j, παίρνουμε:

αφού, αλλά

Διαφορετικά, το άθροισμα των τετραγώνων μπορεί να γραφτεί: S = S 1 + S 2. Η τιμή του S 1 υπολογίζεται από τις αποκλίσεις των μέσων τιμών p από τον συνολικό μέσο όρο X.., επομένως το S 1 έχει (p-1) βαθμούς ελευθερίας. Η τιμή του S 2 υπολογίζεται από τις αποκλίσεις των N παρατηρήσεων από το μέσο δείγματος p και, επομένως, έχει N-р = np - p=p(n-1) βαθμούς ελευθερίας. Το S έχει (Ν-1) βαθμούς ελευθερίας. Με βάση τα αποτελέσματα του υπολογισμού, κατασκευάζεται ένας πίνακας ανάλυσης διασποράς.

τραπέζι ANOVA

Εάν η υπόθεση ότι η επιρροή όλων των επιπέδων είναι ίση είναι αληθής, τότε τόσο το M 1 όσο και το M 2 (μέσα τετράγωνα) θα είναι αμερόληπτες εκτιμήσεις του s 2. Αυτό σημαίνει ότι η υπόθεση μπορεί να ελεγχθεί υπολογίζοντας την αναλογία (M 1 / M 2) και συγκρίνοντάς την με την F cr. με ν 1 = (ρ-1) και ν 2 = (Ν-ρ) βαθμούς ελευθερίας.

Αν υπολογιστεί η F >F cr. , τότε η υπόθεση για την ασήμαντη επίδραση του παράγοντα Α στο αποτέλεσμα των παρατηρήσεων δεν γίνεται αποδεκτή.

Για να εκτιμηθεί η σημασία των διαφορών στο F υπολ. Τραπέζι F υπολογίζω:

α) πειραματικό λάθος

β) σφάλμα διαφοράς μέσων

γ) τη μικρότερη σημαντική διαφορά

Συγκρίνοντας τη διαφορά στις μέσες τιμές για τις επιλογές με το NSR, καταλήγουν στο συμπέρασμα ότι οι διαφορές στο επίπεδο των μέσων όρων είναι σημαντικές.

Σχόλιο. Η χρήση της ανάλυσης διασποράς προϋποθέτει ότι:

2) D(ε ij)=σ 2 = const,

3) ε ij → N (0, σ) ή x ij → N (a, σ).

Αναλυτικός στατιστικολόγος

7.1 Ανάλυση διασποράς. 2

Σε αυτή την έκδοση της μεθόδου, διαφορετικά δείγματα θεμάτων εκτίθενται στην επίδραση καθεμιάς από τις διαβαθμίσεις. Πρέπει να υπάρχουν τουλάχιστον διαβαθμίσεις του παράγοντα τρία.

Παράδειγμα 1.Σε τρεις διαφορετικές ομάδες των έξι ατόμων δόθηκαν λίστες με δέκα λέξεις. Οι λέξεις παρουσιάστηκαν στην πρώτη ομάδα με χαμηλή ταχύτητα - 1 λέξη ανά 5 δευτερόλεπτα, στη δεύτερη ομάδα με μέση ταχύτητα - 1 λέξη ανά 2 δευτερόλεπτα και στην τρίτη ομάδα με υψηλή ταχύτητα - 1 λέξη ανά δευτερόλεπτο. Η απόδοση αναπαραγωγής προβλέφθηκε ότι εξαρτάται από την ταχύτητα παρουσίασης της λέξης. Τα αποτελέσματα παρουσιάζονται στον πίνακα. 1.

Πίνακας 1. Αριθμός λέξεων που αναπαράχθηκαν (από J. Greene, M D "Olivera, 1989, σελ. 99)

Θέμα Αρ.

Ομάδα 1 χαμηλή ταχύτητα

Ομάδα 2 μεσαία ταχύτητα

Ομάδα 3 υψηλής ταχύτητας

ποσά

μέση τιμή

7,17

6,17

4,00

Συνολικό ποσό

Η μονομεταβλητή ανάλυση διακύμανσης σας επιτρέπει να ελέγξετε τις υποθέσεις:

H 0 : διαφορές στον όγκο παραγωγής λέξεων μεταξύοι ομάδες δεν είναι πιο έντονες από τις τυχαίες διαφορές μέσακάθε ομάδα

H 1 : Διαφορές στον όγκο παραγωγής λέξεων μεταξύοι ομάδες είναι πιο έντονες από τις τυχαίες διαφορές μέσακάθε ομάδα.

Ακολουθία πράξεων σε μονόδρομη ανάλυση διακύμανσης για άσχετα δείγματα:

1. ας μετρήσουμε Γεγονός SS- μεταβλητότητα του χαρακτηριστικού λόγω της δράσης του υπό μελέτη παράγοντα. Κοινός προσδιορισμός SS - συντομογραφία για "άθροισμα τετραγώνων" (άθροισμα τετραγώνων ). Αυτή η συντομογραφία χρησιμοποιείται συχνότερα σε μεταφρασμένες πηγές (βλ., για παράδειγμα: Glass J., Stanley J., 1976).

,(1)

όπου T c είναι το άθροισμα των επιμέρους τιμών για κάθε συνθήκη. Για το παράδειγμά μας, 43, 37, 24 (βλ. Πίνακα 1).

c – αριθμός συνθηκών (διαβαθμίσεις) του παράγοντα (=3).

n – αριθμός θεμάτων σε κάθε ομάδα (=6).

Ν – συνολικός αριθμός μεμονωμένων τιμών (=18)

Τετράγωνο του συνολικού αθροίσματος μεμονωμένων τιμών (=104 2 =10816)

Σημειώστε τη διαφορά μεταξύ , στην οποία όλες οι μεμονωμένες τιμές πρώτα τετράγωνονται και μετά αθροίζονται, και όπου οι μεμονωμένες τιμές αθροίζονται πρώτα για να ληφθεί ένα συνολικό άθροισμα και στη συνέχεια αυτό το άθροισμα τετράγωνεται.

Χρησιμοποιώντας τον τύπο (1), έχοντας υπολογίσει την πραγματική μεταβλητότητα του χαρακτηριστικού, λαμβάνουμε:

2. ας μετρήσουμε Στρατηγός SS– γενική μεταβλητότητα του χαρακτηριστικού:


(2)

3. υπολογίστε την τυχαία (υπολειπόμενη) τιμήSS sl, που προκαλείται από απροσδιόριστους παράγοντες:

(3)

4.αριθμός βαθμών ελευθερίαςισούται με:

=3-1=2(4)

5."μεσαίο τετράγωνο"ή η μέση τιμή των αντίστοιχων αθροισμάτων τετραγώνων SS είναι ίση με:

(5)

6.νόημα στατιστικά κριτηρίου F emυπολογίστε χρησιμοποιώντας τον τύπο:

(6)

Για το παράδειγμά μας έχουμε : F em =15,72/2,11=7,45

7.καθορίζουν Φ κριτσύμφωνα με τους στατιστικούς πίνακες Εφαρμογές 3για df 1 =k 1 =2 και df 2 =k 2 =15 η τιμή του πίνακα των στατιστικών είναι 3,68

8. αν F em< F crit, τότε γίνεται αποδεκτή η μηδενική υπόθεση, διαφορετικά γίνεται αποδεκτή η εναλλακτική υπόθεση. Για το παράδειγμά μας F em> F crit (7,45>3,68), επομένως σελ

Συμπέρασμα:Οι διαφορές στην ανάκληση λέξεων μεταξύ των ομάδων είναι πιο έντονες από τις τυχαίες διαφορές σε κάθε ομάδα (σελ<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.

7.1.2 Ανάλυση διακύμανσης για σχετικά δείγματα

Η μέθοδος ανάλυσης διασποράς για σχετικά δείγματα χρησιμοποιείται σε περιπτώσεις όπου η επίδραση διαφορετικών διαβαθμίσεων ενός παράγοντα ή διαφορετικών συνθηκών σε το ίδιο δείγμα θεμάτων.Πρέπει να υπάρχουν τουλάχιστον διαβαθμίσεις του παράγοντα τρία.

Σε αυτή την περίπτωση, οι διαφορές μεταξύ των θεμάτων είναι μια πιθανή ανεξάρτητη πηγή διαφορών. Μονόδρομη ANOVA για σχετικά δείγματαθα μας επιτρέψει να προσδιορίσουμε τι υπερτερεί - την τάση που εκφράζεται από την καμπύλη μεταβολής των παραγόντων ή τις επιμέρους διαφορές μεταξύ των υποκειμένων. Ο παράγοντας των επιμέρους διαφορών μπορεί να είναι πιο σημαντικός από τον παράγοντα των αλλαγών στις πειραματικές συνθήκες.

Παράδειγμα 2.Μια ομάδα 5 ατόμων εξετάστηκε χρησιμοποιώντας τρεις πειραματικές εργασίες με στόχο τη μελέτη της διανοητικής επιμονής (Sidorenko E.V., 1984). Κάθε θέμα παρουσιάστηκε ξεχωριστά διαδοχικά με τρεις πανομοιότυπους αναγραμματισμούς: τετραγράμματος, πέντε γραμμάτων και έξι γραμμάτων. Είναι δυνατόν να υποθέσουμε ότι ο παράγοντας μήκους ενός αναγράμματος επηρεάζει τη διάρκεια των προσπαθειών επίλυσής του;

Πίνακας 2. Διάρκεια επίλυσης αναγραμμάτων (δευτ.)

Κωδικός θέματος

Συνθήκη 1. αναγραμματισμός τεσσάρων γραμμάτων

Συνθήκη 2. Πεντάγραμμη αναγραμματισμός

Συνθήκη 3. αναγραμματισμός έξι γραμμάτων

Ποσά ανά θέματα

ποσά

1244

1342

Ας διατυπώσουμε υποθέσεις. Σε αυτή την περίπτωση υπάρχουν δύο ομάδες υποθέσεων.

Σετ Α.

H 0 (A): Οι διαφορές στη διάρκεια των προσπαθειών επίλυσης αναγραμμάτων διαφορετικού μήκους δεν είναι πιο έντονες από τις διαφορές που οφείλονται σε τυχαίους λόγους.

H 1 (A): Οι διαφορές στη διάρκεια των προσπαθειών επίλυσης αναγραμμάτων διαφορετικού μήκους είναι πιο έντονες από τις διαφορές που οφείλονται σε τυχαίους λόγους.

Σετ Β.

N περίπου (Β): Οι ατομικές διαφορές μεταξύ των υποκειμένων δεν είναι πιο έντονες από τις διαφορές που οφείλονται σε τυχαίες αιτίες.

H 1 (B): Οι ατομικές διαφορές μεταξύ των υποκειμένων είναι πιο έντονες από τις διαφορές που οφείλονται σε τυχαίους λόγους.

Ακολουθία πράξεων σε μονόδρομη ανάλυση διασποράς για σχετικά δείγματα:

1. ας μετρήσουμε Γεγονός SS- μεταβλητότητα του χαρακτηριστικού λόγω της δράσης του υπό μελέτη παράγοντα σύμφωνα με τον τύπο (1).

όπου T c είναι το άθροισμα των μεμονωμένων τιμών για κάθε μία από τις συνθήκες (στήλες). Για το παράδειγμά μας, 51, 1244, 47 (βλ. Πίνακα 2). c – αριθμός συνθηκών (διαβαθμίσεις) του παράγοντα (=3). n – αριθμός θεμάτων σε κάθε ομάδα (=5).Ν – συνολικός αριθμός μεμονωμένων τιμών (=15) - τετράγωνο του συνολικού αθροίσματος μεμονωμένων τιμών (=1342 2)

2. ας μετρήσουμε SS isp- μεταβλητότητα του σημείου λόγω των επιμέρους τιμών των υποκειμένων.

Όπου T και είναι το άθροισμα των επιμέρους τιμών για κάθε θέμα. Για το παράδειγμά μας, 247, 631, 100, 181, 183 (βλ. Πίνακα 2). c – αριθμός συνθηκών (διαβαθμίσεις) του παράγοντα (=3).Ν – συνολικός αριθμός μεμονωμένων τιμών (=15)

3. ας μετρήσουμε Στρατηγός SS– γενική μεταβλητότητα του χαρακτηριστικού σύμφωνα με τον τύπο (2):


4. υπολογίστε την τυχαία (υπολειπόμενη) τιμήSS sl, που προκαλείται από μη καταγεγραμμένους παράγοντες σύμφωνα με τον τύπο (3):

5. αριθμός βαθμών ελευθερίαςισούται με (4):

; ; ;

6. "μεσαίο τετράγωνο"ή μαθηματική προσδοκία του αθροίσματος των τετραγώνων,η μέση τιμή των αντίστοιχων αθροισμάτων τετραγώνων SS είναι ίση με (5):

;

7. κριτήριο στατιστική αξία F emΥπολογίστε χρησιμοποιώντας τον τύπο (6):

;

8. Ας προσδιορίσουμε το F crit από τους στατιστικούς πίνακες του Παραρτήματος 3 για df 1 =k 1 =2 και df 2 =k 2 =8 τιμή πίνακα στατιστικών F crit_fact =4,46 και για df 3 =k 3 =4 και df 2 =k 2 = 8 F crit_exp =3,84

9. F em_fact> F kritik_fact (6.872>4.46), επομένως σελ μια εναλλακτική υπόθεση γίνεται αποδεκτή.

10. F em_use < F крит_исп (1,054<3,84), следовательно пΗ μηδενική υπόθεση γίνεται αποδεκτή.

Συμπέρασμα:οι διαφορές στον όγκο της αναπαραγωγής λέξεων σε διαφορετικές συνθήκες είναι πιο έντονες από τις διαφορές που οφείλονται σε τυχαίους λόγους (σ.<0,05).Индивидуальные различия между испытуе­мыми являются не более выраженными, чем различия, обусловленные случайными причинами.

7.2 Ανάλυση συσχέτισης

7.2.1 Έννοια της συσχέτισης

Ένας ερευνητής ενδιαφέρεται συχνά για το πώς δύο ή περισσότερες μεταβλητές σχετίζονται μεταξύ τους σε ένα ή περισσότερα δείγματα που μελετώνται. Για παράδειγμα, μπορούν οι μαθητές με υψηλά επίπεδα άγχους να επιδεικνύουν σταθερά ακαδημαϊκά επιτεύγματα ή το χρονικό διάστημα που εργάζεται ένας δάσκαλος σε ένα σχολείο σχετίζεται με το μέγεθος του μισθού του ή τι σχετίζεται περισσότερο με το επίπεδο νοητικής ανάπτυξης των μαθητών - τους επιδόσεις στα μαθηματικά ή στη λογοτεχνία κ.λπ. .;

Αυτό το είδος εξάρτησης μεταξύ μεταβλητών ονομάζεται συσχέτιση ή συσχέτιση. Συσχέτιση σύνδεση- πρόκειται για μια συντονισμένη αλλαγή σε δύο χαρακτηριστικά, που αντικατοπτρίζει το γεγονός ότι η μεταβλητότητα ενός χαρακτηριστικού είναι σύμφωνη με τη μεταβλητότητα του άλλου.

Είναι γνωστό, για παράδειγμα, ότι κατά μέσο όρο υπάρχει μια θετική σχέση μεταξύ του ύψους των ανθρώπων και του βάρους τους, και ότι όσο μεγαλύτερο είναι το ύψος, τόσο μεγαλύτερο είναι το βάρος του ατόμου. Ωστόσο, υπάρχουν εξαιρέσεις σε αυτόν τον κανόνα, όταν οι σχετικά κοντοί άνθρωποι είναι υπέρβαροι και, αντίθετα, τα ασθενικά άτομα με υψηλό ανάστημα έχουν χαμηλό βάρος. Ο λόγος για τέτοιες εξαιρέσεις είναι ότι κάθε βιολογικό, φυσιολογικό ή ψυχολογικό σημάδι καθορίζεται από την επίδραση πολλών παραγόντων: περιβαλλοντικοί, γενετικοί, κοινωνικοί, περιβαλλοντικοί κ.λπ.

Οι συνδέσεις συσχέτισης είναι πιθανολογικές αλλαγές που μπορούν να μελετηθούν μόνο σε αντιπροσωπευτικά δείγματα χρησιμοποιώντας τις μεθόδους της μαθηματικής στατιστικής. «Και οι δύο όροι», γράφει ο E.V. Σιδορένκο, - σύνδεση συσχέτισης και εξάρτηση συσχέτισης- χρησιμοποιούνται συχνά ως συνώνυμα. Η εξάρτηση συνεπάγεται επιρροή, σύνδεση - τυχόν συντονισμένες αλλαγές που μπορούν να εξηγηθούν με εκατοντάδες λόγους. Οι συνδέσεις συσχέτισης δεν μπορούν να θεωρηθούν ως απόδειξη μιας σχέσης αιτίου-αποτελέσματος· υποδεικνύουν μόνο ότι οι αλλαγές σε ένα χαρακτηριστικό συνήθως συνοδεύονται από ορισμένες αλλαγές σε ένα άλλο.

Εξάρτηση συσχέτισης - Πρόκειται για αλλαγές που εισάγουν τις τιμές ενός χαρακτηριστικού στην πιθανότητα εμφάνισης διαφορετικών τιμών ενός άλλου χαρακτηριστικού (E.V. Sidorenko, 2000).

Το έργο της ανάλυσης συσχέτισης καταλήγει στον καθορισμό της κατεύθυνσης (θετικής ή αρνητικής) και της μορφής (γραμμική, μη γραμμική) της σχέσης μεταξύ ποικίλων χαρακτηριστικών, μέτρηση της εγγύτητάς της και, τέλος, έλεγχος του επιπέδου σημαντικότητας των λαμβανόμενων συντελεστών συσχέτισης.

Οι συσχετισμοί ποικίλλουν σε μορφή, κατεύθυνση και βαθμό (δύναμη).

Κατά σχήμαη σχέση συσχέτισης μπορεί να είναι γραμμική ή καμπυλόγραμμη. Για παράδειγμα, η σχέση μεταξύ του αριθμού των προπονήσεων στον προσομοιωτή και του αριθμού των σωστά λυμένων προβλημάτων στη συνεδρία ελέγχου μπορεί να είναι απλή. Για παράδειγμα, η σχέση μεταξύ του επιπέδου κινήτρων και της αποτελεσματικότητας μιας εργασίας μπορεί να είναι καμπυλόγραμμη (βλ. Εικ. 1). Καθώς αυξάνεται το κίνητρο, αυξάνεται πρώτα η αποτελεσματικότητα της ολοκλήρωσης μιας εργασίας και, στη συνέχεια, επιτυγχάνεται το βέλτιστο επίπεδο κινήτρων, το οποίο αντιστοιχεί στη μέγιστη αποτελεσματικότητα της ολοκλήρωσης της εργασίας. Μια περαιτέρω αύξηση των κινήτρων συνοδεύεται από μείωση της αποτελεσματικότητας.

Εικ.1. Η σχέση μεταξύ της αποτελεσματικότητας της επίλυσης ενός προβλήματος

και τη δύναμη της τάσης παρακίνησης (σύμφωνα με τον J. W. A t k in son, 1974, σελ 200)

Προςη συσχέτιση μπορεί να είναι θετική («άμεση») και αρνητική («αντίστροφη»). Με θετική γραμμική συσχέτιση, οι υψηλότερες τιμές ενός χαρακτηριστικού αντιστοιχούν σε υψηλότερες τιμές ενός άλλου και οι χαμηλότερες τιμές ενός χαρακτηριστικού αντιστοιχούν σε χαμηλές τιμές ενός άλλου. Με αρνητική συσχέτιση, οι σχέσεις αντιστρέφονται. Με θετική συσχέτιση, ο συντελεστής συσχέτισης έχει θετικό πρόσημο, για παράδειγμαr =+0,207, με αρνητική συσχέτιση - αρνητικό πρόσημο, για παράδειγμαr = -0,207.

Βαθμός, δύναμη ή σφίξιμο Η σύνδεση συσχέτισης καθορίζεται από την τιμή του συντελεστή συσχέτισης.

Η ισχύς της σύνδεσης δεν εξαρτάται από την κατεύθυνσή της και καθορίζεται από την απόλυτη τιμή του συντελεστή συσχέτισης.

Μέγιστη δυνατή απόλυτη τιμή του συντελεστή συσχέτισηςr = 1,00; ελάχιστο r = 0,00.

Γενική ταξινόμηση των συσχετισμών (σύμφωνα με τον Ivanter E.V., Korosov A.V., 1992):

ισχυρός, ή σφιχτόςμε συντελεστή συσχέτισηςr >0,70;

μέση τιμήστο 0,50< r<0,69 ;

μέτριοςστο 0,30< r<0,49 ;

αδύναμοςστο 0,20< r<0,29 ;

πολύ αδύναμοστο r<0,19 .

Οι μεταβλητές X και Y μπορούν να μετρηθούν σε διαφορετικές κλίμακες, αυτό είναι που καθορίζει την επιλογή του κατάλληλου συντελεστή συσχέτισης (βλ. Πίνακα 3):

Πίνακας 3. Χρήση συντελεστή συσχέτισης ανάλογα με το είδος των μεταβλητών

Τύπος κλίμακας

Μέτρο σύνδεσης

Μεταβλητή Χ

Μεταβλητή Υ

Διάστημα ή σχέση

Διάστημα ή σχέση

Συντελεστής Pearson

Κατάταξη, διάστημα ή αναλογία

Συντελεστής Spearman

Κατάταξη

Κατάταξη

Συντελεστής Kendall

Διχασμένος

Διχασμένος

Συντελεστής "j"

Διχασμένος

Κατάταξη

Rank-biserial

Διχασμένος

Διάστημα ή σχέση

Biserial

7.2.2 Συντελεστής συσχέτισης Pearson

Ο όρος «συσχέτιση» εισήχθη στην επιστήμη από τον εξαιρετικό Άγγλο φυσιοδίφη Francis Galton το 1886. Ωστόσο, ο ακριβής τύπος για τον υπολογισμό του συντελεστή συσχέτισης αναπτύχθηκε από τον μαθητή του Karl Pearson.

Ο συντελεστής χαρακτηρίζει την παρουσία μόνο μιας γραμμικής σχέσης μεταξύ των χαρακτηριστικών, που συνήθως υποδηλώνεται με τα σύμβολα X και Y. Ο τύπος για τον υπολογισμό του συντελεστή συσχέτισης είναι κατασκευασμένος με τέτοιο τρόπο ώστε εάν η σχέση μεταξύ των χαρακτηριστικών είναι γραμμική, ο συντελεστής Pearson καθορίζει με ακρίβεια το εγγύτητα αυτής της σχέσης. Ως εκ τούτου, ονομάζεται επίσης συντελεστής γραμμικής συσχέτισης Pearson. Αν η σύνδεση μεταξύ των μεταβλητών X καιΥ δεν είναι γραμμική, τότε ο Pearson πρότεινε τη λεγόμενη σχέση συσχέτισης για να εκτιμήσει την εγγύτητα αυτής της σύνδεσης.

Η τιμή του συντελεστή γραμμικής συσχέτισης Pearson δεν μπορεί να υπερβαίνει το +1 και να είναι μικρότερη από -1. Αυτοί οι δύο αριθμοί +1 και -1 είναι τα όρια του συντελεστή συσχέτισης. Όταν ο υπολογισμός έχει ως αποτέλεσμα μια τιμή μεγαλύτερη από +1 ή μικρότερη από -1, έχει προκύψει σφάλμα στους υπολογισμούς.

Το πρόσημο του συντελεστή συσχέτισης είναι πολύ σημαντικό για την ερμηνεία της σχέσης που προκύπτει. Ας τονίσουμε για άλλη μια φορά ότι αν το πρόσημο του συντελεστή γραμμικής συσχέτισης είναι συν, τότε η σχέση μεταξύ των συσχετισμένων χαρακτηριστικών είναι τέτοια ώστε μια μεγαλύτερη τιμή ενός χαρακτηριστικού (μεταβλητής) αντιστοιχεί σε μεγαλύτερη τιμή ενός άλλου χαρακτηριστικού (άλλης μεταβλητής). Με άλλα λόγια, εάν ένας δείκτης (μεταβλητή) αυξάνεται, τότε ο άλλος δείκτης (μεταβλητή) αυξάνεται ανάλογα. Αυτή η εξάρτηση ονομάζεται ευθέως αναλογική εξάρτηση.

Εάν ληφθεί ένα σύμβολο μείον, τότε μια μεγαλύτερη τιμή ενός χαρακτηριστικού αντιστοιχεί σε μια μικρότερη τιμή ενός άλλου. Με άλλα λόγια, εάν υπάρχει πρόσημο μείον, μια αύξηση σε μια μεταβλητή (πρόσημο, τιμή) αντιστοιχεί σε μείωση σε μια άλλη μεταβλητή. Αυτή η εξάρτηση ονομάζεται αντιστρόφως ανάλογη εξάρτηση.

Γενικά, ο τύπος για τον υπολογισμό του συντελεστή συσχέτισης είναι:

(7)

Οπου Χ Εγώ- τιμές που λαμβάνονται στο δείγμα X,

y i- τιμές αποδεκτές στο δείγμα Y.

Μέσος όρος για Χ, - μέσος όρος για Υ.

Ο υπολογισμός του συντελεστή συσχέτισης Pearson υποθέτει ότι οι μεταβλητές X και Y κατανέμονται Πρόστιμο.

Ο τύπος (7) περιέχει την ποσότητα όταν διαιρείται με n (ο αριθμός των τιμών της μεταβλητής X ή Y) ονομάζεται συνδιακύμανση. Ο τύπος (7) υποθέτει επίσης ότι κατά τον υπολογισμό των συντελεστών συσχέτισης, ο αριθμός των τιμών της μεταβλητής X είναι ίσος με τον αριθμό των τιμών της μεταβλητήςΥ.

Αριθμός βαθμών ελευθερίας k = n -2.

Παράδειγμα 3.Σε 1 0 μαθητές δόθηκαν τεστ οπτικής-εικονικής και λεκτικής σκέψης. Ο μέσος χρόνος για την επίλυση δοκιμαστικών εργασιών μετρήθηκε σε δευτερόλεπτα. Ο ερευνητής ενδιαφέρεται για το ερώτημα: υπάρχει σχέση μεταξύ του χρόνου που απαιτείται για την επίλυση αυτών των προβλημάτων; Η μεταβλητή X υποδηλώνει το μέσο χρόνο για την επίλυση οπτικών-παραστατικών εργασιών και η μεταβλητή Y υποδηλώνει το μέσο χρόνο για την επίλυση εργασιών λεκτικού τεστ.

Λύση. Ας παρουσιάσουμε τα αρχικά δεδομένα με τη μορφή του Πίνακα 4, ο οποίος περιέχει πρόσθετες στήλες απαραίτητες για τον υπολογισμό χρησιμοποιώντας τον τύπο (7).

Πίνακας 4

Αριθμός θεμάτων

Χ

x i -

(x i - ) 2

y εγώ -

(y i -) 2

16,7

278,89

51,84

120,24

13,69

17,2

295,84

63,64

7,29

51,84

19,44

68,89

14,44

31,54

59,29

7,84

21,56

0,49

46,24

4,76

10,89

17,64

13,86

10,89

51,84

23,76

68,89

10,8

116,64

89,64

68,89

18,8

353,44

156,04

Αθροισμα

357

242

588,1

1007,6

416,6

Μέση τιμή

35,7

24,2

Υπολογίζουμε την εμπειρική τιμή του συντελεστή συσχέτισης χρησιμοποιώντας τον τύπο (7):

Καθορίζουμε τις κρίσιμες τιμές για τον λαμβανόμενο συντελεστή συσχέτισης σύμφωνα με τον πίνακα στο Παράρτημα 3. Όταν βρίσκουμε τις κρίσιμες τιμές για τον υπολογισμένο συντελεστή γραμμικής συσχέτισης Pearson, ο αριθμός των βαθμών ελευθερίας υπολογίζεται ως k = n – 2 = 8.

k crit = 0,72 > 0,54, επομένως, η υπόθεση H 1 απορρίπτεται και η υπόθεση γίνεται αποδεκτή H 0 , με άλλα λόγια, δεν έχει αποδειχθεί η σύνδεση μεταξύ του χρόνου επίλυσης εργασιών οπτικο-παραστατικού και λεκτικού τεστ.

7.3 Ανάλυση παλινδρόμησης

Πρόκειται για μια ομάδα μεθόδων που στοχεύουν στον εντοπισμό και τη μαθηματική έκφραση αυτών των αλλαγών και εξαρτήσεων που λαμβάνουν χώρα σε ένα σύστημα τυχαίων μεταβλητών. Εάν ένα τέτοιο σύστημα μοντελοποιεί ένα παιδαγωγικό, τότε, κατά συνέπεια, μέσω της ανάλυσης παλινδρόμησης εντοπίζονται και εκφράζονται μαθηματικά τα ψυχολογικά και παιδαγωγικά φαινόμενα και οι μεταξύ τους εξαρτήσεις. Τα χαρακτηριστικά αυτών των φαινομένων μετρώνται σε διαφορετικές κλίμακες, γεγονός που επιβάλλει περιορισμούς στους τρόπους μαθηματικής έκφρασης αλλαγών και εξαρτήσεων που μελετά ο δάσκαλος-ερευνητής.

Οι μέθοδοι ανάλυσης παλινδρόμησης έχουν σχεδιαστεί κυρίως για την περίπτωση μιας σταθερής κανονικής κατανομής, στην οποία οι αλλαγές από δοκιμή σε δοκιμή εμφανίζονται μόνο με τη μορφή ανεξάρτητων δοκιμών.

Εντοπίζονται διάφορα τυπικά προβλήματα ανάλυσης παλινδρόμησης. Μπορούν να είναι απλά ή σύνθετα ως προς τη διατύπωση, τα μαθηματικά μέσα και την ένταση εργασίας. Ας απαριθμήσουμε και ας εξετάσουμε με παραδείγματα εκείνα που φαίνεται να είναι τα κύρια.

Το πρώτο καθήκον είναι προσδιορίζουν το γεγονός της μεταβλητότητας το φαινόμενο που μελετάται υπό ορισμένες, αλλά όχι πάντα σαφώς καθορισμένες, συνθήκες. Στην προηγούμενη διάλεξη, λύσαμε ήδη αυτό το πρόβλημα χρησιμοποιώντας παραμετρικά και μη παραμετρικά κριτήρια.

Δεύτερη εργασία - προσδιορίσει μια τάση ως περιοδική αλλαγή σε ένα χαρακτηριστικό. Αυτό το ίδιο το χαρακτηριστικό μπορεί να εξαρτάται ή να μην εξαρτάται από τη μεταβλητή συνθήκης (μπορεί να εξαρτάται από συνθήκες άγνωστες ή μη ελεγχόμενες από τον ερευνητή). Αλλά αυτό δεν είναι σημαντικό για την εργασία που εξετάζουμε, η οποία περιορίζεται μόνο στον προσδιορισμό της τάσης και των χαρακτηριστικών της.

Ο έλεγχος υποθέσεων σχετικά με την απουσία ή την παρουσία μιας τάσης μπορεί να πραγματοποιηθεί χρησιμοποιώντας το κριτήριο Abbe . κριτήριο Abbeσχεδιασμένο για να ελέγξει υποθέσεις σχετικά με την ισότητα των μέσων τιμών που καθορίστηκαν για το 4

Η εμπειρική τιμή του κριτηρίου Abbe υπολογίζεται από τον τύπο:

(8)

πού είναι ο αριθμητικός μέσος όρος του δείγματος;

Π– αριθμός τιμών στο δείγμα.

Σύμφωνα με το κριτήριο, η υπόθεση της ισότητας των μέσων απορρίπτεται (η εναλλακτική υπόθεση γίνεται αποδεκτή) εάν η τιμή της στατιστικής είναι . Η πίνακας (κρίσιμη) αξία των στατιστικών καθορίζεται από τον πίνακα για το κριτήριο q του Abbe, το οποίο, με συντομογραφίες, δανείστηκε από το βιβλίο του L.N. Bolysheva και N.V. Smirnova (βλ. Παράρτημα 3).

Τέτοιες ποσότητες για τις οποίες ισχύει το κριτήριο Abbe μπορεί να είναι μερίδια δείγματος ή ποσοστά, αριθμητικοί μέσοι όροι και άλλες στατιστικές κατανομών δειγμάτων, εάν είναι κοντά στο κανονικό (ή έχουν προηγουμένως κανονικοποιηθεί). Επομένως, το κριτήριο Abbe μπορεί να βρει ευρεία εφαρμογή στην ψυχολογική και παιδαγωγική έρευνα. Ας εξετάσουμε ένα παράδειγμα προσδιορισμού μιας τάσης χρησιμοποιώντας το κριτήριο Abbe.

Παράδειγμα 4.Στον πίνακα Το 5 δείχνει τη δυναμική του ποσοστού των μαθητών IV μάθημα, που έδωσε εξετάσεις σε χειμερινές συνεδρίες με «αριστεία» κατά τη διάρκεια 10 ετών εργασίας σε μια από τις πανεπιστημιακές σχολές. Απαιτείται να διαπιστωθεί εάν υπάρχει τάση αύξησης των ακαδημαϊκών επιδόσεων.

Πίνακας 5. Δυναμική του ποσοστού των αριστούχων τεταρτοετών φοιτητών πάνω από 10 χρόνια εργασίας της σχολής

Ακαδημαϊκό έτος

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

Οπως και μηδενικόΔοκιμάζουμε την υπόθεση για την απουσία τάσης, δηλαδή για την ισότητα των ποσοστών.

Υπολογίζουμε τον μέσο όρο των ποσοστών που δίνονται στον πίνακα. 5, βρίσκουμε ότι =21,5. Υπολογίζουμε τις διαφορές μεταξύ των επόμενων και των προηγούμενων τιμών στο δείγμα, τις τετραγωνίζουμε και τις αθροίζουμε:

Ομοίως υπολογίζει τον παρονομαστή στον τύπο (8), αθροίζοντας τα τετράγωνα των διαφορών μεταξύ κάθε μέτρησης και του αριθμητικού μέσου όρου:

Τώρα χρησιμοποιώντας τον τύπο (8) παίρνουμε:

Στον πίνακα κριτηρίων Abbe από το Παράρτημα 3, βρίσκουμε ότι με n = 10 και επίπεδο σημαντικότητας 0,05, η κρίσιμη τιμή είναι μεγαλύτερη από το 0,41 που λάβαμε, επομένως η υπόθεση σχετικά με την ισότητα του ποσοστού των «αριστούχων μαθητών» πρέπει να είναι απορρίφθηκε και μπορούμε να δεχτούμε την εναλλακτική υπόθεση σχετικά με την παρουσία μιας τάσης .

Το τρίτο καθήκον είναι προσδιορισμός ενός προτύπου που εκφράζεται με τη μορφή εξίσωσης συσχέτισης (παλίνδρομο).

Παράδειγμα 5.Ο Εσθονός ερευνητής J. Mikk, μελετώντας τις δυσκολίες κατανόησης του κειμένου, καθιέρωσε έναν «φόρμουλα αναγνωσιμότητας», που είναι μια πολλαπλή γραμμική παλινδρόμηση:

Αξιολόγηση της δυσκολίας κατανόησης του κειμένου,

όπου x 1 είναι το μήκος των ανεξάρτητων προτάσεων στον αριθμό των τυπωμένων χαρακτήρων,

x 2 - ποσοστό διαφορετικών άγνωστων λέξεων,

x 3 - αφαιρετικότητα επαναλαμβανόμενων εννοιών που εκφράζονται με ουσιαστικά .

Συγκρίνοντας τους συντελεστές παλινδρόμησης που εκφράζουν το βαθμό επιρροής των παραγόντων, μπορεί κανείς να δει ότι η δυσκολία κατανόησης ενός κειμένου καθορίζεται κυρίως από την αφηρότητά του. Η δυσκολία κατανόησης του κειμένου εξαρτάται κατά το ήμισυ (0,27) από τον αριθμό των άγνωστων λέξεων και πρακτικά δεν εξαρτάται καθόλου από το μήκος της πρότασης.

  • Ενότητες του ιστότοπου