დისპერსიის ანალიზი. დისპერსიული კომპონენტების მრავალვარიანტული ანალიზის ANOVA მოდელი

დისპერსიის ანალიზი

1. ვარიაციის ანალიზის კონცეფცია

დისპერსიის ანალიზიარის რაიმე კონტროლირებადი ცვლადი ფაქტორების გავლენის ქვეშ მახასიათებლის ცვალებადობის ანალიზი. უცხოურ ლიტერატურაში დისპერსიის ანალიზს ხშირად მოიხსენიებენ როგორც ANOVA, რომელიც ითარგმნება როგორც ცვალებადობის ანალიზი (Analysis of Variance).

ANOVA პრობლემაშედგება მახასიათებლის ზოგადი ცვალებადობისგან განსხვავებული სახის ცვალებადობის გამოყოფაში:

ა) ცვალებადობა შესწავლილი თითოეული დამოუკიდებელი ცვლადის მოქმედებით;

ბ) ცვალებადობა შესწავლილი დამოუკიდებელი ცვლადების ურთიერთქმედების გამო;

გ) შემთხვევითი ცვალებადობა ყველა სხვა უცნობი ცვლადის გამო.

შესწავლილი ცვლადების მოქმედებით და მათი ურთიერთქმედებით გამოწვეული ცვალებადობა კორელაციაშია შემთხვევით ცვალებადობასთან. ამ ურთიერთობის მაჩვენებელია ფიშერის F ტესტი.

F კრიტერიუმის გამოთვლის ფორმულა მოიცავს დისპერსიების შეფასებას, ანუ ატრიბუტის განაწილების პარამეტრებს, შესაბამისად F კრიტერიუმი პარამეტრული კრიტერიუმია.

რაც უფრო მეტად არის თვისების ცვალებადობა განპირობებული შესწავლილი ცვლადებით (ფაქტორებით) ან მათი ურთიერთქმედებით, მით უფრო მაღალია ემპირიული კრიტერიუმის მნიშვნელობები.

Ნული დისპერსიის ანალიზის ჰიპოთეზაში ნათქვამია, რომ შესწავლილი ეფექტური მახასიათებლის საშუალო მნიშვნელობები ყველა გრადაციაში ერთნაირია.

ალტერნატივა ჰიპოთეზაში ნათქვამია, რომ მიღებული მახასიათებლის საშუალო მნიშვნელობები შესწავლილი ფაქტორის სხვადასხვა გრადაციაში განსხვავებულია.

დისპერსიის ანალიზი საშუალებას გვაძლევს განვაცხადოთ ცვლილება მახასიათებლებში, მაგრამ არ მიუთითებს მიმართულებაეს ცვლილებები.

დისპერსიული ანალიზის განხილვა დავიწყოთ უმარტივესი შემთხვევით, როდესაც ვსწავლობთ მხოლოდ მოქმედებას ერთიცვლადი (ერთი ფაქტორი).

2. დისპერსიის ცალმხრივი ანალიზი დაუკავშირებელი ნიმუშებისთვის

2.1. მეთოდის მიზანი

დისპერსიის ერთფაქტორიანი ანალიზის მეთოდი გამოიყენება იმ შემთხვევებში, როდესაც ეფექტური მახასიათებლის ცვლილებები შესწავლილია ცვალებადი პირობების ან ფაქტორის გრადაციის გავლენის ქვეშ. მეთოდის ამ ვერსიაში ფაქტორების თითოეული გრადაციის გავლენა არის განსხვავებულისაგნების ნიმუშები. ფაქტორის მინიმუმ სამი გრადაცია უნდა იყოს. (შეიძლება იყოს ორი გრადაცია, მაგრამ ამ შემთხვევაში ჩვენ ვერ დავადგინეთ არაწრფივი დამოკიდებულებები და უფრო გონივრული ჩანს უფრო მარტივის გამოყენება).

ამ ტიპის ანალიზის არაპარამეტრული ვერსიაა Kruskal-Wallis H ტესტი.

ჰიპოთეზები

H 0: განსხვავება ფაქტორების კლასებს შორის (განსხვავებული პირობები) არ აღემატება შემთხვევით განსხვავებებს თითოეულ ჯგუფში.

H 1: განსხვავებები ფაქტორების კლასებს შორის (სხვადასხვა პირობები) უფრო მეტია, ვიდრე შემთხვევითი განსხვავებები თითოეულ ჯგუფში.

2.2. ვარიაციის ცალმხრივი ანალიზის შეზღუდვები დაუკავშირებელი ნიმუშებისთვის

1. დისპერსიის ცალმხრივი ანალიზი მოითხოვს ფაქტორის მინიმუმ სამ გრადაციას და მინიმუმ ორ საგანს თითოეულ გრადაციაში.

2. მიღებული მახასიათებელი ნორმალურად უნდა იყოს განაწილებული შესასწავლ ნიმუშში.

მართალია, ჩვეულებრივ არ არის მითითებული, ვსაუბრობთ მახასიათებლის განაწილებაზე მთელ გამოკითხულ ნიმუშში თუ მის იმ ნაწილში, რომელიც ქმნის დისპერსიულ კომპლექსს.

3. პრობლემის გადაჭრის მაგალითი ცალმხრივი დისპერსიის ანალიზის მეთოდით დაუკავშირებელი ნიმუშებისთვის მაგალითის გამოყენებით:

ექვსი საგნისგან შემდგარ სამ სხვადასხვა ჯგუფს გადაეცა ათი სიტყვის სია. პირველ ჯგუფს სიტყვები წარუდგინეს დაბალი სიჩქარით - 1 სიტყვა 5 წამში, მეორე ჯგუფს საშუალო სიჩქარით - 1 სიტყვა 2 წამში, ხოლო მესამე ჯგუფს დიდი სიჩქარით - 1 სიტყვა წამში. რეპროდუცირების შესრულება ნაწინასწარმეტყველები იყო, რომ დამოკიდებული იქნებოდა სიტყვების პრეზენტაციის სიჩქარეზე. შედეგები წარმოდგენილია ცხრილში. 1.

რეპროდუცირებული სიტყვების რაოდენობა ცხრილი 1

თემა No.

დაბალი სიჩქარე

საშუალო სიჩქარე

მაღალი სიჩქარე

მთლიანი რაოდენობა

H 0: განსხვავებები სიტყვის წარმოების ხანგრძლივობით შორისჯგუფები არ არის უფრო გამოხატული, ვიდრე შემთხვევითი განსხვავებები შიგნითთითოეული ჯგუფი.

H1: განსხვავებები სიტყვების წარმოების მოცულობაში შორისჯგუფები უფრო გამოხატულია, ვიდრე შემთხვევითი განსხვავებები შიგნითთითოეული ჯგუფი. ცხრილში წარმოდგენილი ექსპერიმენტული მნიშვნელობების გამოყენებით. 1, ჩვენ დავამყარებთ რამდენიმე მნიშვნელობას, რომელიც საჭირო იქნება F კრიტერიუმის გამოსათვლელად.

ცალმხრივი დისპერსიული ანალიზისთვის ძირითადი რაოდენობების გამოთვლა მოცემულია ცხრილში:

მაგიდა 2

ცხრილი 3

ოპერაციების თანმიმდევრობა ცალმხრივი დისპერსიის ანალიზში დაუკავშირებელი ნიმუშებისთვის

ხშირად გვხვდება ამ და შემდეგ ცხრილებში, აღნიშვნა SS არის აბრევიატურა "კვადრატების ჯამი". ეს აბრევიატურა ყველაზე ხშირად გამოიყენება თარგმნილ წყაროებში.

SS ფაქტინიშნავს მახასიათებლის ცვალებადობას შესწავლილი ფაქტორის მოქმედებით;

SS ზოგადად- ნიშან-თვისების ზოგადი ცვალებადობა;

C.A.-ცვალებადობა გამოუანგარიშებელი ფაქტორების გამო, „შემთხვევითი“ ან „ნარჩენი“ ცვალებადობა.

ᲥᲐᲚᲑᲐᲢᲝᲜᲘ- „საშუალო კვადრატი“, ან კვადრატების ჯამის მათემატიკური მოლოდინი, შესაბამისი SS-ის საშუალო მნიშვნელობა.

დფ - თავისუფლების ხარისხების რაოდენობა, რომელიც არაპარამეტრული კრიტერიუმების განხილვისას აღვნიშნეთ ბერძნული ასოთი .

დასკვნა: H 0 უარყოფილია. H 1 მიღებულია. ჯგუფებს შორის სიტყვების გახსენებაში განსხვავებები უფრო დიდი იყო, ვიდრე შემთხვევითი განსხვავებები თითოეულ ჯგუფში (α=0.05). ასე რომ, სიტყვების წარმოდგენის სიჩქარე გავლენას ახდენს მათი რეპროდუქციის მოცულობაზე.

Excel-ში პრობლემის გადაჭრის მაგალითი მოცემულია ქვემოთ:

საწყისი მონაცემები:

ბრძანების გამოყენებით: Tools->Data Analysis->One-way ANOVA ვიღებთ შემდეგ შედეგებს:

როგორც უკვე აღვნიშნეთ, დისპერსიული მეთოდი მჭიდროდ არის დაკავშირებული სტატისტიკურ დაჯგუფებებთან და ვარაუდობს, რომ შესწავლილი პოპულაცია იყოფა ჯგუფებად ფაქტორების მახასიათებლების მიხედვით, რომელთა გავლენაც შესწავლილი უნდა იყოს.

დისპერსიული ანალიზის საფუძველზე წარმოიქმნება შემდეგი:

1. ჯგუფურ საშუალებებში განსხვავებების სანდოობის შეფასება ერთი ან რამდენიმე ფაქტორის მახასიათებლებისთვის;

2. ფაქტორების ურთიერთქმედების სანდოობის შეფასება;

3. საშუალო წყვილებს შორის ნაწილობრივი განსხვავებების შეფასება.

დისპერსიული ანალიზის გამოყენება ემყარება მახასიათებლის ვარიაციების (ვარიაციების) კომპონენტებად დაშლის კანონს.

დაჯგუფების დროს მიღებული მახასიათებლის მთლიანი ვარიაცია D o შეიძლება დაიყოს შემდეგ კომპონენტებად:

1. ჯგუფთაშორისად D m ასოცირდება დაჯგუფების მახასიათებელთან;

2. ნარჩენებისთვის(შიდა ჯგუფში) D B არ არის დაკავშირებული დაჯგუფების მახასიათებელთან.

ამ ინდიკატორებს შორის კავშირი გამოიხატება შემდეგნაირად:

D o = D m + D in. (1.30)

მოდით შევხედოთ დისპერსიული ანალიზის გამოყენებას მაგალითის გამოყენებით.

ვთქვათ, გსურთ დაამტკიცოთ, მოქმედებს თუ არა თესვის ვადები ხორბლის მოსავლიანობაზე. საწყისი ექსპერიმენტული მონაცემები დისპერსიის ანალიზისთვის წარმოდგენილია ცხრილში. 8.

ცხრილი 8

ამ მაგალითში N = 32, K = 4, l = 8.

მოდით განვსაზღვროთ მოსავლიანობის მთლიანი ცვალებადობა, რომელიც არის ნიშან-თვისების ცალკეული მნიშვნელობების კვადრატული გადახრების ჯამი საერთო საშუალოდან:

სადაც N არის მოსახლეობის ერთეულების რაოდენობა; Y i – ინდივიდუალური მოსავლიანობის მნიშვნელობები; Y o არის მთლიანი საშუალო მოსავლიანობა მთელი მოსახლეობისთვის.

ჯგუფთაშორისი მთლიანი ვარიაციის დასადგენად, რომელიც განსაზღვრავს ეფექტური მახასიათებლის ცვალებადობას შესწავლილი ფაქტორის გამო, აუცილებელია იცოდეთ ეფექტური მახასიათებლის საშუალო მნიშვნელობები თითოეული ჯგუფისთვის. ეს ჯამური ვარიაცია უდრის ჯგუფის საშუალოების კვადრატული გადახრების ჯამს თვისების საერთო საშუალო მნიშვნელობიდან, შეწონილი თითოეულ ჯგუფში პოპულაციის ერთეულების რაოდენობის მიხედვით:

ჯგუფში მთლიანი ცვალებადობა უდრის ნიშან-თვისების ცალკეული მნიშვნელობების კვადრატული გადახრების ჯამს თითოეული ჯგუფის ჯგუფის საშუალოდან, რომელიც ჯამდება პოპულაციის ყველა ჯგუფზე.

ფაქტორის გავლენა მიღებულ მახასიათებელზე ვლინდება Dm-სა და Dv-ს შორის ურთიერთობაში: რაც უფრო ძლიერია ფაქტორის გავლენა შესასწავლი მახასიათებლის მნიშვნელობაზე, მით მეტია Dm და ნაკლები Dv.

დისპერსიის ანალიზის ჩასატარებლად აუცილებელია ნიშან-თვისების ვარიაციის წყაროების დადგენა, ვარიაციის მოცულობის წყაროს მიხედვით და თავისუფლების ხარისხების დადგენა ვარიაციის თითოეული კომპონენტისთვის.

ვარიაციის ოდენობა უკვე დადგენილია, ახლა საჭიროა განისაზღვროს ვარიაციის თავისუფლების ხარისხების რაოდენობა. თავისუფლების ხარისხების რაოდენობა არის მახასიათებლის ინდივიდუალური მნიშვნელობების დამოუკიდებელი გადახრების რაოდენობა მისი საშუალო მნიშვნელობიდან. თავისუფლების ხარისხების მთლიანი რაოდენობა, რომელიც შეესაბამება ANOVA-ში კვადრატული გადახრების ჯამს, იშლება ვარიაციის კომპონენტებად. ამრიგად, კვადრატული გადახრების ჯამი D o შეესაბამება ცვალებადობის თავისუფლების ხარისხების რაოდენობას, ტოლია N – 1 = 31. ჯგუფის ვარიაცია D m შეესაბამება ვარიაციის თავისუფლების ხარისხების რაოდენობას, ტოლია K – 1. = 3. ჯგუფშიდა ნარჩენი ვარიაცია შეესაბამება ვარიაციის თავისუფლების ხარისხების რაოდენობას N – K = 28-ის ტოლი.


ახლა, კვადრატული გადახრების ჯამის და თავისუფლების ხარისხების რაოდენობის ცოდნა, ჩვენ შეგვიძლია განვსაზღვროთ დისპერსიები თითოეული კომპონენტისთვის. ავღნიშნოთ ეს დისპერსიები: d m - ჯგუფი და d in - შიდაჯგუფი.

ამ დისპერსიების გამოთვლის შემდეგ, ჩვენ გავაგრძელებთ ფაქტორის გავლენის მნიშვნელობის დადგენას მიღებულ ატრიბუტზე. ამისათვის ჩვენ ვპოულობთ თანაფარდობას: d M / d B = F f,

რაოდენობა F f, ე.წ ფიშერის კრიტერიუმი , ცხრილთან შედარებით, F ცხრილი. როგორც უკვე აღვნიშნეთ, თუ F f > F ცხრილი, მაშინ დადასტურებულია ფაქტორის გავლენა ეფექტურ ატრიბუტზე. თუ F f< F табл то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, следовательно, не доказывает с достаточной вероятностью влияние изучаемого фактора.

თეორიული მნიშვნელობა ასოცირდება ალბათობასთან, ხოლო ცხრილში მისი მნიშვნელობა მოცემულია განსჯის ალბათობის გარკვეულ დონეზე. დანართი შეიცავს ცხრილს, რომელიც საშუალებას გაძლევთ დააყენოთ შესაძლო F მნიშვნელობა განსჯის ალბათობისთვის, ყველაზე ხშირად გამოყენებული: "ნულის ჰიპოთეზის" ალბათობის დონეა 0.05. „ნულო ჰიპოთეზის“ ალბათობების ნაცვლად, ცხრილს შეიძლება ეწოდოს ცხრილი ფაქტორების გავლენის მნიშვნელობის 0,95 ალბათობისთვის. ალბათობის დონის გაზრდისთვის საჭიროა ცხრილის უფრო მაღალი F მნიშვნელობა შედარებისთვის.

F ცხრილის მნიშვნელობა ასევე დამოკიდებულია შედარებული ორი დისპერსიის თავისუფლების ხარისხების რაოდენობაზე. თუ თავისუფლების ხარისხების რიცხვი მიისწრაფვის უსასრულობისკენ, მაშინ F ცხრილი მიდრეკილია ერთიანობისკენ.

F ცხრილის მნიშვნელობების ცხრილი აგებულია შემდეგნაირად: ცხრილის სვეტები მიუთითებს ცვალებადობის თავისუფლების ხარისხს უფრო დიდი დისპერსიისთვის, ხოლო რიგები მიუთითებს თავისუფლების ხარისხს მცირე (ჯგუფის შიგნით) დისპერსიისთვის. F-ის მნიშვნელობა გვხვდება ვარიაციის თავისუფლების შესაბამისი ხარისხების სვეტისა და მწკრივის კვეთაზე.

ასე რომ, ჩვენს მაგალითში, F f = 21.3/3.8 = 5.6. F ცხრილის ცხრილის მნიშვნელობა 0.95 ალბათობისთვის და თავისუფლების ხარისხი, შესაბამისად უდრის 3 და 28, F ცხრილი = 2.95.

ექსპერიმენტულად მიღებული F f-ის მნიშვნელობა აჭარბებს თეორიულ მნიშვნელობას თუნდაც 0,99 ალბათობისთვის. შესაბამისად, გამოცდილება 0,99-ზე მეტი ალბათობით ადასტურებს შესწავლილი ფაქტორის გავლენას მოსავლიანობაზე, ანუ გამოცდილება შეიძლება ჩაითვალოს საიმედოდ, დადასტურებულად და შესაბამისად თესვის დრო მნიშვნელოვან გავლენას ახდენს ხორბლის მოსავლიანობაზე. თესვის ოპტიმალურ პერიოდად უნდა ჩაითვალოს 10-დან 15 მაისამდე პერიოდი, ვინაიდან სწორედ ამ თესვის პერიოდში მიიღეს საუკეთესო მოსავლიანობა.

ჩვენ გამოვიკვლიეთ დისპერსიის ანალიზის მეთოდი ერთი მახასიათებლის მიხედვით დაჯგუფებისას და ჯგუფში რეპლიკატების შემთხვევით განაწილებისას. თუმცა, ხშირად ხდება, რომ ექსპერიმენტულ ნაკვეთს აქვს გარკვეული განსხვავებები ნიადაგის ნაყოფიერებაში და ა.შ. ამიტომ, შეიძლება შეიქმნას სიტუაცია, რომ ერთ-ერთი ვარიანტის ნაკვეთების უფრო დიდი რაოდენობა მოხვდება საუკეთესო ნაწილში და მისი მაჩვენებლები გადაჭარბებული იქნება და მეორე ვარიანტის - ყველაზე უარესი ნაწილით და შედეგები ამ შემთხვევაში ბუნებრივად უარესი იქნება, ანუ დაუფასებელია.

ცვალებადობის გამორიცხვის მიზნით, რომელიც გამოწვეულია ექსპერიმენტთან დაკავშირებული მიზეზებით, აუცილებელია რეპლიკებისგან (ბლოკებიდან) გამოთვლილი დისპერსიის იზოლირება ჯგუფური (ნარჩენი) ვარიაციისგან.

კვადრატული გადახრების ჯამი ამ შემთხვევაში იყოფა 3 კომპონენტად:

D o = D m + D გამეორება + D დასვენება. (1.33)

ჩვენი მაგალითისთვის, გამეორებებით გამოწვეული კვადრატული გადახრების ჯამი ტოლი იქნება:

ამრიგად, კვადრატული გადახრების ფაქტობრივი შემთხვევითი ჯამი ტოლი იქნება:

D დანარჩენი = D in – D გამეორება; D დანარჩენი = 106 – 44 = 62.

ნარჩენი დისპერსიისთვის თავისუფლების ხარისხების რაოდენობა იქნება 28 – 7 = 21. დისპერსიული ანალიზის შედეგები წარმოდგენილია ცხრილში. 9.

ცხრილი 9

ვინაიდან F-კრიტერიუმის ფაქტობრივი მნიშვნელობები 0,95 ალბათობისთვის აღემატება ცხრილის მნიშვნელობებს, თესვის თარიღებისა და გამეორებების გავლენა ხორბლის მოსავლიანობაზე მნიშვნელოვანი უნდა ჩაითვალოს. ექსპერიმენტის აგების განხილულ მეთოდს, როდესაც საიტი წინასწარ იყოფა ბლოკებად, შედარებით გასწორებული პირობებით და გამოცდილი ვარიანტები ნაწილდება ბლოკში შემთხვევითი თანმიმდევრობით, ეწოდება რანდომიზებული ბლოკების მეთოდს.

დისპერსიის ანალიზის გამოყენებით, შეგიძლიათ შეისწავლოთ არა მხოლოდ ერთი ფაქტორის გავლენა შედეგზე, არამედ ორი ან მეტი. ამ შემთხვევაში დისპერსიის ანალიზი ე.წ დისპერსიის მრავალვარიანტული ანალიზი .

ორმხრივი ANOVA განსხვავდება ორი ერთფაქტორიანისაგან იმით შეუძლია უპასუხოს შემდეგ კითხვებს:

1. 1 რა გავლენას ახდენს ორივე ფაქტორი ერთად?

2. რა როლი აქვს ამ ფაქტორების ერთობლიობას?

განვიხილოთ ექსპერიმენტის დისპერსიის ანალიზი, რომელშიც აუცილებელია ხორბლის მოსავლიანობაზე არა მხოლოდ თესვის ვადების, არამედ ჯიშების გავლენის იდენტიფიცირება (ცხრილი 10).

ცხრილი 10. ექსპერიმენტული მონაცემები თესვის ვადების და ჯიშების გავლენის შესახებ ხორბლის მოსავლიანობაზე

არის ინდივიდუალური მნიშვნელობების კვადრატული გადახრების ჯამი საერთო საშუალოდან.

თესვის დროისა და ჯიშის ერთობლივი გავლენის ცვალებადობა

არის ქვეჯგუფის საშუალებების კვადრატული გადახრების ჯამი საერთო საშუალოდან, შეწონილი გამეორებების რაოდენობის მიხედვით, ანუ 4-ით.

ცვალებადობის გაანგარიშება მხოლოდ თესვის დროის გავლენის საფუძველზე:

ნარჩენი ცვალებადობა განისაზღვრება, როგორც განსხვავება მთლიან ვარიაციებსა და შესწავლილი ფაქტორების ერთობლივ გავლენას შორის:

D დანარჩენი = D o – D ps = 170 – 96 = 74.

ყველა გამოთვლა შეიძლება წარმოდგენილი იყოს ცხრილის სახით (ცხრილი 11).

ცხრილი 11. დისპერსიული ანალიზის შედეგები

დისპერსიული ანალიზის შედეგები აჩვენებს, რომ შესწავლილი ფაქტორების, ანუ თესვის დროისა და ჯიშის გავლენა ხორბლის მოსავლიანობაზე მნიშვნელოვანია, რადგან თითოეული ფაქტორის ფაქტობრივი F კრიტერიუმები მნიშვნელოვნად აღემატება ცხრილის შესაბამის ხარისხებს. თავისუფლების და ამავე დროს საკმაოდ მაღალი ალბათობით (p = 0,99). ამ შემთხვევაში ფაქტორების ერთობლიობის გავლენა არ არსებობს, ვინაიდან ფაქტორები ერთმანეთისგან დამოუკიდებელია.

შედეგზე სამი ფაქტორის გავლენის ანალიზი ხორციელდება იმავე პრინციპით, როგორც ორი ფაქტორისთვის, მხოლოდ ამ შემთხვევაში იქნება სამი ვარიაცია ფაქტორებისთვის და ოთხი ვარიაცია ფაქტორების ერთობლიობისთვის. ფაქტორების რაოდენობის მატებასთან ერთად, საანგარიშო სამუშაოების მოცულობა მკვეთრად იზრდება და გარდა ამისა, ძნელი ხდება საწყისი ინფორმაციის კომბინირებულ ცხრილში მოწყობა. აქედან გამომდინარე, ძნელად მიზანშეწონილია მრავალი ფაქტორის გავლენის შესწავლა შედეგზე დისპერსიული ანალიზის გამოყენებით; უმჯობესია ავიღოთ უფრო მცირე რაოდენობა, მაგრამ აირჩიოთ ყველაზე მნიშვნელოვანი ფაქტორები ეკონომიკური ანალიზის თვალსაზრისით.

ხშირად მკვლევარს უწევს საქმე ე.წ. არაპროპორციულ დისპერსიულ კომპლექსებთან, ანუ მათთან, რომლებშიც არ არის დაცული ვარიანტების რაოდენობის პროპორციულობა.

ასეთ კომპლექსებში, ფაქტორების მთლიანი ეფექტის ცვალებადობა არ არის ტოლი ფაქტორებს შორის ვარიაციის ჯამს და ფაქტორების ერთობლიობის ცვალებადობას. იგი განსხვავდება ოდენობით, რაც დამოკიდებულია პროპორციულობის დარღვევის შედეგად წარმოქმნილ ინდივიდუალურ ფაქტორებს შორის კავშირის ხარისხზე.

ამ შემთხვევაში, სირთულეები წარმოიქმნება თითოეული ფაქტორის გავლენის ხარისხის განსაზღვრისას, რადგან ინდივიდუალური გავლენის ჯამი არ არის მთლიანი გავლენის ტოლი.

არაპროპორციული კომპლექსის ერთ სტრუქტურამდე შემცირების ერთ-ერთი გზაა მისი ჩანაცვლება პროპორციული კომპლექსით, რომელშიც სიხშირეები საშუალოდ ხდება ჯგუფებში. როდესაც ასეთი ჩანაცვლება ხდება, პრობლემა წყდება პროპორციული კომპლექსების პრინციპების მიხედვით.

ვარიაციის ანალიზი არის სტატისტიკური მეთოდების ერთობლიობა, რომელიც შექმნილია ჰიპოთეზების შესამოწმებლად გარკვეულ მახასიათებლებსა და შესწავლილ ფაქტორებს შორის ურთიერთობის შესახებ, რომლებსაც არ აქვთ რაოდენობრივი აღწერა, აგრეთვე ფაქტორების გავლენის ხარისხისა და მათი ურთიერთქმედების დასადგენად. სპეციალიზებულ ლიტერატურაში მას ხშირად უწოდებენ ANOVA-ს (ინგლისური სახელწოდებიდან Analysis of Variations). ეს მეთოდი პირველად რ.ფიშერმა 1925 წელს შეიმუშავა.

ვარიაციის ანალიზის სახეები და კრიტერიუმები

ეს მეთოდი გამოიყენება თვისებრივი (ნომინალური) მახასიათებლებისა და რაოდენობრივი (უწყვეტი) ცვლადის კავშირის შესასწავლად. არსებითად, ის ამოწმებს ჰიპოთეზას რამდენიმე ნიმუშის არითმეტიკული საშუალებების ტოლობის შესახებ. ამრიგად, ის შეიძლება ჩაითვალოს პარამეტრულ კრიტერიუმად რამდენიმე ნიმუშის ცენტრის ერთდროულად შესადარებლად. თუ ეს მეთოდი გამოიყენება ორ ნიმუშზე, დისპერსიული ანალიზის შედეგები იდენტური იქნება Student-ის t-ტესტის შედეგებისა. თუმცა, სხვა კრიტერიუმებისგან განსხვავებით, ეს კვლევა პრობლემის უფრო დეტალურად შესწავლის საშუალებას გვაძლევს.

სტატისტიკაში დისპერსიული ანალიზი ეფუძნება კანონს: გაერთიანებული ნიმუშის კვადრატული გადახრების ჯამი უდრის კვადრატულ შიდაჯგუფურ გადახრებს და კვადრატულ ჯგუფთაშორის გადახრების ჯამს. კვლევა იყენებს ფიშერის ტესტს ჯგუფთაშორის და ჯგუფურ დისპერსიებს შორის სხვაობის მნიშვნელობის დასადგენად. თუმცა, ამის აუცილებელი წინაპირობაა ნიმუშების განაწილების ნორმალურობა და ჰომოსკედასტურობა (ვარიანტების თანასწორობა). არსებობს ცვალებადობის უნივარიატიული (ერთფაქტორიანი) და მრავალვარიანტული (მულტიფაქტორული) ანალიზი. პირველი განიხილავს შესასწავლი ღირებულების დამოკიდებულებას ერთ მახასიათებელზე, მეორე - ბევრზე ერთდროულად და ასევე გვაძლევს საშუალებას დავადგინოთ კავშირი მათ შორის.

ფაქტორები

ფაქტორები არის კონტროლირებადი გარემოებები, რომლებიც გავლენას ახდენენ საბოლოო შედეგზე. მისი დონე ან დამუშავების მეთოდი არის მნიშვნელობა, რომელიც ახასიათებს ამ მდგომარეობის სპეციფიკურ გამოვლინებას. ეს რიცხვები, როგორც წესი, წარმოდგენილია ნომინალური ან რიგითი გაზომვის შკალაზე. ხშირად გამომავალი მნიშვნელობები იზომება რაოდენობრივი ან რიგითი მასშტაბებით. შემდეგ პრობლემა წარმოიქმნება გამომავალი მონაცემების დაჯგუფების რიგ დაკვირვებებში, რომლებიც შეესაბამება დაახლოებით იგივე რიცხობრივ მნიშვნელობებს. თუ ჯგუფების რაოდენობა ზედმეტად დიდია, მაშინ მათში დაკვირვებების რაოდენობა შეიძლება არასაკმარისი იყოს სანდო შედეგების მისაღებად. თუ რიცხვს ძალიან მცირე იღებთ, ამან შეიძლება გამოიწვიოს სისტემაზე გავლენის მნიშვნელოვანი მახასიათებლების დაკარგვა. მონაცემთა დაჯგუფების კონკრეტული გზა დამოკიდებულია მნიშვნელობების ცვალებადობის რაოდენობასა და ბუნებაზე. უნივარიანტულ ანალიზში ინტერვალების რაოდენობა და ზომა ყველაზე ხშირად განისაზღვრება თანაბარი ინტერვალების პრინციპით ან თანაბარი სიხშირეების პრინციპით.

დისპერსიული პრობლემების ანალიზი

ასე რომ, არის შემთხვევები, როდესაც საჭიროა ორი ან მეტი ნიმუშის შედარება. სწორედ მაშინ არის მიზანშეწონილი დისპერსიის ანალიზის გამოყენება. მეთოდის სახელწოდება მიუთითებს, რომ დასკვნები კეთდება დისპერსიული კომპონენტების შესწავლის საფუძველზე. კვლევის არსი იმაში მდგომარეობს, რომ ინდიკატორის საერთო ცვლილება დაყოფილია კომპონენტებად, რომლებიც შეესაბამება თითოეული ინდივიდუალური ფაქტორის მოქმედებას. განვიხილოთ რიგი პრობლემები, რომლებიც წყდება ტიპიური დისპერსიული ანალიზით.

მაგალითი 1

სახელოსნოში არის რამდენიმე ავტომატური მანქანა, რომელიც აწარმოებს კონკრეტულ ნაწილს. თითოეული ნაწილის ზომა არის შემთხვევითი ცვლადი, რომელიც დამოკიდებულია თითოეული მანქანის კონფიგურაციაზე და შემთხვევით გადახრებზე, რომლებიც ხდება ნაწილების წარმოების პროცესში. აუცილებელია დადგინდეს, ნაწილების ზომების გაზომვის მონაცემების საფუძველზე, არის თუ არა მანქანები კონფიგურირებული იმავე გზით.

მაგალითი 2

ელექტრომოწყობილობის დამზადებისას გამოიყენება სხვადასხვა სახის საიზოლაციო ქაღალდი: კონდენსატორი, ელექტრო და ა.შ. მოწყობილობის გაჟღენთვა შესაძლებელია სხვადასხვა ნივთიერებით: ეპოქსიდური ფისით, ლაქით, ML-2 ფისით და ა.შ. გაჟონვის აღმოფხვრა შესაძლებელია ვაკუუმში. მაღალი წნევა, გათბობით. გაჟღენთვა შეიძლება განხორციელდეს ლაქში ჩაძირვით, ლაქის უწყვეტი ნაკადის ქვეშ და ა.შ. ელექტრო აპარატი მთლიანობაში ივსება გარკვეული ნაერთით, რომლის რამდენიმე ვარიანტი არსებობს. ხარისხის ინდიკატორები არის იზოლაციის ელექტრული სიძლიერე, გრაგნილის გადახურების ტემპერატურა სამუშაო რეჟიმში და მრავალი სხვა. მოწყობილობების წარმოების ტექნოლოგიური პროცესის განვითარებისას აუცილებელია განისაზღვროს, თუ როგორ მოქმედებს თითოეული ჩამოთვლილი ფაქტორი მოწყობილობის მუშაობაზე.

მაგალითი 3

ტროლეიბუსის დეპო ემსახურება ტროლეიბუსის რამდენიმე მარშრუტს. ისინი მართავენ სხვადასხვა ტიპის ტროლეიბუსებს, მგზავრობის საფასურს კი 125 ინსპექტორი აგროვებს. დეპოს მენეჯმენტს აინტერესებს კითხვა: როგორ შევადაროთ თითოეული კონტროლერის (შემოსავლის) მუშაობის ეკონომიკური მაჩვენებლები სხვადასხვა მარშრუტებისა და სხვადასხვა ტიპის ტროლეიბუსების გათვალისწინებით? როგორ განვსაზღვროთ კონკრეტულ მარშრუტზე გარკვეული ტიპის ტროლეიბუსების წარმოების ეკონომიკური მიზანშეწონილობა? როგორ დავადგინოთ გონივრული მოთხოვნები შემოსავლის ოდენობაზე, რომელსაც კონდუქტორი მოაქვს თითოეულ მარშრუტზე სხვადასხვა ტიპის ტროლეიბუსებში?

მეთოდის არჩევის ამოცანაა, თუ როგორ მივიღოთ მაქსიმალური ინფორმაცია თითოეული ფაქტორის გავლენის შესახებ საბოლოო შედეგზე, განვსაზღვროთ ასეთი გავლენის რიცხვითი მახასიათებლები, მათი საიმედოობა მინიმალურ ფასად და უმოკლეს დროში. დისპერსიული ანალიზის მეთოდები ასეთი პრობლემების გადაჭრის საშუალებას იძლევა.

უნივარიანტული ანალიზი

კვლევის მიზანია შეაფასოს კონკრეტული შემთხვევის გავლენის სიდიდე გაანალიზებულ მიმოხილვაზე. უნივარიატიული ანალიზის კიდევ ერთი მიზანი შეიძლება იყოს ორი ან მეტი გარემოების ერთმანეთთან შედარება, რათა დადგინდეს მათი გავლენის განსხვავება გახსენებაზე. თუ ნულოვანი ჰიპოთეზა უარყოფილია, მაშინ შემდეგი ნაბიჯი არის მიღებული მახასიათებლებისთვის ნდობის ინტერვალების რაოდენობრივი დადგენა და აგება. იმ შემთხვევაში, როდესაც ნულოვანი ჰიპოთეზის უარყოფა შეუძლებელია, ის ჩვეულებრივ მიიღება და კეთდება დასკვნა გავლენის ხასიათის შესახებ.

დისპერსიის ცალმხრივი ანალიზი შეიძლება გახდეს კრუსკალ-ვალისის რანგის მეთოდის არაპარამეტრული ანალოგი. იგი შეიმუშავეს ამერიკელმა მათემატიკოსმა უილიამ კრუსკალმა და ეკონომისტმა უილსონ უოლისმა 1952 წელს. ეს კრიტერიუმი შექმნილია შესწავლილ ნიმუშებზე ეფექტების თანასწორობის ნულოვანი ჰიპოთეზის შესამოწმებლად უცნობი, მაგრამ თანაბარი საშუალო მნიშვნელობებით. ამ შემთხვევაში ნიმუშების რაოდენობა ორზე მეტი უნდა იყოს.

Jonckheere-Terpstra კრიტერიუმი დამოუკიდებლად შემოგვთავაზა ჰოლანდიელმა მათემატიკოსმა T. J. Terpstra-მ 1952 წელს და ბრიტანელი ფსიქოლოგმა E.R. Jonckheere-მ 1954 წელს. იგი გამოიყენება მაშინ, როდესაც წინასწარ არის ცნობილი, რომ შედეგების არსებული ჯგუფები დალაგებულია შედეგების გავლენის ზრდის მიხედვით. შესასწავლი ფაქტორი, რომელიც იზომება რიგითი სკალით.

M - ბარტლეტის ტესტი, რომელიც შემოთავაზებულია ბრიტანელი სტატისტიკოსის მორის სტივენსონ ბარტლეტის მიერ 1937 წელს, გამოიყენება ნულოვანი ჰიპოთეზის შესამოწმებლად რამდენიმე ნორმალური პოპულაციის დისპერსიების თანასწორობის შესახებ, საიდანაც აღებულია შესასწავლი ნიმუშები, ზოგადად განსხვავებული ზომის (თითოეულის რაოდენობა). ნიმუში უნდა იყოს მინიმუმ ოთხი).

G - კოქრანის ტესტი, რომელიც აღმოაჩინა ამერიკელმა უილიამ გემელ კოკრანმა 1941 წელს. იგი გამოიყენება ნულოვანი ჰიპოთეზის შესამოწმებლად ნორმალური პოპულაციების დისპერსიების თანასწორობის შესახებ თანაბარი ზომის დამოუკიდებელ ნიმუშებში.

არაპარამეტრული ლევენის ტესტი, რომელიც შემოთავაზებულია ამერიკელი მათემატიკოსის ჰოვარდ ლევენის მიერ 1960 წელს, არის ბარტლეტის ტესტის ალტერნატივა იმ პირობებში, როდესაც არ არის დარწმუნებული, რომ შესასწავლი ნიმუშები ექვემდებარება ნორმალურ განაწილებას.

1974 წელს ამერიკელმა სტატისტიკოსებმა Morton B. Brown-მა და Alan B. Forsythe-მა შემოგვთავაზეს ტესტი (Brown-Forsyth test), რომელიც ოდნავ განსხვავდება ლევენის ტესტისგან.

ორფაქტორიანი ანალიზი

დისპერსიის ორმხრივი ანალიზი გამოიყენება ნორმალურად განაწილებული ნიმუშებისთვის. პრაქტიკაში, ამ მეთოდის კომპლექსური ცხრილები ხშირად გამოიყენება, კერძოდ ის, რომლებშიც თითოეული უჯრედი შეიცავს მონაცემთა ერთობლიობას (განმეორებითი გაზომვები), რომლებიც შეესაბამება ფიქსირებული დონის მნიშვნელობებს. თუ დისპერსიის ორმხრივი ანალიზის გამოსაყენებლად საჭირო დაშვებები არ არის დაკმაყოფილებული, გამოიყენეთ არაპარამეტრული ფრიდმანის რანგის ტესტი (ფრიდმანი, კენდალი და სმიტი), რომელიც შემუშავებულია ამერიკელი ეკონომისტის მილტონ ფრიდმანის მიერ 1930 წლის ბოლოს. ეს ტესტი არ არის დამოკიდებული ტიპზე. განაწილების.

მხოლოდ ვარაუდობენ, რომ მნიშვნელობების განაწილება იდენტური და უწყვეტია და რომ ისინი თავად არიან ერთმანეთისგან დამოუკიდებელი. ნულოვანი ჰიპოთეზის ტესტირებისას გამომავალი მონაცემები წარმოდგენილია მართკუთხა მატრიცის სახით, რომელშიც სტრიქონები შეესაბამება B ფაქტორის დონეებს, ხოლო სვეტები A-ს დონეებს. ცხრილის (ბლოკის) თითოეული უჯრედი შეიძლება იყოს. პარამეტრების გაზომვის შედეგი ერთ ობიექტზე ან ობიექტთა ჯგუფზე ორივე ფაქტორის დონის მუდმივი მნიშვნელობებით. ამ შემთხვევაში, შესაბამისი მონაცემები წარმოდგენილია, როგორც გარკვეული პარამეტრის საშუალო მნიშვნელობები შესწავლილი ნიმუშის ყველა განზომილებისთვის ან ობიექტისთვის. გამომავალი კრიტერიუმის გამოსაყენებლად აუცილებელია გაზომვების პირდაპირი შედეგებიდან მათ წოდებაზე გადასვლა. რეიტინგი ხორციელდება თითოეული რიგისთვის ცალკე, ანუ მნიშვნელობები შეკვეთილია თითოეული ფიქსირებული მნიშვნელობისთვის.

პეიჯის ტესტი (L-test), შემოთავაზებული ამერიკელმა სტატისტიკოსმა E. B. Page-მა 1963 წელს, შექმნილია ნულოვანი ჰიპოთეზის შესამოწმებლად. დიდი ნიმუშებისთვის გამოიყენება გვერდის მიახლოება. ისინი, შესაბამისი ნულოვანი ჰიპოთეზების რეალობის გათვალისწინებით, ემორჩილებიან სტანდარტულ ნორმალურ განაწილებას. იმ შემთხვევაში, როდესაც წყაროს ცხრილის სტრიქონებს აქვთ იგივე მნიშვნელობები, აუცილებელია საშუალო რანგის გამოყენება. ამ შემთხვევაში, დასკვნების სიზუსტე უფრო უარესი იქნება, რაც უფრო მეტი იქნება ასეთი მატჩების რაოდენობა.

Q - Cochran-ის კრიტერიუმი, შემოთავაზებული W. Cochran-ის მიერ 1937 წელს. იგი გამოიყენება იმ შემთხვევებში, როდესაც ერთგვაროვანი სუბიექტების ჯგუფები ექვემდებარებიან გავლენებს, რომელთა რაოდენობა აღემატება ორს და რომელთათვისაც შესაძლებელია უკუკავშირის ორი ვარიანტი - პირობითად უარყოფითი (0) და პირობითად დადებითი (1) . ნულოვანი ჰიპოთეზა შედგება მკურნალობის ეფექტის თანაბარისაგან. დისპერსიის ორმხრივი ანალიზი შესაძლებელს ხდის მკურნალობის ეფექტების არსებობის დადგენას, მაგრამ არ იძლევა იმის დადგენას, თუ რომელი კონკრეტული სვეტებისთვის არსებობს ეს ეფექტი. ამ პრობლემის გადასაჭრელად გამოყენებულია სქეფის მრავალჯერადი განტოლების მეთოდი დაკავშირებული ნიმუშებისთვის.

მრავალვარიანტული ანალიზი

დისპერსიის მრავალვარიანტული ანალიზის პრობლემა ჩნდება მაშინ, როდესაც თქვენ უნდა დაადგინოთ ორი ან მეტი პირობის ეფექტი გარკვეულ შემთხვევით ცვლადზე. კვლევა გულისხმობს ერთი დამოკიდებული შემთხვევითი ცვლადის არსებობას, რომელიც იზომება სხვაობის ან თანაფარდობის შკალაზე, და რამდენიმე დამოუკიდებელი ცვლადის არსებობას, რომელთაგან თითოეული გამოიხატება დასახელების ან რანგის სკალაზე. მონაცემთა ვარიაციული ანალიზი არის მათემატიკური სტატისტიკის საკმაოდ განვითარებული განყოფილება, რომელსაც აქვს უამრავი ვარიანტი. კვლევის კონცეფცია საერთოა როგორც ერთფაქტორიანი, ასევე მულტიფაქტორისთვის. მისი არსი მდგომარეობს იმაში, რომ მთლიანი განსხვავება იყოფა კომპონენტებად, რაც შეესაბამება მონაცემების გარკვეულ დაჯგუფებას. თითოეულ მონაცემთა დაჯგუფებას აქვს საკუთარი მოდელი. აქ განვიხილავთ მხოლოდ ძირითად დებულებებს, რომლებიც აუცილებელია მისი ყველაზე ხშირად გამოყენებული ვარიანტების გასაგებად და პრაქტიკული გამოყენებისთვის.

ფაქტორების დისპერსიული ანალიზი მოითხოვს საკმაოდ ფრთხილ დამოკიდებულებას შეტანილი მონაცემების შეგროვებისა და წარმოდგენისადმი და განსაკუთრებით შედეგების ინტერპრეტაციის მიმართ. ერთი ფაქტორიანი ტესტისგან განსხვავებით, რომლის შედეგები შეიძლება პირობითად განთავსდეს გარკვეული თანმიმდევრობით, ორფაქტორიანი ტესტის შედეგები მოითხოვს უფრო რთულ პრეზენტაციას. სიტუაცია კიდევ უფრო რთულდება, როდესაც არსებობს სამი, ოთხი ან მეტი გარემოება. ამის გამო საკმაოდ იშვიათია მოდელში სამ (ოთხ)ზე მეტი პირობის ჩართვა. მაგალითი იქნება რეზონანსის წარმოქმნა ელექტრული წრის ტევადობისა და ინდუქციურობის გარკვეულ მნიშვნელობაზე; ქიმიური რეაქციის გამოვლინება ელემენტების გარკვეულ კომპლექტთან, საიდანაც აგებულია სისტემა; კომპლექსურ სისტემებში ანომალიური ეფექტების გაჩენა გარემოებების გარკვეულ დამთხვევაში. ურთიერთქმედების არსებობამ შეიძლება რადიკალურად შეცვალოს სისტემის მოდელი და ზოგჯერ გამოიწვიოს იმ ფენომენების ბუნების გადახედვა, რომლებთანაც საქმე ექსპერიმენტატორია.

დისპერსიის მრავალვარიანტული ანალიზი განმეორებითი ექსპერიმენტებით

გაზომვის მონაცემები საკმაოდ ხშირად შეიძლება დაჯგუფდეს არა ორი, არამედ ფაქტორების უფრო დიდი რაოდენობით. ამრიგად, თუ გავითვალისწინებთ ტროლეიბუსის ბორბლების საბურავების მომსახურების ვადის დისპერსიულ ანალიზს გარემოებების გათვალისწინებით (საწარმოო ქარხანა და მარშრუტი, რომელზედაც მუშაობს საბურავები), მაშინ ცალკე პირობად შეგვიძლია გამოვყოთ სეზონი, რომლის დროსაც საბურავები მუშაობს (კერძოდ: ზამთრის და ზაფხულის ექსპლუატაცია). შედეგად გვექნება სამფაქტორიანი მეთოდის პრობლემა.

თუ მეტი პირობაა, მიდგომა იგივეა, რაც ორფაქტორიან ანალიზში. ყველა შემთხვევაში ცდილობენ მოდელის გამარტივებას. ორი ფაქტორის ურთიერთქმედების ფენომენი არც ისე ხშირად ჩნდება და სამმაგი ურთიერთქმედება მხოლოდ გამონაკლის შემთხვევებში ხდება. ჩართეთ ის ურთიერთქმედებები, რომლებზეც არსებობს წინა ინფორმაცია და კარგი მიზეზები მოდელში გასათვალისწინებლად. ინდივიდუალური ფაქტორების იდენტიფიცირებისა და მათი გათვალისწინების პროცესი შედარებით მარტივია. ამიტომ, ხშირად ჩნდება მეტი გარემოებების გამოკვეთის სურვილი. თქვენ არ უნდა გაიტაცოთ ამით. რაც უფრო მეტი პირობაა, მით უფრო ნაკლებად სანდო ხდება მოდელი და უფრო დიდია შეცდომის ალბათობა. თავად მოდელი, რომელიც მოიცავს დამოუკიდებელ ცვლადების დიდ რაოდენობას, ხდება საკმაოდ რთული ინტერპრეტაციისთვის და პრაქტიკული გამოყენებისთვის მოუხერხებელი.

დისპერსიის ანალიზის ზოგადი იდეა

სტატისტიკის დისპერსიის ანალიზი არის დაკვირვების შედეგების მიღების მეთოდი, რომელიც დამოკიდებულია ერთდროულად მოქმედ გარემოებებზე და მათი გავლენის შეფასება. კონტროლირებად ცვლადს, რომელიც შეესაბამება კვლევის ობიექტზე ზემოქმედების მეთოდს და გარკვეული პერიოდის განმავლობაში გარკვეულ მნიშვნელობას იძენს, ფაქტორი ეწოდება. ისინი შეიძლება იყოს ხარისხობრივი და რაოდენობრივი. რაოდენობრივი პირობების დონეები გარკვეულ მნიშვნელობას იძენს რიცხვითი მასშტაბით. მაგალითებია ტემპერატურა, წნევის წნევა, ნივთიერების რაოდენობა. ხარისხობრივი ფაქტორებია სხვადასხვა ნივთიერებები, სხვადასხვა ტექნოლოგიური მეთოდები, მოწყობილობები, შემავსებლები. მათი დონეები შეესაბამება სახელების მასშტაბს.

ხარისხი ასევე შეიძლება შეიცავდეს შესაფუთი მასალის ტიპს და დოზირების ფორმის შენახვის პირობებს. ასევე რაციონალურია ნედლეულის დაფქვის ხარისხის, გრანულების ფრაქციული შემადგენლობის ჩართვა, რომლებსაც რაოდენობრივი მნიშვნელობა აქვთ, მაგრამ რაოდენობრივი შკალის გამოყენების შემთხვევაში ძნელი დასარეგულირებელია. ხარისხობრივი ფაქტორების რაოდენობა დამოკიდებულია დოზირების ფორმის ტიპზე, აგრეთვე სამკურნალო ნივთიერებების ფიზიკურ და ტექნოლოგიურ თვისებებზე. მაგალითად, ტაბლეტების მიღება შესაძლებელია კრისტალური ნივთიერებებისგან პირდაპირი შეკუმშვით. ამ შემთხვევაში საკმარისია მოცურების და საპოხი ნივთიერებების შერჩევა.

ხარისხის ფაქტორების მაგალითები სხვადასხვა ტიპის დოზირების ფორმებისთვის

  • ნაყენები.ექსტრაქტორის შემადგენლობა, ექსტრაქტორის ტიპი, ნედლეულის მომზადების მეთოდი, წარმოების მეთოდი, ფილტრაციის მეთოდი.
  • ექსტრაქტები (თხევადი, სქელი, მშრალი).ექსტრაქტორის შემადგენლობა, ექსტრაქციის მეთოდი, ინსტალაციის ტიპი, ექსტრაქტორი და ბალასტური ნივთიერებების მოცილების მეთოდი.
  • აბები.დამხმარე ნივთიერებების, შემავსებლების, დეზინტეგრატორების, შემკვრელების, ლუბრიკანტების და საპოხი მასალების შემადგენლობა. ტაბლეტების მიღების მეთოდი, ტექნოლოგიური აღჭურვილობის ტიპი. გარსის ტიპი და მისი კომპონენტები, ფირის შემქმნელი, პიგმენტები, საღებავები, პლასტიზატორები, გამხსნელები.
  • საინექციო ხსნარები.გამხსნელის ტიპი, ფილტრაციის მეთოდი, სტაბილიზატორებისა და კონსერვანტების ბუნება, სტერილიზაციის პირობები, ამპულების შევსების მეთოდი.
  • სუპოზიტორები.სუპოზიტორების ფუძის შემადგენლობა, სუპოზიტორების წარმოების მეთოდი, შემავსებლები, შეფუთვა.
  • მალამოები.ფუძის შემადგენლობა, სტრუქტურული კომპონენტები, მალამოს მომზადების მეთოდი, აღჭურვილობის ტიპი, შეფუთვა.
  • კაფსულები.გარსის მასალის ტიპი, კაფსულების დამზადების მეთოდი, პლასტიზატორის ტიპი, კონსერვანტი, საღებავი.
  • ლინიმენტები.მომზადების მეთოდი, შემადგენლობა, აღჭურვილობის ტიპი, ემულგატორის ტიპი.
  • შეჩერებები.გამხსნელის ტიპი, სტაბილიზატორის ტიპი, დისპერსიის მეთოდი.

ტაბლეტების წარმოების პროცესში შესწავლილი ხარისხის ფაქტორების მაგალითები და მათი დონეები

  • Ფქვილი.კარტოფილის სახამებელი, თეთრი თიხა, ნატრიუმის ბიკარბონატის ნაზავი ლიმონმჟავასთან, ძირითადი მაგნიუმის კარბონატი.
  • დამაკავშირებელი ხსნარი.წყალი, სახამებლის პასტა, შაქრის სიროფი, მეთილცელულოზის ხსნარი, ჰიდროქსიპროპილმეთილცელულოზის ხსნარი, პოლივინილპიროლიდონის ხსნარი, პოლივინილ სპირტის ხსნარი.
  • მოცურების ნივთიერება.აეროსილი, სახამებელი, ტალკი.
  • შემავსებელი.შაქარი, გლუკოზა, ლაქტოზა, ნატრიუმის ქლორიდი, კალციუმის ფოსფატი.
  • ლუბრიკანტი.სტეარინის მჟავა, პოლიეთილენ გლიკოლი, პარაფინი.

დისპერსიული ანალიზის მოდელები სახელმწიფო კონკურენტუნარიანობის დონის შესწავლაში

სახელმწიფოს მდგომარეობის შეფასების ერთ-ერთი ყველაზე მნიშვნელოვანი კრიტერიუმი, რომლითაც ფასდება მისი კეთილდღეობისა და სოციალურ-ეკონომიკური განვითარების დონე, არის კონკურენტუნარიანობა, ანუ ეროვნული ეკონომიკისთვის დამახასიათებელი თვისებების ერთობლიობა, რომელიც განსაზღვრავს სახელმწიფოს. სხვა ქვეყნებთან კონკურენციის უნარი. მსოფლიო ბაზარზე სახელმწიფოს ადგილისა და როლის განსაზღვრის შემდეგ, შესაძლებელია საერთაშორისო მასშტაბით ეკონომიკური უსაფრთხოების უზრუნველსაყოფად მკაფიო სტრატეგიის ჩამოყალიბება, რადგან ეს არის პოზიტიური ურთიერთობების გასაღები რუსეთსა და მსოფლიო ბაზარზე ყველა მოთამაშეს შორის: ინვესტორებს შორის. კრედიტორები და მთავრობები.

სახელმწიფოთა კონკურენტუნარიანობის დონის შესადარებლად, ქვეყნების რეიტინგები ხდება რთული ინდექსების გამოყენებით, რომლებიც მოიცავს სხვადასხვა შეწონილ მაჩვენებლებს. ეს ინდექსები ემყარება ეკონომიკურ, პოლიტიკურ და ა.შ ვითარებაზე გავლენის ძირითად ფაქტორებს. სახელმწიფო კონკურენტუნარიანობის შესწავლის მოდელების ნაკრები მოიცავს მრავალვარიანტული სტატისტიკური ანალიზის მეთოდების გამოყენებას (კერძოდ, დისპერსიის ანალიზი (სტატისტიკა), ეკონომეტრიული მოდელირება, გადაწყვეტილების მიღება) და მოიცავს შემდეგ ძირითად ეტაპებს:

  1. ინდიკატორების სისტემის ფორმირება.
  2. სახელმწიფო კონკურენტუნარიანობის მაჩვენებლების შეფასება და პროგნოზირება.
  3. სახელმწიფოთა კონკურენტუნარიანობის მაჩვენებლების შედარება.

ახლა მოდით შევხედოთ ამ კომპლექსის თითოეული ეტაპის მოდელების შინაარსს.

პირველ ეტაპზესაექსპერტო კვლევის მეთოდების გამოყენებით ყალიბდება სახელმწიფოს კონკურენტუნარიანობის შესაფასებლად ეკონომიკური ინდიკატორების დასაბუთებული ნაკრები, მისი განვითარების სპეციფიკის გათვალისწინებით, საერთაშორისო რეიტინგებზე და სტატისტიკური დეპარტამენტების მონაცემებზე დაყრდნობით, რომელიც ასახავს სისტემის მთლიან მდგომარეობას. და მისი პროცესები. ამ ინდიკატორების არჩევანი გამართლებულია იმ ინდიკატორების შერჩევის აუცილებლობით, რომლებიც ყველაზე სრულად, პრაქტიკული თვალსაზრისით, საშუალებას გვაძლევს განვსაზღვროთ სახელმწიფოს დონე, მისი საინვესტიციო მიმზიდველობა და არსებული პოტენციური და ფაქტობრივი საფრთხეების შედარებითი ლოკალიზაციის შესაძლებლობა.

საერთაშორისო სარეიტინგო სისტემების ძირითადი მაჩვენებლებია:

  1. გლობალური კონკურენტუნარიანობა (GC).
  2. ეკონომიკური თავისუფლება (IES).
  3. ადამიანური განვითარება (HDI).
  4. კორუფციის აღქმა (CPC).
  5. შიდა და გარე საფრთხეები (IETH).
  6. საერთაშორისო გავლენის პოტენციალი (IPIP).

მეორე ფაზაითვალისწინებს სახელმწიფო კონკურენტუნარიანობის მაჩვენებლების შეფასებას და პროგნოზირებას საერთაშორისო რეიტინგების მიხედვით შესწავლილი მსოფლიოს 139 ქვეყნისთვის.

მესამე ეტაპიითვალისწინებს სახელმწიფოთა კონკურენტუნარიანობის პირობების შედარებას კორელაციური და რეგრესიული ანალიზის მეთოდების გამოყენებით.

კვლევის შედეგების გამოყენებით შესაძლებელია განისაზღვროს პროცესების ხასიათი ზოგადად და სახელმწიფოს კონკურენტუნარიანობის ცალკეული კომპონენტები; შეამოწმეთ ჰიპოთეზა ფაქტორების გავლენისა და მათი ურთიერთობის შესახებ მნიშვნელობის შესაბამის დონეზე.

შემოთავაზებული მოდელების დანერგვა საშუალებას მისცემს არა მხოლოდ შეაფასოს სახელმწიფოების კონკურენტუნარიანობის და საინვესტიციო მიმზიდველობის დონის არსებული მდგომარეობა, არამედ გააანალიზოს მენეჯმენტის ხარვეზები, თავიდან აიცილოს არასწორი გადაწყვეტილებების შეცდომები და თავიდან აიცილოს კრიზისის განვითარება ქვეყანაში. სახელმწიფო.

ცალმხრივი დისპერსიული ანალიზი.

დისპერსიული ანალიზის კონცეფცია და მოდელები.

თემა 13. დისპერსიის ანალიზი

ლექცია 1. კითხვები:

დისპერსიის ანალიზი, როგორც კვლევის მეთოდი, გამოჩნდა რ. ფიშერის (1918-1935) ნაშრომებში სოფლის მეურნეობაში კვლევებთან დაკავშირებით, რათა გამოევლინა პირობები, რომლებშიც სასოფლო-სამეურნეო კულტურის შემოწმებული ჯიში იძლევა მაქსიმალურ მოსავალს. დისპერსიის ანალიზი შემდგომ განვითარდა იეიტსის ნაშრომებში. დისპერსიის ანალიზი საშუალებას გვაძლევს ვუპასუხოთ კითხვას, აქვს თუ არა გარკვეულ ფაქტორებს მნიშვნელოვანი გავლენა ფაქტორის ცვალებადობაზე, რომლის მნიშვნელობების მიღება შესაძლებელია გამოცდილების შედეგად. სტატისტიკური ჰიპოთეზების ტესტირებისას ვარაუდობენ შესწავლილ ფაქტორებში შემთხვევითი ვარიაციები. დისპერსიის ანალიზისას, ერთი ან მეტი ფაქტორი იცვლება მოცემული გზით და ამ ცვლილებებმა შეიძლება გავლენა მოახდინოს დაკვირვების შედეგებზე. ასეთი გავლენის შესწავლა დისპერსიის ანალიზის მიზანია.

ამჟამად, უფრო ფართოდ გამოიყენება დისპერსიული ანალიზის გამოყენება ეკონომიკაში, სოციოლოგიაში, ბიოლოგიაში და ა.

პრაქტიკულ საქმიანობაში, მეცნიერების სხვადასხვა დარგში, ხშირად ვაწყდებით გარკვეულ ინდიკატორებზე სხვადასხვა ფაქტორების გავლენის შეფასების აუცილებლობას. ხშირად ეს ფაქტორები ხარისხობრივ ხასიათს ატარებენ (მაგალითად, ეკონომიკურ ეფექტზე გავლენის ხარისხობრივი ფაქტორი შეიძლება იყოს წარმოების მართვის ახალი სისტემის დანერგვა) და შემდეგ დისპერსიული ანალიზი განსაკუთრებულ მნიშვნელობას იძენს, რადგან ის ხდება კვლევის ერთადერთი სტატისტიკური მეთოდი, რომელიც იძლევა ასეთს. შეფასება.

დისპერსიის ანალიზი შესაძლებელს ხდის განვსაზღვროთ, აქვს თუ არა განსახილველ ფაქტორთაგან მნიშვნელოვანი გავლენა ნიშან-თვისების ცვალებადობაზე, აგრეთვე ცვალებადობის თითოეული წყაროს „სპეციფიკური წონის“ რაოდენობრივად განსაზღვრა მათ მთლიანობაში. მაგრამ დისპერსიის ანალიზი საშუალებას გვაძლევს დადებითი პასუხი გავცეთ მხოლოდ მნიშვნელოვანი გავლენის არსებობის შესახებ, წინააღმდეგ შემთხვევაში კითხვა რჩება ღია და საჭიროებს დამატებით კვლევას (ყველაზე ხშირად, ექსპერიმენტების რაოდენობის ზრდა).

შემდეგი ტერმინები გამოიყენება დისპერსიის ანალიზში.

ფაქტორი (X) არის ის, რაც ჩვენ გვჯერა, რომ გავლენას ახდენს შედეგზე (შედეგობრივი ატრიბუტი) Y.

ფაქტორის დონე (ან დამუშავების მეთოდი, ზოგჯერ სიტყვასიტყვით, მაგალითად, ნიადაგის დამუშავების მეთოდი) - მნიშვნელობები (X, i = 1.2,...I), რომელიც შეიძლება მიიღოს ფაქტორმა.

პასუხი - გაზომილი მახასიათებლის მნიშვნელობა (შედეგის მნიშვნელობა Y).

ANOVA ტექნიკა განსხვავდება შესწავლილი დამოუკიდებელი ფაქტორების რაოდენობის მიხედვით. თუ მახასიათებლის საშუალო მნიშვნელობის ცვალებადობის გამომწვევი ფაქტორები ერთ წყაროს ეკუთვნის, მაშინ გვაქვს მარტივი დაჯგუფება, ანუ დისპერსიის ერთფაქტორიანი ანალიზი და შემდეგ, შესაბამისად, ორმაგი დაჯგუფება - დისპერსიის ორფაქტორიანი ანალიზი, სამფაქტორიანი. დისპერსიის ანალიზი, ..., m-ფაქტორი. მრავალვარიანტულ ანალიზში ფაქტორები ჩვეულებრივ აღინიშნება ლათინური ასოებით: A, B, C და ა.შ.



დისპერსიული ანალიზის ამოცანაა გარკვეული ფაქტორების (ან ფაქტორების დონის) გავლენის შესწავლა დაკვირვებული შემთხვევითი ცვლადების საშუალო მნიშვნელობების ცვალებადობაზე.

დისპერსიული ანალიზის არსი. დისპერსიის ანალიზი შედგება ცვალებადობის გამომწვევი ინდივიდუალური ფაქტორების იზოლირებასა და შეფასებაზე. ამ მიზნით, დაკვირვებული ნაწილობრივი პოპულაციის მთლიანი ვარიაცია (ნიშანთა საერთო ვარიაცია), რომელიც გამოწვეულია ცვალებადობის ყველა წყაროთი, იშლება დამოუკიდებელი ფაქტორებით წარმოქმნილ დისპერსიულ კომპონენტებად. თითოეული ეს კომპონენტი იძლევა ცვალებადობის შეფასებას, ,..., რომელიც გამოწვეულია ცვალებადობის კონკრეტული წყაროთ, მთლიან პოპულაციაში. ამ კომპონენტის დისპერსიული შეფასებების მნიშვნელოვნების შესამოწმებლად, ისინი შედარებულია პოპულაციის მთლიან დისპერსიასთან (ფიშერის ტესტი).

მაგალითად, ორფაქტორიან ანალიზში ვიღებთ ფორმის დაშლას:

შესწავლილი C ნიშან-თვისების ტოტალური ვარიაცია;

A ფაქტორის გავლენით გამოწვეული დისპერსიის წილი;

B ფაქტორის გავლენით გამოწვეული დისპერსიის წილი;

A და B ფაქტორების ურთიერთქმედებით გამოწვეული დისპერსიის პროპორცია;

გაუთვალისწინებელი შემთხვევითი მიზეზებით გამოწვეული დისპერსიის წილი (შემთხვევითი ვარიაცია);

ვარიაციის ანალიზისას განიხილება ჰიპოთეზა: H 0 - არც ერთი განსახილველი ფაქტორი არ ახდენს გავლენას ნიშან-თვისების ცვალებადობაზე. თითოეული დისპერსიის შეფასების მნიშვნელობა მოწმდება მისი თანაფარდობის მნიშვნელობით შემთხვევითი დისპერსიის შეფასებასთან და შედარებულია შესაბამის კრიტიკულ მნიშვნელობასთან, მნიშვნელოვნების დონეზე a, Fisher-Snedecor F განაწილების კრიტიკული მნიშვნელობების ცხრილების გამოყენებით (დანართი 4). . ჰიპოთეზა H 0 ცვალებადობის ამა თუ იმ წყაროსთან დაკავშირებით უარყოფილია, თუ F გამოითვლება. >F კრ. (მაგალითად, B ფაქტორისთვის: S B 2 /S ε 2 >F კრ.).

ვარიაციის ანალიზი ითვალისწინებს 3 ტიპის ექსპერიმენტებს:

ა) ექსპერიმენტები, რომლებშიც ყველა ფაქტორს აქვს სისტემატური (ფიქსირებული) დონე;

ბ) ექსპერიმენტები, რომლებშიც ყველა ფაქტორს აქვს შემთხვევითი დონე;

გ) ექსპერიმენტები, რომლებშიც არის ფაქტორები, რომლებსაც აქვთ შემთხვევითი დონეები, ასევე ფაქტორები, რომლებსაც აქვთ ფიქსირებული დონეები.

შემთხვევები a), b), c) შეესაბამება სამ მოდელს, რომლებიც განიხილება დისპერსიის ანალიზში.

დისპერსიის ანალიზისთვის შეყვანილი მონაცემები ჩვეულებრივ წარმოდგენილია შემდეგი ცხრილის სახით:

დაკვირვების ნომერი j ფაქტორების დონეები
A 1 A 2
X 11 X 21 X p1
X 12 X 22 Xp2
X 13 X 23 X p3
. . .
. . .
. . .
X 1n X2n Xpn
შედეგები

განვიხილოთ ერთი ფაქტორი, რომელიც იღებს p სხვადასხვა დონეს და დავუშვათ, რომ თითოეულ დონეზე კეთდება n დაკვირვება, რაც იძლევა N=np დაკვირვებას. (ჩვენ შემოვიფარგლებით დისპერსიული ანალიზის პირველი მოდელის გათვალისწინებით - ყველა ფაქტორს აქვს ფიქსირებული დონე.)

შედეგები წარმოდგენილი იყოს X ij სახით (i=1,2…,р; j=1,2,…,n).

ვარაუდობენ, რომ n დაკვირვების ყოველი დონისთვის არის საშუალო, რომელიც უდრის საერთო საშუალო ჯამის და მისი ცვალებადობის შერჩეული დონის გამო:

სადაც m არის საერთო საშუალო;

A i - ფაქტორის i – m დონით გამოწვეული ეფექტი;

e ij – შედეგების ცვალებადობა ინდივიდუალური ფაქტორის დონეზე. ტერმინი e ij ითვალისწინებს ყველა უკონტროლო ფაქტორს.

მოდით დაკვირვებები ფიქსირებულ ფაქტორზე ნორმალურად განაწილებული იყოს საშუალო m + A i-ის გარშემო საერთო დისპერსიით s 2 .

შემდეგ (ინდექსის ნაცვლად წერტილი აღნიშნავს შესაბამისი დაკვირვებების საშუალო შეფასებას ამ ინდექსზე):

A.X ij – X.. = (X i . – X..) + (X ij – X i .). (12.3)

განტოლების ორივე მხარის კვადრატში და i და j-ზე შეჯამების შემდეგ მივიღებთ:

მას შემდეგ, რაც, მაგრამ

წინააღმდეგ შემთხვევაში, კვადრატების ჯამი შეიძლება დაიწეროს: S = S 1 + S 2. S 1-ის მნიშვნელობა გამოითვლება p საშუალოების გადახრებიდან საერთო საშუალო X..-დან, შესაბამისად S 1-ს აქვს (p-1) თავისუფლების ხარისხი. S 2-ის მნიშვნელობა გამოითვლება N დაკვირვების გადახრებიდან p ნიმუშის საშუალოდან და, შესაბამისად, აქვს N-р = np - p=p(n-1) თავისუფლების ხარისხი. S-ს აქვს თავისუფლების (N-1) ხარისხი. გაანგარიშების შედეგების საფუძველზე აგებულია დისპერსიული ანალიზის ცხრილი.

ANOVA მაგიდა

თუ ჰიპოთეზა, რომ ყველა დონის გავლენა თანაბარია, მართალია, მაშინ M 1 და M 2 (საშუალო კვადრატები) იქნება s 2-ის მიუკერძოებელი შეფასება. ეს ნიშნავს, რომ ჰიპოთეზა შეიძლება შემოწმდეს თანაფარდობის გამოთვლით (M 1 / M 2) და შედარებით F cr-თან. ν 1 = (p-1) და ν 2 = (N-p) თავისუფლების ხარისხით.

თუ F გამოითვლება >F კრ. , მაშინ არ მიიღება ჰიპოთეზა A ფაქტორის უმნიშვნელო გავლენის შესახებ დაკვირვების შედეგზე.

განსხვავებების მნიშვნელობის შესაფასებლად F calc. F მაგიდა გამოთვალეთ:

ა) ექსპერიმენტული შეცდომა

ბ) საშუალების სხვაობის შეცდომა

გ) ყველაზე მცირე მნიშვნელოვანი განსხვავება

ვარიანტების საშუალო მნიშვნელობების სხვაობის შედარება NSR-თან, ისინი ასკვნიან, რომ საშუალო დონის განსხვავებები მნიშვნელოვანია.

კომენტარი. დისპერსიული ანალიზის გამოყენება ვარაუდობს, რომ:

2) D(ε ij)=σ 2 = const,

3) ε ij → N (0, σ) ან x ij → N (a, σ).

ანალიტიკოსი სტატისტიკოსი

7.1 დისპერსიის ანალიზი. 2

მეთოდის ამ ვერსიაში საგნების სხვადასხვა ნიმუშები ექვემდებარება თითოეული გრადაციის გავლენას. უნდა იყოს მინიმუმ ფაქტორების გრადაცია სამი.

მაგალითი 1.ექვსი საგნისგან შემდგარ სამ სხვადასხვა ჯგუფს გადაეცა ათი სიტყვის სია. პირველ ჯგუფს სიტყვები წარუდგინეს დაბალი სიჩქარით - 1 სიტყვა 5 წამში, მეორე ჯგუფს საშუალო სიჩქარით - 1 სიტყვა 2 წამში, ხოლო მესამე ჯგუფს დიდი სიჩქარით - 1 სიტყვა წამში. რეპროდუცირების შესრულება ნაწინასწარმეტყველები იყო, რომ დამოკიდებული იქნებოდა სიტყვების პრეზენტაციის სიჩქარეზე. შედეგები წარმოდგენილია ცხრილში. 1.

ცხრილი 1. რეპროდუცირებული სიტყვების რაოდენობა (მითჯ. გრინი, M D "Olivera, 1989, გვ. 99)

თემა No.

ჯგუფი 1 დაბალი სიჩქარე

ჯგუფი 2 საშუალო სიჩქარით

ჯგუფი 3 მაღალი სიჩქარით

თანხები

საშუალო

7,17

6,17

4,00

Მთლიანი რაოდენობა

ვარიაციის უნივარიანტული ანალიზი საშუალებას გაძლევთ შეამოწმოთ ჰიპოთეზები:

H 0 : განსხვავებები სიტყვის წარმოების მოცულობაში შორისჯგუფები არ არის უფრო გამოხატული, ვიდრე შემთხვევითი განსხვავებები შიგნითთითოეული ჯგუფი

H 1 : განსხვავებები სიტყვის წარმოების მოცულობაში შორისჯგუფები უფრო გამოხატულია, ვიდრე შემთხვევითი განსხვავებები შიგნითთითოეული ჯგუფი.

ოპერაციების თანმიმდევრობა ცალმხრივი დისპერსიის ანალიზში დაუკავშირებელი ნიმუშებისთვის:

1. დავთვალოთ SS ფაქტი- თვისების ცვალებადობა შესწავლილი ფაქტორის მოქმედებით. საერთო აღნიშვნა SS - აბრევიატურა "კვადრატების ჯამი" (კვადრატების ჯამი ). ეს აბრევიატურა ყველაზე ხშირად გამოიყენება ნათარგმნ წყაროებში (იხ. მაგალითად: Glass J., Stanley J., 1976).

,(1)

სადაც T c არის თითოეული პირობის ინდივიდუალური მნიშვნელობების ჯამი. ჩვენი მაგალითისთვის, 43, 37, 24 (იხ. ცხრილი 1);

с – ფაქტორის პირობების (გრადაციების) რაოდენობა (=3);

– საგნების რაოდენობა თითოეულ ჯგუფში (=6);

- ინდივიდუალური მნიშვნელობების საერთო რაოდენობა (=18);

ინდივიდუალური მნიშვნელობების ჯამური ჯამის კვადრატი (=104 2 =10816)

ყურადღება მიაქციეთ განსხვავებას შორის, რომელშიც ყველა ინდივიდუალური მნიშვნელობები ჯერ კვადრატდება და შემდეგ ჯამდება, და სადაც ინდივიდუალური მნიშვნელობები ჯერ ჯამდება საერთო ჯამის მისაღებად, შემდეგ კი ეს ჯამი კვადრატდება.

ფორმულის (1) გამოყენებით, მახასიათებლის რეალური ცვალებადობის გამოთვლის შემდეგ, მივიღებთ:

2. დავთვალოთ SS გენერალი- თვისების ზოგადი ცვალებადობა:


(2)

3. გამოთვალეთ შემთხვევითი (ნარჩენი) მნიშვნელობაSS sl, გამოწვეული გაუთვალისწინებელი ფაქტორებით:

(3)

4.თავისუფლების ხარისხების რაოდენობაუდრის:

=3-1=2(4)

5."შუა მოედანი"ან SS კვადრატების შესაბამისი ჯამების საშუალო მნიშვნელობა უდრის:

(5)

6.მნიშვნელობა კრიტერიუმი სტატისტიკა F emგამოთვალეთ ფორმულის გამოყენებით:

(6)

ჩვენი მაგალითისთვის გვაქვს : F em =15.72/2.11=7.45

7.განსაზღვრა ფ კრიტსტატისტიკური ცხრილების მიხედვით აპლიკაციები 3 df 1 =k 1 =2 და df 2 =k 2 =15 სტატისტიკის ცხრილის მნიშვნელობა არის 3.68

8. თუ F em< F კრიტიკულია, მაშინ მიიღება ნულოვანი ჰიპოთეზა, წინააღმდეგ შემთხვევაში მიიღება ალტერნატიული ჰიპოთეზა. ჩვენი მაგალითისთვის F em> F კრიტი (7.45>3.68), ამიტომ გვ

დასკვნა:ჯგუფებს შორის სიტყვების გახსენების განსხვავებები უფრო გამოხატულია, ვიდრე შემთხვევითი განსხვავებები თითოეულ ჯგუფში (გვ<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.

7.1.2 დისპერსიის ანალიზი დაკავშირებული ნიმუშებისთვის

დისპერსიული ანალიზის მეთოდი დაკავშირებული ნიმუშებისთვის გამოიყენება იმ შემთხვევებში, როდესაც ფაქტორის სხვადასხვა გრადაციის ან განსხვავებული პირობების გავლენა საგნების იგივე ნიმუში.უნდა იყოს მინიმუმ ფაქტორების გრადაცია სამი.

ამ შემთხვევაში სუბიექტებს შორის განსხვავებები განსხვავებების შესაძლო დამოუკიდებელი წყაროა. ცალმხრივი ANOVA დაკავშირებული ნიმუშებისთვისსაშუალებას მოგვცემს განვსაზღვროთ რა აჭარბებს – ფაქტორების ცვლილების მრუდით გამოხატული ტენდენცია, თუ სუბიექტებს შორის ინდივიდუალური განსხვავებები. ინდივიდუალური განსხვავებების ფაქტორი შეიძლება იყოს უფრო მნიშვნელოვანი, ვიდრე ექსპერიმენტული პირობების ცვლილების ფაქტორი.

მაგალითი 2.5 სუბიექტისგან შემდგარი ჯგუფი გამოიკვლიეს სამი ექსპერიმენტული დავალების გამოყენებით, რომლებიც მიზნად ისახავდა ინტელექტუალური გამძლეობის შესწავლას (Sidorenko E.V., 1984). თითოეულ საგანს ინდივიდუალურად წარედგინა სამი იდენტური ანაგრამა ზედიზედ: ოთხასოიანი, ხუთასოიანი და ექვს ასო. შესაძლებელია თუ არა ვივარაუდოთ, რომ ანაგრამის სიგრძის ფაქტორი გავლენას ახდენს მისი ამოხსნის მცდელობის ხანგრძლივობაზე?

ცხრილი 2. ანაგრამების ამოხსნის ხანგრძლივობა (წმ)

საგნის კოდი

მდგომარეობა 1. ოთხასოიანი ანაგრამა

მდგომარეობა 2. ხუთასოიანი ანაგრამა

მდგომარეობა 3. ექვს ასო ანაგრამა

თანხები საგნების მიხედვით

თანხები

1244

1342

ჩამოვაყალიბოთ ჰიპოთეზები. ამ შემთხვევაში არსებობს ჰიპოთეზის ორი ნაკრები.

ნაკრები A.

H 0 (A): განსხვავებები სხვადასხვა სიგრძის ანაგრამების ამოხსნის მცდელობების ხანგრძლივობაში არ არის უფრო გამოხატული, ვიდრე განსხვავებები შემთხვევითი მიზეზების გამო.

H 1 (A): განსხვავებები სხვადასხვა სიგრძის ანაგრამების ამოხსნის მცდელობების ხანგრძლივობაში უფრო გამოხატულია, ვიდრე განსხვავებები შემთხვევითი მიზეზების გამო.

ნაკრები B.

N შესახებ (B): სუბიექტებს შორის ინდივიდუალური განსხვავებები არ არის უფრო გამოხატული, ვიდრე განსხვავებები შემთხვევითი მიზეზების გამო.

H 1 (B): სუბიექტებს შორის ინდივიდუალური განსხვავებები უფრო გამოხატულია, ვიდრე განსხვავებები შემთხვევითი მიზეზების გამო.

ოპერაციების თანმიმდევრობა ცალმხრივი დისპერსიის ანალიზში დაკავშირებული ნიმუშებისთვის:

1. დავთვალოთ SS ფაქტი- ნიშან-თვისების ცვალებადობა შესწავლილი ფაქტორის მოქმედებით (1) ფორმულის მიხედვით.

სადაც T c არის ინდივიდუალური მნიშვნელობების ჯამი თითოეული პირობისთვის (სვეტი). ჩვენი მაგალითისთვის, 51, 1244, 47 (იხ. ცხრილი 2); с – ფაქტორის პირობების (გრადაციების) რაოდენობა (=3);ნ – საგნების რაოდენობა თითოეულ ჯგუფში (=5);- ინდივიდუალური მნიშვნელობების საერთო რაოდენობა (=15); - ინდივიდუალური მნიშვნელობების ჯამის კვადრატი (=1342 2)

2. დავთვალოთ SS isp- ნიშნის ცვალებადობა საგნების ინდივიდუალური მნიშვნელობების გამო.

სადაც T და არის ინდივიდუალური მნიშვნელობების ჯამი თითოეული საგნისთვის. ჩვენი მაგალითისთვის, 247, 631, 100, 181, 183 (იხ. ცხრილი 2); с – ფაქტორის პირობების (გრადაციების) რაოდენობა (=3);ნ - ინდივიდუალური მნიშვნელობების საერთო რაოდენობა (=15);

3. დავთვალოთ SS გენერალი- თვისების ზოგადი ცვალებადობა ფორმულის მიხედვით (2):


4. გამოთვალეთ შემთხვევითი (ნარჩენი) მნიშვნელობაSS sl, გამოწვეული გაუთვალისწინებელი ფაქტორებით (3) ფორმულის მიხედვით:

5. თავისუფლების ხარისხების რაოდენობაუდრის (4):

; ; ;

6. "შუა მოედანი"ან კვადრატების ჯამის მათემატიკური მოლოდინი, SS კვადრატების შესაბამისი ჯამების საშუალო მნიშვნელობა უდრის (5):

;

7. კრიტერიუმის სტატისტიკური მნიშვნელობა F emგამოთვალეთ ფორმულის გამოყენებით (6):

;

8. განვსაზღვროთ F კრიტი დანართი 3-ის სტატისტიკური ცხრილებიდან df 1 =k 1 =2 და df 2 =k 2 =8 სტატისტიკის ცხრილის მნიშვნელობა F crit_fact =4.46 და df 3 =k 3 =4 და df 2 =k 2 = 8 F crit_exp =3.84

9. F em_ფაქტი> F კრიტიკული_ფაქტი (6.872>4.46), ამიტომ გვ მიღებულია ალტერნატიული ჰიპოთეზა.

10. F em_use < F крит_исп (1,054<3,84), следовательно пნულოვანი ჰიპოთეზა მიღებულია.

დასკვნა:სხვადასხვა პირობებში სიტყვების რეპროდუქციის მოცულობაში განსხვავებები უფრო გამოხატულია, ვიდრე შემთხვევითი მიზეზების გამო (გვ.<0,05).Индивидуальные различия между испытуе­мыми являются не более выраженными, чем различия, обусловленные случайными причинами.

7.2 კორელაციური ანალიზი

7.2.1 კორელაციის ცნება

მკვლევარს ხშირად აინტერესებს, თუ როგორ არის დაკავშირებული ორი ან მეტი ცვლადი ერთმანეთთან ერთ ან რამდენიმე შესწავლილ ნიმუშში. მაგალითად, შეუძლია თუ არა შფოთვის მაღალი დონის მქონე მოსწავლეებს აჩვენონ სტაბილური აკადემიური მიღწევები, ან არის თუ არა სკოლაში მასწავლებლის მუშაობის ხანგრძლივობა დაკავშირებული მისი ხელფასის ოდენობასთან, ან რაც უფრო მეტად უკავშირდება მოსწავლეთა გონებრივი განვითარების დონეს - მათ. შესრულება მათემატიკაში ან ლიტერატურაში და ა.შ.?

ამ სახის დამოკიდებულებას ცვლადებს შორის ეწოდება კორელაცია, ან კორელაცია. კორელაცია კავშირი- ეს არის კოორდინირებული ცვლილება ორ მახასიათებელში, რაც ასახავს იმ ფაქტს, რომ ერთი მახასიათებლის ცვალებადობა შეესაბამება მეორის ცვალებადობას.

ცნობილია, მაგალითად, რომ საშუალოდ არის დადებითი კავშირი ადამიანების სიმაღლესა და მათ წონას შორის და ისეთი, რომ რაც უფრო დიდია სიმაღლე, მით მეტია ადამიანის წონა. თუმცა, არის გამონაკლისები ამ წესიდან, როდესაც შედარებით დაბალი ადამიანები ჭარბწონიანები არიან და, პირიქით, მაღალი აღნაგობის მქონე ასთენიებს აქვთ დაბალი წონა. ასეთი გამონაკლისების მიზეზი ის არის, რომ თითოეული ბიოლოგიური, ფიზიოლოგიური თუ ფსიქოლოგიური ნიშანი განისაზღვრება მრავალი ფაქტორის გავლენით: გარემო, გენეტიკური, სოციალური, გარემო და ა.შ.

კორელაციური კავშირები არის სავარაუდო ცვლილებები, რომელთა შესწავლა შესაძლებელია მხოლოდ წარმომადგენლობით ნიმუშებზე მათემატიკური სტატისტიკის მეთოდების გამოყენებით. "ორივე ტერმინი", წერს E.V. სიდორენკო, - კორელაციური კავშირი და კორელაციური დამოკიდებულება- ხშირად იყენებენ სინონიმებად. დამოკიდებულება გულისხმობს გავლენას, კავშირს - ნებისმიერ კოორდინირებულ ცვლილებას, რომელიც შეიძლება აიხსნას ასობით მიზეზით. კორელაციური კავშირები არ შეიძლება ჩაითვალოს მიზეზ-შედეგობრივი კავშირის მტკიცებულებად; ისინი მხოლოდ მიუთითებენ, რომ ერთი მახასიათებლის ცვლილებებს ჩვეულებრივ თან ახლავს გარკვეული ცვლილებები მეორეში.

კორელაციური დამოკიდებულება - ეს არის ცვლილებები, რომლებიც შემოაქვს ერთი მახასიათებლის მნიშვნელობებს სხვა მახასიათებლის სხვადასხვა მნიშვნელობების გამოჩენის ალბათობაში (E.V. Sidorenko, 2000).

კორელაციური ანალიზის ამოცანა დგება სხვადასხვა მახასიათებლებს შორის ურთიერთობის მიმართულების (დადებითი ან უარყოფითი) და ფორმის (წრფივი, არაწრფივი) დადგენაზე, მისი სიახლოვის გაზომვაზე და, ბოლოს, მიღებული კორელაციის კოეფიციენტების მნიშვნელოვნების დონის შემოწმებაზე.

კორელაციები განსხვავდება ფორმით, მიმართულებით და ხარისხით (სიძლიერე).

ფორმის მიხედვითკორელაციური ურთიერთობა შეიძლება იყოს წრფივი ან მრუდი. მაგალითად, სიმულატორზე ტრენინგის სესიების რაოდენობასა და საკონტროლო სესიაზე სწორად მოგვარებული პრობლემების რაოდენობას შორის კავშირი შეიძლება იყოს პირდაპირი. მაგალითად, ურთიერთობა მოტივაციის დონესა და დავალების ეფექტურობას შორის შეიძლება იყოს მრუდი (იხ. სურ. 1). მოტივაციის მატებასთან ერთად ჯერ იზრდება დავალების შესრულების ეფექტურობა, შემდეგ მიიღწევა მოტივაციის ოპტიმალური დონე, რაც შეესაბამება დავალების შესრულების მაქსიმალურ ეფექტურობას; მოტივაციის შემდგომ ზრდას თან ახლავს ეფექტურობის დაქვეითება.

ნახ.1. ურთიერთკავშირი პრობლემის გადაჭრის ეფექტურობას შორის

და მოტივაციური ტენდენციის სიძლიერე (J.W.A.-ს მიხედვით t k in son, 1974, გვ 200)

მიმართკორელაცია შეიძლება იყოს დადებითი („პირდაპირი“) და უარყოფითი („შებრუნებული“). დადებითი ხაზოვანი კორელაციით, ერთი მახასიათებლის უფრო მაღალი მნიშვნელობები შეესაბამება მეორის უფრო მაღალ მნიშვნელობებს, ხოლო ერთი მახასიათებლის ქვედა მნიშვნელობები მეორის დაბალ მნიშვნელობებს. უარყოფითი კორელაციით, ურთიერთობები შებრუნებულია. დადებითი კორელაციით, კორელაციის კოეფიციენტს აქვს დადებითი ნიშანი, მაგალითადr =+0.207, უარყოფითი კორელაციით - უარყოფითი ნიშანი, მაგალითადr = -0.207.

ხარისხი, სიმტკიცე ან შებოჭილობა კორელაციური კავშირი განისაზღვრება კორელაციის კოეფიციენტის მნიშვნელობით.

კავშირის სიძლიერე არ არის დამოკიდებული მის მიმართულებაზე და განისაზღვრება კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობით.

კორელაციის კოეფიციენტის მაქსიმალური შესაძლო აბსოლუტური მნიშვნელობაr =1.00; მინიმალური r =0.00.

კორელაციების ზოგადი კლასიფიკაცია (ივანტერ ე.ვ., კოროსოვი ა.ვ., 1992 წლის მიხედვით):

ძლიერი, ან მჭიდროკორელაციის კოეფიციენტითr > 0.70;

საშუალოზე 0,50< რ<0,69 ;

ზომიერიზე 0,30< რ<0,49 ;

სუსტიზე 0,20< რ<0,29 ;

ძალიან სუსტიზე რ<0,19 .

ცვლადები X და Y შეიძლება გაიზომოს სხვადასხვა მასშტაბით, ეს არის ის, რაც განსაზღვრავს შესაბამისი კორელაციის კოეფიციენტის არჩევანს (იხ. ცხრილი 3):

ცხრილი 3. კორელაციის კოეფიციენტის გამოყენება ცვლადების ტიპის მიხედვით

სასწორის ტიპი

კავშირის ზომა

ცვლადი X

ცვლადი Y

ინტერვალი ან ურთიერთობა

ინტერვალი ან ურთიერთობა

პირსონის კოეფიციენტი

წოდება, ინტერვალი ან თანაფარდობა

სპირმენის კოეფიციენტი

რეიტინგული

რეიტინგული

კენდალის კოეფიციენტი

დიქოტომიური

დიქოტომიური

კოეფიციენტი "j"

დიქოტომიური

რეიტინგული

წოდება-ბისერიული

დიქოტომიური

ინტერვალი ან ურთიერთობა

ბისერიული

7.2.2 პირსონის კორელაციის კოეფიციენტი

ტერმინი „კორელაცია“ მეცნიერებაში შემოიტანა გამოჩენილმა ინგლისელმა ნატურალისტმა ფრენსის გალტონმა 1886 წელს. თუმცა კორელაციის კოეფიციენტის გამოთვლის ზუსტი ფორმულა შეიმუშავა მისმა სტუდენტმა კარლ პირსონმა.

კოეფიციენტი ახასიათებს მახასიათებლებს შორის მხოლოდ წრფივი კავშირის არსებობას, რომელიც ჩვეულებრივ აღინიშნება სიმბოლოებით X და Y. კორელაციის კოეფიციენტის გამოთვლის ფორმულა აგებულია ისე, რომ თუ მახასიათებლებს შორის კავშირი წრფივია, პირსონის კოეფიციენტი ზუსტად ადგენს ამ ურთიერთობის სიახლოვე. ამიტომ, მას ასევე უწოდებენ პირსონის წრფივი კორელაციის კოეფიციენტს. თუ კავშირი ცვლადებს შორის X დაი არ არის წრფივი, მაშინ პირსონმა შემოგვთავაზა ეგრეთ წოდებული კორელაციური მიმართება ამ კავშირის სიახლოვის შესაფასებლად.

პირსონის წრფივი კორელაციის კოეფიციენტის მნიშვნელობა არ შეიძლება აღემატებოდეს +1 და იყოს -1-ზე ნაკლები. ეს ორი რიცხვი +1 და -1 არის კორელაციის კოეფიციენტის საზღვრები. როდესაც გაანგარიშების შედეგად მიიღება მნიშვნელობა +1-ზე მეტი ან -1-ზე ნაკლები, გამოთვლებში მოხდა შეცდომა.

კორელაციის კოეფიციენტის ნიშანი ძალიან მნიშვნელოვანია მიღებული ურთიერთობის ინტერპრეტაციისთვის. კიდევ ერთხელ ხაზგასმით აღვნიშნოთ, რომ თუ წრფივი კორელაციის კოეფიციენტის ნიშანი არის პლუსი, მაშინ კორელაციულ მახასიათებლებს შორის ურთიერთობა ისეთია, რომ ერთი მახასიათებლის (ცვლადის) უფრო დიდი მნიშვნელობა შეესაბამება სხვა მახასიათებლის (სხვა ცვლადის) უფრო დიდ მნიშვნელობას. სხვა სიტყვებით რომ ვთქვათ, თუ ერთი მაჩვენებელი (ცვლადი) იზრდება, მაშინ მეორე ინდიკატორი (ცვლადი) შესაბამისად იზრდება. ამ დამოკიდებულებას პირდაპირპროპორციულ დამოკიდებულებას უწოდებენ.

თუ მიიღება მინუს ნიშანი, მაშინ ერთი მახასიათებლის უფრო დიდი მნიშვნელობა შეესაბამება მეორის უფრო მცირე მნიშვნელობას. სხვა სიტყვებით რომ ვთქვათ, თუ არის მინუს ნიშანი, ერთი ცვლადის (ნიშანი, მნიშვნელობა) ზრდა შეესაბამება მეორე ცვლადის შემცირებას. ამ დამოკიდებულებას უკუპროპორციული დამოკიდებულება ეწოდება.

ზოგადად, კორელაციის კოეფიციენტის გამოთვლის ფორმულა არის:

(7)

სად X მე- მნიშვნელობები აღებული ნიმუში X,

y მე- Y ნიმუშში მიღებული მნიშვნელობები;

საშუალო X-სთვის, - საშუალო Y-სთვის.

პირსონის კორელაციის კოეფიციენტის გამოთვლა ვარაუდობს, რომ X და Y ცვლადები განაწილებულია ჯარიმა.

ფორმულა (7) შეიცავს რაოდენობას როდესაც იყოფან (ცვლადის X ან Y მნიშვნელობების რაოდენობა) მას უწოდებენ კოვარიანტობა. ფორმულა (7) ასევე ვარაუდობს, რომ კორელაციის კოეფიციენტების გაანგარიშებისას, X ცვლადის მნიშვნელობების რაოდენობა უდრის ცვლადის მნიშვნელობების რაოდენობას.ი.

თავისუფლების ხარისხების რაოდენობა k = n -2.

მაგალითი 3. 10 მოსწავლეს ჩაუტარდა ტესტები ვიზუალურ-ფიგურალური და ვერბალური აზროვნებისთვის. ტესტის ამოცანების ამოხსნის საშუალო დრო გაზომილი იყო წამებში. მკვლევარს აინტერესებს კითხვა: არის თუ არა კავშირი ამ პრობლემების გადასაჭრელად საჭირო დროს შორის? ცვლადი X აღნიშნავს ვიზუალურ-ფიგურული ამოცანების ამოხსნის საშუალო დროს, ხოლო ცვლადი Y აღნიშნავს ვერბალური ტესტის ამოცანების ამოხსნის საშუალო დროს.

გამოსავალი. წარმოვადგინოთ საწყისი მონაცემები მე-4 ცხრილის სახით, რომელიც შეიცავს დამატებით სვეტებს, რომლებიც აუცილებელია გამოსათვლელად (7) ფორმულით.

ცხრილი 4

საგნების რაოდენობა

x

x i -

(x i - ) 2

y მე -

(y i -) 2

16,7

278,89

51,84

120,24

13,69

17,2

295,84

63,64

7,29

51,84

19,44

68,89

14,44

31,54

59,29

7,84

21,56

0,49

46,24

4,76

10,89

17,64

13,86

10,89

51,84

23,76

68,89

10,8

116,64

89,64

68,89

18,8

353,44

156,04

ჯამი

357

242

588,1

1007,6

416,6

საშუალო

35,7

24,2

ჩვენ ვიანგარიშებთ კორელაციის კოეფიციენტის ემპირიულ მნიშვნელობას ფორმულის გამოყენებით (7):

მიღებული კორელაციის კოეფიციენტისთვის განვსაზღვრავთ კრიტიკულ მნიშვნელობებს დანართ 3-ის ცხრილის მიხედვით. პირსონის წრფივი კორელაციის კოეფიციენტისთვის კრიტიკული მნიშვნელობების პოვნისას, თავისუფლების გრადუსების რაოდენობა გამოითვლება როგორც k = n – 2 = 8.

k crit = 0.72 > 0.54, შესაბამისად, ჰიპოთეზა H 1 უარყოფილია და ჰიპოთეზა მიიღება H 0 , სხვა სიტყვებით რომ ვთქვათ, კავშირი ვიზუალურ-ფიგურული და ვერბალური ტესტური ამოცანების ამოხსნის დროს დადასტურებული არ არის.

7.3 რეგრესიის ანალიზი

ეს არის მეთოდების ჯგუფი, რომელიც მიმართულია იმ ცვლილებებისა და დამოკიდებულებების იდენტიფიცირებასა და მათემატიკურად გამოხატვაზე, რომლებიც ხდება შემთხვევითი ცვლადების სისტემაში. თუ ასეთი სისტემა აყალიბებს პედაგოგიურს, შესაბამისად, რეგრესიული ანალიზის საშუალებით ხდება ფსიქოლოგიური და პედაგოგიური ფენომენების იდენტიფიცირება და მათემატიკურად გამოხატვა. ამ ფენომენების მახასიათებლები იზომება სხვადასხვა მასშტაბით, რაც აწესებს შეზღუდვებს იმ ცვლილებებისა და დამოკიდებულებების მათემატიკური გამოხატვის გზებზე, რომლებსაც სწავლობს მასწავლებელი-მკვლევარი.

რეგრესიის ანალიზის მეთოდები ძირითადად შექმნილია სტაბილური ნორმალური განაწილების შემთხვევაში, რომელშიც ცვლილებები საცდელიდან საცდელამდე ჩნდება მხოლოდ დამოუკიდებელი ცდების სახით.

გამოვლენილია რეგრესიული ანალიზის სხვადასხვა ფორმალური პრობლემა. ისინი შეიძლება იყოს მარტივი ან რთული ფორმულირების, მათემატიკური საშუალებების და შრომის ინტენსივობის თვალსაზრისით. მოდით ჩამოვთვალოთ და განვიხილოთ მაგალითებით ისინი, რომლებიც, როგორც ჩანს, მთავარია.

პირველი ამოცანა არის ცვალებადობის ფაქტის იდენტიფიცირება ფენომენი შესწავლილია გარკვეულ, მაგრამ არა ყოველთვის მკაფიოდ დაფიქსირებულ პირობებში. წინა ლექციაზე ჩვენ უკვე გადავჭრით ეს პრობლემა პარამეტრული და არაპარამეტრული კრიტერიუმების გამოყენებით.

მეორე დავალება - ტენდენციის იდენტიფიცირება როგორც მახასიათებლის პერიოდული ცვლილება. თავად ეს მახასიათებელი შეიძლება იყოს ან არ იყოს დამოკიდებული მდგომარეობის ცვლადზე (ეს შეიძლება დამოკიდებული იყოს მკვლევარის მიერ უცნობ ან უკონტროლო პირობებზე). მაგრამ ეს არ არის მნიშვნელოვანი განსახილველი ამოცანისთვის, რომელიც შემოიფარგლება მხოლოდ ტენდენციისა და მისი მახასიათებლების იდენტიფიცირებით.

ჰიპოთეზების ტესტირება ტენდენციის არარსებობის ან არსებობის შესახებ შეიძლება განხორციელდეს Abbe კრიტერიუმის გამოყენებით . აბა კრიტერიუმიშექმნილია 4-ისთვის დადგენილი საშუალო მნიშვნელობების თანასწორობის შესახებ ჰიპოთეზების შესამოწმებლად

Abbe კრიტერიუმის ემპირიული მნიშვნელობა გამოითვლება ფორმულით:

(8)

სად არის ნიმუშის საშუალო არითმეტიკული;

- მნიშვნელობების რაოდენობა ნიმუშში.

კრიტერიუმის მიხედვით, საშუალების თანასწორობის ჰიპოთეზა უარყოფილია (ალტერნატიული ჰიპოთეზა მიღებულია), თუ სტატისტიკის მნიშვნელობა არის . სტატისტიკის ტაბულური (კრიტიკული) მნიშვნელობა განისაზღვრება Abbe-ს q-კრიტერიუმის ცხრილიდან, რომელიც შემოკლებებით არის ნასესხები წიგნიდან L.N. ბოლიშევა და ნ.ვ. სმირნოვა (იხ. დანართი 3).

ასეთი რაოდენობები, რომლებისთვისაც გამოიყენება Abbe-ს კრიტერიუმი, შეიძლება იყოს ნიმუშის წილი ან პროცენტი, საშუალო არითმეტიკული და ნიმუშის განაწილების სხვა სტატისტიკა, თუ ისინი ახლოსაა ნორმასთან (ან ადრე ნორმალიზებული). მაშასადამე, Abbe-ს კრიტერიუმს შეუძლია ჰპოვოს ფართო გამოყენება ფსიქოლოგიურ და პედაგოგიურ კვლევებში. მოდით განვიხილოთ ტენდენციის იდენტიფიცირების მაგალითი Abbe კრიტერიუმის გამოყენებით.

მაგალითი 4.მაგიდაზე 5 გვიჩვენებს სტუდენტების პროცენტული დინამიკას IV კურსი, რომელმაც ზამთრის სესიებში გამოცდები „ბრწყინვალედ“ ჩააბარა უნივერსიტეტის ერთ-ერთ ფაკულტეტზე 10 წლიანი მუშაობის განმავლობაში, საჭიროა დადგინდეს, არის თუ არა აკადემიური მოსწრების ამაღლების ტენდენცია.

ცხრილი 5. მეოთხე კურსის წარჩინებული სტუდენტების პროცენტული დინამიკა ფაკულტეტის მუშაობის 10 წლის განმავლობაში

Სასწავლო წლის

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

როგორც nullჩვენ ვამოწმებთ ჰიპოთეზას ტენდენციის არარსებობის შესახებ, ანუ პროცენტების თანასწორობის შესახებ.

ჩვენ საშუალოდ ვიღებთ ცხრილში მოცემულ პროცენტებს. 5, ჩვენ ვხვდებით, რომ =21.5. ჩვენ ვიანგარიშებთ განსხვავებებს ნიმუშში მომდევნო და წინა მნიშვნელობებს შორის, კვადრატში და ვაჯამებთ მათ:

ანალოგიურად ითვლის მნიშვნელს ფორმულაში (8), აჯამებს კვადრატებს შორის განსხვავებას თითოეულ გაზომვასა და საშუალო არითმეტიკას შორის:

ახლა ფორმულის გამოყენებით (8) მივიღებთ:

Abbe-ს კრიტერიუმების ცხრილში დანართი 3, ჩვენ ვხვდებით, რომ n = 10 და 0,05 მნიშვნელოვნების დონით, კრიტიკული მნიშვნელობა აღემატება ჩვენს მიერ მიღებულ 0,41-ს, ამიტომ ჰიპოთეზა „წარჩინებული სტუდენტების“ პროცენტის თანასწორობის შესახებ უნდა იყოს. უარყოფილია და შეგვიძლია მივიღოთ ალტერნატიული ჰიპოთეზა ტენდენციის არსებობის შესახებ.

მესამე ამოცანაა კორელაციური განტოლების სახით გამოხატული ნიმუშის იდენტიფიცირება (რეგრესია).

მაგალითი 5.ესტონელმა მკვლევარმა ჯ. მიკმა, ტექსტის გაგების სირთულეების შესწავლისას, დაადგინა „წაკითხვის ფორმულა“, რომელიც მრავალჯერადი წრფივი რეგრესიაა:

ტექსტის გაგების სირთულის შეფასება,

სადაც x 1 არის დამოუკიდებელი წინადადებების სიგრძე დაბეჭდილი სიმბოლოების რაოდენობაში,

x 2 - სხვადასხვა უცნობი სიტყვების პროცენტი,

x 3 - არსებითი სახელით გამოხატული განმეორებითი ცნებების აბსტრაქტულობა .

ფაქტორების გავლენის ხარისხის გამომხატველი რეგრესიის კოეფიციენტების შედარებისას შეიძლება დავინახოთ, რომ ტექსტის გაგების სირთულე, პირველ რიგში, მისი აბსტრაქტულობით განისაზღვრება. ტექსტის გაგების სირთულე ნახევრად (0,27) დამოკიდებულია უცნობი სიტყვების რაოდენობაზე და პრაქტიკულად საერთოდ არ არის დამოკიდებული წინადადების სიგრძეზე.

  • საიტის სექციები