Analiza e variancës. Analiza multivariate e variancës Modeli ANOVA i komponentëve të variancës

Analiza e variancës

1. Koncepti i analizës së variancës

Analiza e variancësështë një analizë e ndryshueshmërisë së një tipari nën ndikimin e çdo faktori të ndryshueshëm të kontrolluar. Në literaturën e huaj, analiza e variancës shpesh quhet ANOVA, e cila përkthehet si analiza e ndryshueshmërisë (Analysis of Variance).

Problemi ANOVA konsiston në izolimin e ndryshueshmërisë së një lloji të ndryshëm nga ndryshueshmëria e përgjithshme e një tipari:

a) ndryshueshmëria për shkak të veprimit të secilit prej variablave të pavarur në studim;

b) ndryshueshmëria për shkak të ndërveprimit të variablave të pavarur që studiohen;

c) ndryshueshmëria e rastësishme për shkak të të gjithë variablave të tjerë të panjohur.

Ndryshueshmëria për shkak të veprimit të variablave në studim dhe ndërveprimit të tyre lidhet me ndryshueshmërinë e rastësishme. Një tregues i kësaj marrëdhënieje është testi F Fisher.

Formula për llogaritjen e kriterit F përfshin vlerësimet e variancave, domethënë parametrat e shpërndarjes së atributit, prandaj kriteri F është një kriter parametrik.

Sa më shumë ndryshueshmëria e një tipari të jetë për shkak të variablave (faktorëve) në studim ose ndërveprimit të tyre, aq më i lartë vlerat e kriterit empirik.

Zero hipoteza në analizën e variancës do të thotë se vlerat mesatare të karakteristikës efektive të studiuar janë të njëjta në të gjitha gradimet.

Alternativa hipoteza do të thotë se vlerat mesatare të karakteristikës që rezulton në gradime të ndryshme të faktorit në studim janë të ndryshme.

Analiza e variancës na lejon të deklarojmë një ndryshim në një karakteristikë, por nuk tregon drejtim këto ndryshime.

Le të fillojmë shqyrtimin tonë të analizës së variancës me rastin më të thjeshtë, kur studiojmë veprimin e vetëm një variabël (një faktor).

2. Analiza njëkahëshe e variancës për mostrat e palidhura

2.1. Qëllimi i metodës

Metoda e analizës së variancës me një faktor përdoret në rastet kur ndryshimet në një karakteristikë efektive studiohen nën ndikimin e ndryshimit të kushteve ose shkallëzimeve të një faktori. Në këtë version të metodës, ndikimi i secilit prej gradimeve të faktorit është të ndryshme mostrat e lëndëve. Duhet të ketë të paktën tre shkallëzime të faktorit. (Mund të ketë dy shkallëzime, por në këtë rast nuk do të arrijmë të vendosim varësi jolineare dhe duket më e arsyeshme të përdorim më të thjeshta).

Një version joparametrik i këtij lloji analize është testi Kruskal-Wallis H.

Hipotezat

H 0: Dallimet midis notave të faktorëve (kushte të ndryshme) nuk janë më të mëdha se dallimet e rastësishme brenda secilit grup.

H 1: Dallimet midis notave të faktorëve (kushte të ndryshme) janë më të mëdha se dallimet e rastësishme brenda secilit grup.

2.2. Kufizimet e analizës së njëanshme të variancës për mostrat e palidhura

1. Analiza njëkahëshe e variancës kërkon të paktën tre shkallëzime të faktorit dhe të paktën dy lëndë në çdo gradim.

2. Karakteristika që rezulton duhet të shpërndahet normalisht në kampionin në studim.

Vërtetë, zakonisht nuk tregohet nëse po flasim për shpërndarjen e karakteristikës në të gjithë kampionin e anketuar ose në atë pjesë të saj që përbën kompleksin e shpërndarjes.

3. Një shembull i zgjidhjes së një problemi duke përdorur metodën e analizës së njëanshme të variancës për mostrat e palidhura duke përdorur shembullin:

Tre grupeve të ndryshme me gjashtë lëndë iu dhanë lista me dhjetë fjalë. Fjalët iu prezantuan grupit të parë me një shpejtësi të ulët - 1 fjalë për 5 sekonda, grupit të dytë me një shpejtësi mesatare - 1 fjalë për 2 sekonda, dhe grupit të tretë me një shpejtësi të lartë - 1 fjalë në sekondë. Performanca e riprodhimit ishte parashikuar të varej nga shpejtësia e prezantimit të fjalëve. Rezultatet janë paraqitur në tabelë. 1.

Numri i fjalëve të riprodhuara Tabela 1

Subjekti Nr.

shpejtësi të ulët

Shpejtësia mesatare

shpejtësi e lartë

shuma totale

H 0: Dallimet në hapësirën e prodhimit të fjalëve ndërmjet grupet nuk janë më të theksuara se dallimet e rastësishme brendaçdo grup.

H1: Dallimet në vëllimin e prodhimit të fjalëve ndërmjet grupet janë më të theksuara se dallimet e rastësishme brendaçdo grup. Duke përdorur vlerat eksperimentale të paraqitura në tabelë. 1, ne do të vendosim disa vlera që do të jenë të nevojshme për të llogaritur kriterin F.

Llogaritja e sasive kryesore për analizën e njëanshme të variancës është paraqitur në tabelë:

tabela 2

Tabela 3

Sekuenca e operacioneve në analizën e njëanshme të variancës për mostrat e palidhura

Shpesh gjendet në këtë dhe në tabelat pasuese, përcaktimi SS është një shkurtim për "shuma e katrorëve". Ky shkurtim përdoret më shpesh në burimet e përkthyera.

SS fakt nënkupton ndryshueshmërinë e karakteristikës për shkak të veprimit të faktorit në studim;

SS përgjithësisht- ndryshueshmëria e përgjithshme e tiparit;

S C.A.-ndryshueshmëria për shkak të faktorëve të pa llogaritur, ndryshueshmëria "të rastësishme" ose "mbeturëse".

ZNJ- “katrori mesatar”, ose pritshmëria matematikore e shumës së katrorëve, vlera mesatare e SS përkatëse.

df - numri i shkallëve të lirisë, të cilin, kur marrim parasysh kriteret joparametrike, e shënuam me një shkronjë greke v.

Përfundim: H 0 refuzohet. H 1 pranohet. Dallimet në kujtimin e fjalëve ndërmjet grupeve ishin më të mëdha se dallimet e rastësishme brenda secilit grup (α=0.05). Pra, shpejtësia e paraqitjes së fjalëve ndikon në vëllimin e riprodhimit të tyre.

Një shembull i zgjidhjes së problemit në Excel është paraqitur më poshtë:

Të dhënat fillestare:

Duke përdorur komandën: Mjete->Analiza e të dhënave->ANOVA njëkahëshe, marrim rezultatet e mëposhtme:

Siç është vërejtur tashmë, metoda e dispersionit është e lidhur ngushtë me grupimet statistikore dhe supozon se popullata në studim ndahet në grupe sipas karakteristikave të faktorëve, ndikimi i të cilave duhet studiuar.

Bazuar në analizën e variancës, rezulton:

1. vlerësimi i besueshmërisë së dallimeve në mesataret e grupit për një ose disa karakteristika të faktorëve;

2. vlerësimi i besueshmërisë së ndërveprimeve të faktorëve;

3. vlerësimi i dallimeve të pjesshme ndërmjet çifteve të mjeteve.

Zbatimi i analizës së variancës bazohet në ligjin e zbërthimit të variancave (variacioneve) të një karakteristike në përbërës.

Variacioni total D o i karakteristikës që rezulton gjatë grupimit mund të zbërthehet në komponentët e mëposhtëm:

1. të ndërgrupohen D m lidhur me një karakteristikë grupimi;

2. për mbetje(brenda grupit) D B nuk lidhet me karakteristikën e grupimit.

Marrëdhënia midis këtyre treguesve shprehet si më poshtë:

D o = D m + D in. (1.30)

Le të shohim përdorimin e analizës së variancës me një shembull.

Le të themi se doni të provoni nëse datat e mbjelljes ndikojnë në rendimentet e grurit. Të dhënat fillestare eksperimentale për analizën e variancës janë paraqitur në tabelë. 8.

Tabela 8

Në këtë shembull, N = 32, K = 4, l = 8.

Le të përcaktojmë ndryshimin total total në rendiment, që është shuma e devijimeve në katror të vlerave individuale të një tipari nga mesatarja e përgjithshme:

ku N është numri i njësive të popullsisë; Y i – vlerat individuale të rendimentit; Y o është rendimenti mesatar i përgjithshëm për të gjithë popullsinë.

Për të përcaktuar variacionin total ndërgrupor, i cili përcakton ndryshimin e karakteristikës efektive për shkak të faktorit që studiohet, është e nevojshme të njihen vlerat mesatare të karakteristikës efektive për secilin grup. Ky ndryshim total është i barabartë me shumën e devijimeve në katror të mesatareve të grupit nga vlera mesatare e përgjithshme e tiparit, të ponderuar nga numri i njësive të popullsisë në secilin grup:

Variacioni total brenda grupit është i barabartë me shumën e devijimeve në katror të vlerave individuale të një tipari nga mesataret e grupit për secilin grup, të përmbledhur në të gjitha grupet në popullatë.

Ndikimi i një faktori në karakteristikën që rezulton manifestohet në marrëdhënien midis Dm dhe Dv: sa më i fortë të jetë ndikimi i faktorit në vlerën e karakteristikës që studiohet, aq më i madh është Dm dhe aq më pak Dv.

Për të kryer analizën e variancës, është e nevojshme të përcaktohen burimet e variacionit në një tipar, vëllimi i variacionit sipas burimit dhe të përcaktohet numri i shkallëve të lirisë për secilin komponent të variacionit.

Sasia e variacionit është përcaktuar tashmë; tani është e nevojshme të përcaktohet numri i shkallëve të lirisë së variacionit. Numri i shkallëve të lirisë është numri i devijimeve të pavarura të vlerave individuale të një karakteristike nga vlera mesatare e saj. Numri i përgjithshëm i shkallëve të lirisë, që korrespondon me shumën totale të devijimeve në katror në ANOVA, zbërthehet në përbërës të variacionit. Kështu, shuma totale e devijimeve në katror D o korrespondon me numrin e shkallëve të lirisë së variacionit të barabartë me N – 1 = 31. Variacioni i grupit D m korrespondon me numrin e shkallëve të lirisë së variacionit të barabartë me K – 1 = 3. Variacioni i mbetur brenda grupit korrespondon me numrin e shkallëve të lirisë së variacionit të barabartë me N – K = 28.


Tani, duke ditur shumën e devijimeve në katror dhe numrin e shkallëve të lirisë, mund të përcaktojmë variancat për secilin komponent. Le të shënojmë këto varianca: d m - grup dhe d në - brendagrup.

Pas llogaritjes së këtyre variancave, ne do të vazhdojmë të përcaktojmë rëndësinë e ndikimit të faktorit në atributin që rezulton. Për ta bërë këtë, gjejmë raportin: d M / d B = F f,

Sasia F f, e quajtur Kriteri Fisher , krahasuar me tabelën, tabelën F. Siç është vërejtur tashmë, nëse tabela F f > F, atëherë ndikimi i faktorit në atributin efektiv është vërtetuar. Nëse F f< F табл то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, следовательно, не доказывает с достаточной вероятностью влияние изучаемого фактора.

Vlera teorike lidhet me probabilitetin, dhe në tabelë vlera e saj është dhënë në një nivel të caktuar të probabilitetit të gjykimit. Shtojca përmban një tabelë që ju lejon të vendosni vlerën e mundshme të F për probabilitetin e gjykimit, më i përdoruri: niveli i probabilitetit të "hipotezës zero" është 0.05. Në vend të probabiliteteve të "hipotezës zero", tabela mund të quhet tabela për probabilitetin prej 0.95 të rëndësisë së ndikimit të faktorit. Rritja e nivelit të probabilitetit kërkon një vlerë më të lartë F të tabelës për krahasim.

Vlera e tabelës F varet gjithashtu nga numri i shkallëve të lirisë së dy dispersioneve që krahasohen. Nëse numri i shkallëve të lirisë priret në pafundësi, atëherë tabela F priret drejt unitetit.

Tabela e vlerave të tabelës F është ndërtuar si më poshtë: kolonat e tabelës tregojnë shkallët e lirisë së variacionit për shpërndarjen më të madhe, dhe rreshtat tregojnë shkallët e lirisë për shpërndarjen më të vogël (brenda grupit). Vlera e F gjendet në kryqëzimin e kolonës dhe rreshtit të shkallëve përkatëse të lirisë së variacionit.

Pra, në shembullin tonë, F f = 21.3/3.8 = 5.6. Vlera e tabelës së tabelës F për një probabilitet prej 0,95 dhe shkallë lirie, përkatësisht e barabartë me 3 dhe 28, tabela F = 2,95.

Vlera e F f e përftuar eksperimentalisht e kalon vlerën teorike edhe për një probabilitet prej 0,99. Rrjedhimisht, përvoja me probabilitet më të madh se 0,99 dëshmon ndikimin e faktorit të studiuar në rendiment, pra përvoja mund të konsiderohet e besueshme, e provuar dhe për rrjedhojë koha e mbjelljes ka një ndikim të rëndësishëm në rendimentin e grurit. Periudha optimale e mbjelljes duhet të konsiderohet periudha nga 10 deri më 15 maj, pasi ishte gjatë kësaj periudhe mbjelljeje që u morën rezultatet më të mira të rendimentit.

Ne ekzaminuam metodën e analizës së variancës kur grupojmë sipas një karakteristike dhe shpërndajmë në mënyrë të rastësishme replikat brenda grupit. Megjithatë, shpesh ndodh që parcela eksperimentale të ketë disa ndryshime në pjellorinë e tokës, etj. Prandaj, mund të lindë një situatë që një numër më i madh parcelash të njërës prej opsioneve do të bien në pjesën më të mirë dhe treguesit e tij do të mbivlerësohen, dhe nga opsioni tjetër - nga pjesa më e keqe, dhe rezultatet në këtë rast natyrisht do të jenë më të këqija, domethënë të nënvlerësuara.

Për të përjashtuar variacionin që shkaktohet nga arsye që nuk lidhen me eksperimentin, është e nevojshme të izolohet varianca e llogaritur nga përsëritjet (blloqet) nga varianca brenda grupit (mbetëse).

Shuma totale e devijimeve në katror ndahet në këtë rast në 3 komponentë:

D o = D m + D përsëritje + D pushim. (1.33)

Për shembullin tonë, shuma e devijimeve në katror të shkaktuara nga përsëritjet do të jetë e barabartë me:

Prandaj, shuma aktuale e rastësishme e devijimeve në katror do të jetë e barabartë me:

D pushim = D në – D përsëritje; D pushim = 106 – 44 = 62.

Për variancën e mbetur, numri i shkallëve të lirisë do të jetë i barabartë me 28 – 7 = 21. Rezultatet e analizës së variancës janë paraqitur në tabelë. 9.

Tabela 9

Meqenëse vlerat aktuale të kriterit F për një probabilitet prej 0.95 tejkalojnë ato të tabelës, ndikimi i datave të mbjelljes dhe i përsëritjeve në rendimentin e grurit duhet të konsiderohet i rëndësishëm. Metoda e konsideruar e ndërtimit të një eksperimenti, kur siti ndahet paraprakisht në blloqe me kushte relativisht të përafruara, dhe opsionet e testuara shpërndahen brenda bllokut në mënyrë të rastësishme, quhet metoda e blloqeve të rastësishme.

Duke përdorur analizën e variancës, ju mund të studioni ndikimin e jo vetëm një faktori në rezultat, por dy ose më shumë. Analiza e variancës në këtë rast do të quhet analiza multivariate e variancës .

ANOVA me dy drejtime ndryshon nga dy ato me një faktor në atë që ai mund t'u përgjigjet pyetjeve të mëposhtme:

1. 1 Cili është efekti i të dy faktorëve së bashku?

2. Cili është roli i kombinimit të këtyre faktorëve?

Le të shqyrtojmë një analizë të variancës së eksperimentit, në të cilën është e nevojshme të identifikohet ndikimi i jo vetëm datave të mbjelljes, por edhe varieteteve në rendimentin e grurit (Tabela 10).

Tabela 10. Të dhëna eksperimentale mbi ndikimin e datave dhe varieteteve të mbjelljes në rendimentin e grurit

është shuma e devijimeve në katror të vlerave individuale nga mesatarja e përgjithshme.

Ndryshim në ndikimin e përbashkët të kohës së mbjelljes dhe varietetit

është shuma e devijimeve në katror të mesatares së nëngrupit nga mesatarja e përgjithshme, e ponderuar me numrin e përsëritjeve, pra me 4.

Llogaritja e variacionit bazuar vetëm në ndikimin e kohës së mbjelljes:

Variacioni i mbetur përcaktohet si ndryshimi midis variacionit total dhe ndryshimit në ndikimin e përbashkët të faktorëve të studiuar:

D pushim = D o – D ps = 170 – 96 = 74.

Të gjitha llogaritjet mund të paraqiten në formën e një tabele (Tabela 11).

Tabela 11. Rezultatet e analizës së variancës

Rezultatet e analizës së variancës tregojnë se ndikimi i faktorëve të studiuar, d.m.th., koha e mbjelljes dhe varieteti, në rendimentin e grurit është i rëndësishëm, pasi kriteret aktuale F për secilin prej faktorëve tejkalojnë dukshëm ato të tabeluara të gjetura për shkallët përkatëse. të lirisë, dhe në të njëjtën kohë me një probabilitet mjaft të lartë (p = 0,99). Ndikimi i një kombinimi faktorësh në këtë rast mungon, pasi faktorët janë të pavarur nga njëri-tjetri.

Analiza e ndikimit të tre faktorëve në rezultat kryhet sipas të njëjtit parim si për dy faktorë, vetëm në këtë rast do të ketë tre varianca për faktorët dhe katër variante për kombinimin e faktorëve. Me një rritje të numrit të faktorëve, vëllimi i punës së llogaritjes rritet ndjeshëm dhe, përveç kësaj, bëhet e vështirë të rregulloni informacionin fillestar në një tabelë kombinimi. Prandaj, vështirë se këshillohet të studiohet ndikimi i shumë faktorëve në rezultat duke përdorur analizën e variancës; është më mirë të merret një numër më i vogël, por të zgjidhni faktorët më domethënës nga pikëpamja e analizës ekonomike.

Shpesh studiuesi duhet të merret me të ashtuquajturat komplekse dispersioni disproporcionale, pra ato në të cilat nuk respektohet proporcionaliteti i numrit të varianteve.

Në komplekse të tilla, ndryshimi në efektin total të faktorëve nuk është i barabartë me shumën e ndryshimit midis faktorëve dhe ndryshimin në kombinimin e faktorëve. Ai ndryshon me një shumë në varësi të shkallës së lidhjeve midis faktorëve individualë që lindin si rezultat i shkeljes së proporcionalitetit.

Në këtë rast, lindin vështirësi në përcaktimin e shkallës së ndikimit të secilit faktor, pasi shuma e ndikimeve individuale nuk është e barabartë me ndikimin total.

Një nga mënyrat për të reduktuar një kompleks joproporcional në një strukturë të vetme është zëvendësimi i tij me një kompleks proporcional, në të cilin frekuencat vlerësohen në grupe. Kur bëhet një zëvendësim i tillë, problemi zgjidhet sipas parimeve të komplekseve proporcionale.

Analiza e variancës është një grup metodash statistikore të krijuara për të testuar hipotezat në lidhje me marrëdhëniet midis karakteristikave të caktuara dhe faktorëve të studiuar që nuk kanë një përshkrim sasior, si dhe për të përcaktuar shkallën e ndikimit të faktorëve dhe ndërveprimin e tyre. Në literaturën e specializuar shpesh quhet ANOVA (nga emri anglisht Analysis of Variations). Kjo metodë u zhvillua për herë të parë nga R. Fischer në 1925.

Llojet dhe kriteret e analizës së variancës

Kjo metodë përdoret për të studiuar marrëdhënien midis karakteristikave cilësore (nominale) dhe një ndryshoreje sasiore (të vazhdueshme). Në thelb, ai teston hipotezën për barazinë e mesatareve aritmetike të disa mostrave. Kështu, ai mund të konsiderohet si një kriter parametrik për krahasimin e qendrave të disa mostrave në të njëjtën kohë. Nëse kjo metodë përdoret për dy mostra, rezultatet e analizës së variancës do të jenë identike me rezultatet e testit t Studentit. Megjithatë, ndryshe nga kriteret e tjera, ky studim na lejon të studiojmë problemin në mënyrë më të detajuar.

Analiza e dispersionit në statistika bazohet në ligj: shuma e devijimeve në katror të kampionit të kombinuar është e barabartë me shumën e devijimeve në katror brenda grupit dhe shumën e devijimeve në katror të ndërgrupit. Studimi përdor testin e Fisher për të përcaktuar rëndësinë e ndryshimit midis variancave ndërgrupore dhe variancave brenda grupit. Megjithatë, parakushtet e nevojshme për këtë janë normaliteti i shpërndarjes dhe homoskedastizmi (barazia e variancave) të mostrave. Ekzistojnë analiza univariate (me një faktor) të variancës dhe multivariate (multifaktoriale). E para merr në konsideratë varësinë e vlerës në studim nga një karakteristikë, e dyta - nga shumë në të njëjtën kohë, dhe gjithashtu na lejon të identifikojmë lidhjen midis tyre.

Faktorët

Faktorët janë rrethana të kontrolluara që ndikojnë në rezultatin përfundimtar. Niveli i tij ose metoda e përpunimit është një vlerë që karakterizon një manifestim specifik të kësaj gjendjeje. Këta numra zakonisht paraqiten në një shkallë matjeje nominale ose rendore. Shpesh vlerat e prodhimit maten në shkallë sasiore ose rendore. Pastaj lind problemi i grupimit të të dhënave dalëse në një numër vëzhgimesh që korrespondojnë me vlera numerike afërsisht të njëjta. Nëse numri i grupeve merret si tepër i madh, atëherë numri i vëzhgimeve në to mund të jetë i pamjaftueshëm për të marrë rezultate të besueshme. Nëse e merrni numrin shumë të vogël, kjo mund të çojë në humbjen e veçorive të rëndësishme të ndikimit në sistem. Mënyra specifike për të grupuar të dhënat varet nga sasia dhe natyra e variacionit në vlera. Numri dhe madhësia e intervaleve në analizën e njëanshme më së shpeshti përcaktohen nga parimi i intervaleve të barabarta ose parimi i frekuencave të barabarta.

Analiza e problemeve të variancës

Pra, ka raste kur duhet të krahasoni dy ose më shumë mostra. Pikërisht atëherë këshillohet përdorimi i analizës së variancës. Emri i metodës tregon se përfundimet janë nxjerrë në bazë të studimit të komponentëve të variancës. Thelbi i studimit është se ndryshimi i përgjithshëm në tregues ndahet në pjesë përbërëse që korrespondojnë me veprimin e secilit faktor individual. Le të shqyrtojmë një numër problemesh që zgjidhen nga analiza tipike e variancës.

Shembulli 1

Punishtja ka një sërë makinerish automatike që prodhojnë një pjesë specifike. Madhësia e secilës pjesë është një ndryshore e rastësishme që varet nga konfigurimi i secilës makinë dhe devijimet e rastësishme që ndodhin gjatë procesit të prodhimit të pjesëve. Është e nevojshme të përcaktohet, bazuar në të dhënat e matjes së dimensioneve të pjesëve, nëse makinat janë të konfiguruara në të njëjtën mënyrë.

Shembulli 2

Gjatë prodhimit të një pajisje elektrike përdoren lloje të ndryshme letre izoluese: kondensator, elektrike etj. Pajisja mund të mbarshet me substanca të ndryshme: rrëshirë epoksi, llak, rrëshirë ML-2 etj. Rrjedhjet mund të eliminohen në vakum në presion i ngritur, me ngrohje. Impregnimi mund të bëhet me zhytje në llak, nën një rrymë të vazhdueshme llaku etj. Aparati elektrik në tërësi është i mbushur me një përbërje të caktuar, nga të cilat ka disa opsione. Treguesit e cilësisë janë forca elektrike e izolimit, temperatura e mbinxehjes së mbështjelljes në modalitetin e funksionimit dhe një sërë të tjerash. Gjatë zhvillimit të procesit teknologjik të prodhimit të pajisjeve, është e nevojshme të përcaktohet se si secili nga faktorët e listuar ndikon në performancën e pajisjes.

Shembulli 3

Depoja e trolejbusit shërben disa rrugë trolejbusi. Ata operojnë me trolejbusë të llojeve të ndryshme dhe 125 inspektorë mbledhin tarifat. Menaxhimi i depos është i interesuar në pyetjen: si të krahasohen treguesit ekonomikë të punës së secilit kontrollues (të ardhura) duke marrë parasysh rrugë të ndryshme dhe lloje të ndryshme të trolejbusëve? Si të përcaktohet fizibiliteti ekonomik i prodhimit të trolejbusëve të një lloji të caktuar në një rrugë të caktuar? Si të vendosen kërkesa të arsyeshme për shumën e të ardhurave që sjell një konduktor në çdo rrugë në lloje të ndryshme trolejbusësh?

Detyra e zgjedhjes së një metode është se si të merrni informacion maksimal në lidhje me ndikimin e secilit faktor në rezultatin përfundimtar, të përcaktoni karakteristikat numerike të një ndikimi të tillë, besueshmërinë e tyre me kosto minimale dhe në kohën më të shkurtër të mundshme. Metodat e analizës së variancës lejojnë zgjidhjen e problemeve të tilla.

Analiza e njëanshme

Qëllimi i studimit është të vlerësojë madhësinë e ndikimit të një rasti të veçantë në rishikimin e analizuar. Një qëllim tjetër i analizës së njëanshme mund të jetë krahasimi i dy ose më shumë rrethanave me njëra-tjetrën për të përcaktuar ndryshimin në ndikimin e tyre në kujtesë. Nëse hipoteza zero refuzohet, atëherë hapi tjetër është të përcaktojmë sasinë dhe të ndërtojmë intervale besimi për karakteristikat e marra. Në rastin kur hipoteza zero nuk mund të refuzohet, zakonisht pranohet dhe nxirret një përfundim për natyrën e ndikimit.

Analiza njëkahëshe e variancës mund të bëhet një analog joparametrik i metodës së renditjes Kruskal-Wallis. Ai u zhvillua nga matematikani amerikan William Kruskal dhe ekonomisti Wilson Wallis në vitin 1952. Ky kriter është krijuar për të testuar hipotezën zero të barazisë së efekteve në mostrat e studiuara me vlera mesatare të panjohura por të barabarta. Në këtë rast, numri i mostrave duhet të jetë më shumë se dy.

Kriteri Jonckheere-Terpstra u propozua në mënyrë të pavarur nga matematikani holandez T. J. Terpstra në 1952 dhe psikologu britanik E. R. Jonckheere në 1954. Përdoret kur dihet paraprakisht se grupet ekzistuese të rezultateve janë të renditura nga rritja e ndikimit të faktor në studim, i cili matet në një shkallë rendore.

M - Testi i Bartlett, i propozuar nga statisticieni britanik Maurice Stevenson Bartlett në vitin 1937, përdoret për të testuar hipotezën zero në lidhje me barazinë e variancave të disa popullatave normale nga të cilat janë marrë mostrat në studim, në përgjithësi që kanë madhësi të ndryshme (numri i secilës mostra duhet të jetë së paku katër).

G - Testi i Cochran, i cili u zbulua nga amerikani William Gemmell Cochran në vitin 1941. Përdoret për të testuar hipotezën zero rreth barazisë së variancave të popullatave normale në mostra të pavarura me madhësi të barabartë.

Testi joparametrik Levene, i propozuar nga matematikani amerikan Howard Levene në vitin 1960, është një alternativë ndaj testit Bartlett në kushtet kur nuk ka besim se mostrat në studim i nënshtrohen një shpërndarjeje normale.

Në vitin 1974, statisticienët amerikanë Morton B. Brown dhe Alan B. Forsythe propozuan një test (testi Brown-Forsyth) që është paksa i ndryshëm nga testi i Levene.

Analiza me dy faktorë

Analiza e dyanshme e variancës përdoret për mostrat e lidhura të shpërndara normalisht. Në praktikë, shpesh përdoren tabela komplekse të kësaj metode, veçanërisht ato në të cilat secila qelizë përmban një grup të dhënash (matjet e përsëritura) që korrespondojnë me vlerat e nivelit fiks. Nëse supozimet e kërkuara për të aplikuar analizën e dyanshme të variancës nuk plotësohen, atëherë përdorni testin joparametrik të renditjes së Friedmanit (Friedman, Kendall dhe Smith), i zhvilluar nga ekonomisti amerikan Milton Friedman në fund të vitit 1930. Ky test nuk varet nga lloji të shpërndarjes.

Supozohet vetëm se shpërndarja e vlerave është identike dhe e vazhdueshme, dhe se ato vetë janë të pavarura nga njëra-tjetra. Gjatë testimit të hipotezës zero, të dhënat dalëse paraqiten në formën e një matrice drejtkëndore, në të cilën rreshtat korrespondojnë me nivelet e faktorit B, dhe kolonat korrespondojnë me nivelet e A. Çdo qelizë e tabelës (bllokut) mund të jetë rezultati i matjeve të parametrave në një objekt ose në një grup objektesh me vlera konstante të niveleve të të dy faktorëve. Në këtë rast, të dhënat përkatëse paraqiten si vlera mesatare të një parametri të caktuar për të gjitha dimensionet ose objektet e kampionit në studim. Për të zbatuar kriterin e daljes, është e nevojshme të kaloni nga rezultatet e drejtpërdrejta të matjeve në renditjen e tyre. Renditja kryhet për secilën rresht veç e veç, domethënë, vlerat renditen për secilën vlerë fikse.

Testi i Page (L-test), i propozuar nga statisticieni amerikan E. B. Page në 1963, është krijuar për të testuar hipotezën zero. Për mostrat e mëdha, përdoret përafrimi i Page. Ata, duke iu nënshtruar realitetit të hipotezave zero përkatëse, i binden shpërndarjes normale standarde. Në rastin kur rreshtat e tabelës burimore kanë të njëjtat vlera, është e nevojshme të përdoren renditjet mesatare. Në këtë rast, saktësia e përfundimeve do të jetë më e keqe, aq më i madh është numri i ndeshjeve të tilla.

Q - Kriteri i Cochran, i propozuar nga W. Cochran në 1937. Përdoret në rastet kur grupe subjektesh homogjene janë të ekspozuara ndaj ndikimeve, numri i të cilave i kalon dy dhe për të cilat janë të mundshme dy opsione për reagime - kushtimisht negative (0) dhe me kusht pozitiv (1) . Hipoteza zero konsiston në barazinë e efekteve të trajtimit. Analiza e dyanshme e variancës bën të mundur përcaktimin e ekzistencës së efekteve të trajtimit, por nuk bën të mundur përcaktimin se për cilat kolona specifike ekziston ky efekt. Për të zgjidhur këtë problem, përdoret metoda e ekuacioneve të shumta Scheffe për mostrat e lidhura.

Analiza me shumë variante

Problemi i analizës multivariate të variancës lind kur ju duhet të përcaktoni efektin e dy ose më shumë kushteve në një ndryshore të caktuar të rastësishme. Studimi përfshin praninë e një variabli të rastësishëm të varur, të matur në një shkallë ndryshimi ose raporti, dhe disa ndryshoreve të pavarura, secila prej të cilave shprehet në një shkallë emërtimi ose renditjeje. Analiza e variancës së të dhënave është një seksion mjaft i zhvilluar i statistikave matematikore, i cili ka shumë opsione. Koncepti i kërkimit është i përbashkët si për një faktor ashtu edhe për shumëfaktor. Thelbi i saj qëndron në faktin se varianca totale ndahet në komponentë, që korrespondon me një grupim të caktuar të të dhënave. Çdo grupim i të dhënave ka modelin e vet. Këtu do të shqyrtojmë vetëm dispozitat themelore të nevojshme për kuptimin dhe përdorimin praktik të opsioneve më të përdorura të tij.

Analiza e variancës së faktorëve kërkon një qëndrim mjaft të kujdesshëm ndaj mbledhjes dhe paraqitjes së të dhënave hyrëse, dhe veçanërisht ndaj interpretimit të rezultateve. Ndryshe nga një test me një faktor, rezultatet e të cilit mund të vendosen me kusht në një sekuencë të caktuar, rezultatet e një testi me dy faktorë kërkojnë një prezantim më kompleks. Situata bëhet edhe më e ndërlikuar kur ka tre, katër ose më shumë rrethana. Për shkak të kësaj, është mjaft e rrallë të përfshihen më shumë se tre (katër) kushte në një model. Një shembull do të ishte shfaqja e rezonancës në një vlerë të caktuar të kapacitetit dhe induktivitetit të një rrethi elektrik; manifestimi i një reaksioni kimik me një grup të caktuar elementësh nga të cilët është ndërtuar sistemi; shfaqja e efekteve anormale në sisteme komplekse nën një rastësi të caktuar rrethanash. Prania e ndërveprimit mund të ndryshojë rrënjësisht modelin e sistemit dhe ndonjëherë të çojë në një rimendim të natyrës së fenomeneve me të cilat ka të bëjë eksperimentuesi.

Analiza shumëvariare e variancës me eksperimente të përsëritura

Të dhënat e matjes shpesh mund të grupohen jo nga dy, por nga një numër më i madh faktorësh. Kështu, nëse marrim parasysh analizën e dispersionit të jetëgjatësisë së gomave të rrotave të trolejbusit duke marrë parasysh rrethanat (fabrika e prodhimit dhe rruga në të cilën operohen gomat), atëherë mund të veçojmë si kusht të veçantë sezonin gjatë të cilit gomat operohen (përkatësisht: funksionimi i dimrit dhe i verës). Si rezultat, do të kemi një problem të metodës me tre faktorë.

Nëse ka më shumë kushte, qasja është e njëjtë si në analizën me dy faktorë. Në të gjitha rastet, ata përpiqen të thjeshtojnë modelin. Fenomeni i ndërveprimit të dy faktorëve nuk shfaqet aq shpesh, dhe ndërveprimi i trefishtë ndodh vetëm në raste të jashtëzakonshme. Përfshini ato ndërveprime për të cilat ka informacion të mëparshëm dhe arsye të mira për ta marrë atë parasysh në model. Procesi i identifikimit të faktorëve individualë dhe marrja në konsideratë e tyre është relativisht i thjeshtë. Prandaj, shpesh ekziston dëshira për të nxjerrë në pah më shumë rrethana. Ju nuk duhet të tërhiqeni me këtë. Sa më shumë kushte, aq më pak i besueshëm bëhet modeli dhe aq më e madhe është mundësia e gabimit. Vetë modeli, i cili përfshin një numër të madh variablash të pavarur, bëhet mjaft kompleks për t'u interpretuar dhe i papërshtatshëm për përdorim praktik.

Ideja e përgjithshme e analizës së variancës

Analiza e variancës në statistika është një metodë e marrjes së rezultateve të vëzhgimit në varësi të rrethanave të ndryshme operative njëkohësisht dhe vlerësimit të ndikimit të tyre. Një variabël i kontrolluar që korrespondon me metodën e ndikimit në objektin e studimit dhe fiton një vlerë të caktuar gjatë një periudhe të caktuar kohore quhet faktor. Ato mund të jenë cilësore dhe sasiore. Nivelet e kushteve sasiore marrin një kuptim të caktuar në një shkallë numerike. Shembuj janë temperatura, presioni i presionit, sasia e substancës. Faktorë cilësorë janë substanca të ndryshme, metoda të ndryshme teknologjike, pajisje, mbushës. Nivelet e tyre korrespondojnë me një shkallë emrash.

Cilësia mund të përfshijë gjithashtu llojin e materialit të paketimit dhe kushtet e ruajtjes së formës së dozimit. Është gjithashtu racionale të përfshihet shkalla e bluarjes së lëndëve të para, përbërja fraksionale e granulave, të cilat kanë rëndësi sasiore, por janë të vështira për t'u rregulluar nëse përdoret një shkallë sasiore. Numri i faktorëve cilësorë varet nga lloji i formës së dozimit, si dhe nga vetitë fizike dhe teknologjike të substancave medicinale. Për shembull, tabletat mund të merren nga substanca kristalore me ngjeshje të drejtpërdrejtë. Në këtë rast, mjafton të zgjidhni substanca rrëshqitëse dhe lubrifikuese.

Shembuj të faktorëve të cilësisë për lloje të ndryshme të formave të dozimit

  • Tinkturat. Përbërja ekstraktues, lloji i ekstraktuesit, mënyra e përgatitjes së lëndës së parë, mënyra e prodhimit, metoda e filtrimit.
  • Ekstrakte (të lëngshme, të trasha, të thata). Përbërja e ekstraktuesit, mënyra e nxjerrjes, lloji i instalimit, mënyra e largimit të substancave ekstraktues dhe çakëll.
  • Pilula. Përbërja e eksipientëve, mbushësve, shpërbërësve, lidhësve, lubrifikantëve dhe lubrifikantëve. Mënyra e marrjes së tabletave, lloji i pajisjeve teknologjike. Lloji i guaskës dhe përbërësve të saj, formuesit e filmit, pigmentet, ngjyrat, plastifikuesit, tretësit.
  • Solucionet e injektimit. Lloji i tretësit, metoda e filtrimit, natyra e stabilizuesve dhe konservantëve, kushtet e sterilizimit, mënyra e mbushjes së ampulave.
  • Supozitorët. Përbërja e bazës së supozitorëve, mënyra e prodhimit të supozitorëve, mbushësve, paketimit.
  • Pomadat. Përbërja e bazës, përbërësit strukturorë, mënyra e përgatitjes së pomadës, lloji i pajisjes, paketimi.
  • Kapsula. Lloji i materialit të guaskës, mënyra e prodhimit të kapsulave, lloji i plastifikuesit, ruajtës, ngjyrues.
  • Linimentet. Mënyra e përgatitjes, përbërja, lloji i pajisjes, lloji i emulgatorit.
  • Pezullimet. Lloji i tretësit, lloji i stabilizatorit, metoda e dispersionit.

Shembuj të faktorëve të cilësisë dhe niveleve të tyre të studiuara gjatë procesit të prodhimit të tabletave

  • Pluhur pjekje. Niseshte patate, argjilë e bardhë, një përzierje e bikarbonatit të natriumit me acid citrik, karbonatit bazë të magnezit.
  • Zgjidhje lidhëse. Ujë, paste niseshte, shurup sheqeri, tretësirë ​​metilcelulozë, tretësirë ​​hidroksipropilmetilcelulozë, tretësirë ​​polivinilpirrolidon, tretësirë ​​polivinil alkooli.
  • Substanca rrëshqitëse. Aerosil, niseshte, talk.
  • Mbushës. Sheqeri, glukoza, laktoza, klorur natriumi, fosfati i kalciumit.
  • Lubrifikant. Acidi stearik, polietilen glikol, parafinë.

Modelet e analizës së variancës në studimin e nivelit të konkurrencës shtetërore

Një nga kriteret më të rëndësishme për vlerësimin e gjendjes së një shteti, me të cilin vlerësohet niveli i mirëqenies dhe zhvillimit socio-ekonomik të tij, është konkurrueshmëria, domethënë një grup pronash të qenësishme në ekonominë kombëtare që përcaktojnë gjendjen e shtetit. aftësia për të konkurruar me vendet e tjera. Duke përcaktuar vendin dhe rolin e shtetit në tregun botëror, është e mundur të vendoset një strategji e qartë për sigurimin e sigurisë ekonomike në shkallë ndërkombëtare, sepse është çelësi i marrëdhënieve pozitive midis Rusisë dhe të gjithë lojtarëve në tregun botëror: investitorët. , kreditorët dhe qeveritë.

Për të krahasuar nivelin e konkurrencës së shteteve, vendet renditen duke përdorur indekse komplekse që përfshijnë tregues të ndryshëm të ponderuar. Këta indekse bazohen në faktorë kyç që ndikojnë në situatën ekonomike, politike etj. Një grup modelesh për studimin e konkurrencës së shtetit përfshin përdorimin e metodave të analizës statistikore me shumë variacione (në veçanti, analizën e variancës (statistikat), modelimin ekonometrik, marrjen e vendimeve) dhe përfshin fazat kryesore të mëposhtme:

  1. Formimi i një sistemi treguesish.
  2. Vlerësimi dhe parashikimi i treguesve të konkurrencës shtetërore.
  3. Krahasimi i treguesve të konkurrencës së shteteve.

Tani le të shohim përmbajtjen e modeleve të secilës prej fazave të këtij kompleksi.

Në fazën e parë duke përdorur metoda të studimit të ekspertëve, formohet një grup i mirë-bazuar treguesish ekonomikë për vlerësimin e konkurrencës së shtetit, duke marrë parasysh specifikat e zhvillimit të tij bazuar në vlerësimet ndërkombëtare dhe të dhënat nga departamentet statistikore, duke pasqyruar gjendjen e sistemit në tërësi. dhe proceset e tij. Zgjedhja e këtyre treguesve justifikohet nga nevoja për të zgjedhur ata që më plotësisht, nga pikëpamja praktike, na lejojnë të përcaktojmë nivelin e shtetit, atraktivitetin e tij të investimeve dhe mundësinë e lokalizimit relativ të kërcënimeve ekzistuese potenciale dhe aktuale.

Treguesit kryesorë të sistemeve ndërkombëtare të vlerësimit janë indekset:

  1. Konkurrueshmëria Globale (GC).
  2. Liria ekonomike (IES).
  3. Zhvillimi Njerëzor (HDI).
  4. Perceptimet e Korrupsionit (CPC).
  5. Kërcënimet e brendshme dhe të jashtme (IETH).
  6. Potenciali i Ndikimit Ndërkombëtar (IPIP).

Faza e dytë parashikon vlerësimin dhe parashikimin e treguesve të konkurrencës shtetërore sipas vlerësimeve ndërkombëtare për 139 vendet e botës që studiohen.

Faza e tretë parashikon një krahasim të kushteve të konkurrencës së shteteve duke përdorur metodat e analizës së korrelacionit dhe regresionit.

Duke përdorur rezultatet e studimit, është e mundur të përcaktohet natyra e proceseve në përgjithësi dhe për komponentët individualë të konkurrencës së shtetit; testoni hipotezën për ndikimin e faktorëve dhe marrëdhëniet e tyre në nivelin e duhur të rëndësisë.

Zbatimi i grupit të propozuar të modeleve do të lejojë jo vetëm të vlerësojë situatën aktuale të nivelit të konkurrencës dhe atraktivitetit të investimeve të shteteve, por edhe të analizojë mangësitë e menaxhimit, të parandalojë gabimet e vendimeve të gabuara dhe të parandalojë zhvillimin e një krize në shteti.

Analiza njëkahëshe e variancës.

Koncepti dhe modelet e analizës së variancës.

Tema 13. Analiza e variancës

Leksioni 1. Pyetje:

Analiza e variancës, si metodë kërkimore, u shfaq në punimet e R. Fischer (1918-1935) në lidhje me kërkimet në bujqësi për të identifikuar kushtet në të cilat varieteti i testuar i kulturës bujqësore prodhon rendimentin maksimal. Analiza e variancës u zhvillua më tej në veprat e Yeats. Analiza e variancës na lejon t'i përgjigjemi pyetjes nëse faktorë të caktuar kanë një ndikim të rëndësishëm në ndryshueshmërinë e një faktori, vlerat e të cilit mund të merren si rezultat i përvojës. Gjatë testimit të hipotezave statistikore, supozohen ndryshime të rastësishme në faktorët që studiohen. Në analizën e variancës, një ose më shumë faktorë ndryshohen në një mënyrë të caktuar dhe këto ndryshime mund të ndikojnë në rezultatet e vëzhgimeve. Studimi i një ndikimi të tillë është qëllimi i analizës së variancës.

Aktualisht, ka një përdorim gjithnjë e më të gjerë të analizës së variancës në ekonomi, sociologji, biologji, etj., veçanërisht pas ardhjes së softuerit që eliminoi problemet e rëndimit të llogaritjeve statistikore.

Në veprimtaritë praktike, në fusha të ndryshme të shkencës, shpesh përballemi me nevojën për të vlerësuar ndikimin e faktorëve të ndryshëm në tregues të caktuar. Shpesh këta faktorë janë të një natyre cilësore (për shembull, një faktor cilësor që ndikon në efektin ekonomik mund të jetë futja e një sistemi të ri të menaxhimit të prodhimit) dhe më pas analiza e variancës merr një vlerë të veçantë, pasi bëhet e vetmja metodë statistikore e hulumtimit që jep një një vlerësim.

Analiza e variancës bën të mundur përcaktimin nëse njëri ose tjetri nga faktorët në shqyrtim ka një ndikim të rëndësishëm në ndryshueshmërinë e një tipari, si dhe të përcaktojë sasinë e "peshës specifike" të secilit burim të ndryshueshmërisë në tërësinë e tyre. Por analiza e variancës na lejon të japim një përgjigje pozitive vetëm për praninë e një ndikimi domethënës, përndryshe pyetja mbetet e hapur dhe kërkon kërkime shtesë (më shpesh, një rritje në numrin e eksperimenteve).

Termat e mëposhtëm përdoren në analizën e variancës.

Faktori (X) është diçka që ne besojmë se duhet të ndikojë në rezultatin (atributin rezultativ) Y.

Niveli i faktorit (ose metoda e përpunimit, ndonjëherë fjalë për fjalë, për shembull - metoda e tokës) - vlerat (X, i = 1.2,...I) që mund të marrë faktori.

Përgjigja – vlera e karakteristikës së matur (vlera e rezultatit Y).

Teknika ANOVA ndryshon në varësi të numrit të faktorëve të pavarur që studiohen. Nëse faktorët që shkaktojnë ndryshueshmëri në vlerën mesatare të një karakteristike i përkasin një burimi, atëherë kemi një grupim të thjeshtë, ose analizë njëfaktori të variancës dhe më pas, në përputhje me rrethanat, një grupim të dyfishtë - analizë dyfaktorësh të variancës, me tre faktorë. analiza e variancës, ..., m-faktori. Faktorët në analizën multivariate zakonisht shënohen me shkronja latine: A, B, C, etj.



Detyra e analizës së variancës është të studiojë ndikimin e faktorëve të caktuar (ose niveleve të faktorëve) në ndryshueshmërinë e vlerave mesatare të variablave të rastit të vëzhguar.

Thelbi i analizës së variancës. Analiza e variancës konsiston në izolimin dhe vlerësimin e faktorëve individualë që shkaktojnë ndryshueshmëri. Për këtë qëllim, varianca totale e popullsisë së pjesshme të vëzhguar (varianca totale e tiparit), e shkaktuar nga të gjitha burimet e ndryshueshmërisë, zbërthehet në komponentë të variancës të krijuar nga faktorë të pavarur. Secili prej këtyre komponentëve ofron një vlerësim të variancës , ,..., të shkaktuar nga një burim i veçantë ndryshueshmërie, në popullatën e përgjithshme. Për të testuar rëndësinë e këtyre vlerësimeve të variancës së komponentëve, ato krahasohen me variancën totale në popullatë (testi i Fisher-it).

Për shembull, në analizën me dy faktorë marrim një zbërthim të formës:

Varianca totale e tiparit të studiuar C;

Pjesa e variancës e shkaktuar nga ndikimi i faktorit A;

Pjesa e variancës e shkaktuar nga ndikimi i faktorit B;

Përqindja e variancës e shkaktuar nga ndërveprimi i faktorëve A dhe B;

Pjesa e variancës e shkaktuar nga shkaqe të rastësishme të pa llogaritura (variancë e rastësishme);

Në analizën e variancës merret në konsideratë hipoteza: H 0 - asnjë nga faktorët në shqyrtim nuk ka ndikim në ndryshueshmërinë e tiparit. Rëndësia e çdo vlerësimi të variancës kontrollohet nga vlera e raportit të tij me vlerësimin e variancës së rastësishme dhe krahasohet me vlerën kritike përkatëse, në nivelin e rëndësisë a, duke përdorur tabelat e vlerave kritike të shpërndarjes Fisher-Snedecor F (Shtojca 4) . Hipoteza H 0 në lidhje me një ose një tjetër burim të ndryshueshmërisë refuzohet nëse llogaritet F. > F kr. (për shembull, për faktorin B: S B 2 /S ε 2 >F kr.).

Analiza e variancës merr në konsideratë eksperimentet e 3 llojeve:

a) eksperimente në të cilat të gjithë faktorët kanë nivele sistematike (fikse);

b) eksperimente në të cilat të gjithë faktorët kanë nivele të rastësishme;

c) eksperimente në të cilat ka faktorë që kanë nivele të rastësishme, si dhe faktorë që kanë nivele fikse.

Rastet a), b), c) korrespondojnë me tre modele që merren parasysh në analizën e variancës.

Të dhënat hyrëse për analizën e variancës zakonisht paraqiten në formën e tabelës së mëposhtme:

Numri i vëzhgimit j Nivelet e faktorëve
A 1 A 2 Një r
X 11 X 21 X p1
X 12 X 22 Xp2
X 13 X 23 X p3
. . .
. . .
. . .
n X 1n X2n Xpn
REZULTATET

Konsideroni një faktor të vetëm që merr p nivele të ndryshme dhe supozoni se në çdo nivel bëhen n vëzhgime, duke dhënë N=np vëzhgime. (Ne do të kufizohemi në marrjen në konsideratë të modelit të parë të analizës së variancës - të gjithë faktorët kanë nivele fikse.)

Rezultatet le të paraqiten në formën X ij (i=1,2…,р; j=1,2,…,n).

Supozohet se për çdo nivel prej n vëzhgimesh ka një mesatare, e cila është e barabartë me shumën e mesatares së përgjithshme dhe ndryshimin e saj për shkak të nivelit të zgjedhur:

ku m është mesatarja e përgjithshme;

A i - efekti i shkaktuar nga niveli i – m i faktorit;

e ij – ndryshimi i rezultateve brenda një niveli faktor individual. Termi e ij merr parasysh të gjithë faktorët e pakontrollueshëm.

Lërini vëzhgimet në një nivel faktori fiks të shpërndahen normalisht rreth mesatares m + A i me një variancë të përbashkët s 2 .

Pastaj (pika në vend të indeksit tregon mesataren e vëzhgimeve përkatëse mbi këtë indeks):

A.X ij – X.. = (X i . – X..) + (X ij – X i .). (12.3)

Pasi të kemi në katror të dy anët e ekuacionit dhe të mbledhim mbi i dhe j, marrim:

që, por

Përndryshe, shuma e katrorëve mund të shkruhet: S = S 1 + S 2. Vlera e S 1 llogaritet nga devijimet e mesatareve p nga mesatarja e përgjithshme X.., prandaj S 1 ka (p-1) shkallë lirie. Vlera e S 2 llogaritet nga devijimet e N vëzhgimeve nga p mesataret e mostrës dhe, për rrjedhojë, ka N-р = np - p=p(n-1) shkallë lirie. S ka (N-1) shkallë lirie. Bazuar në rezultatet e llogaritjes, ndërtohet një tabelë e analizës së variancës.

Tabela ANOVA

Nëse hipoteza se ndikimi i të gjitha niveleve është i barabartë është i vërtetë, atëherë si M 1 ashtu edhe M 2 (katroret mesatare) do të jenë vlerësime të paanshme të s 2. Kjo do të thotë se hipoteza mund të testohet duke llogaritur raportin (M 1 / M 2) dhe duke e krahasuar atë me F cr. me ν 1 = (p-1) dhe ν 2 = (N-p) shkallë lirie.

Nëse llogaritet F > F kr. , atëherë hipoteza për ndikimin e parëndësishëm të faktorit A në rezultatin e vëzhgimeve nuk pranohet.

Për të vlerësuar rëndësinë e dallimeve në F kalc. Tabela F llogarit:

a) gabim eksperimental

b) gabimi i diferencës së mjeteve

c) dallimi më i vogël domethënës

Duke krahasuar ndryshimin në vlerat mesatare për opsionet me NSR, ata konkludojnë se ndryshimet në nivelin e mesatareve janë të rëndësishme.

Koment. Përdorimi i analizës së variancës supozon se:

2) D(ε ij)=σ 2 = konst,

3) ε ij → N (0, σ) ose x ij → N (a, σ).

Statiscient analitik

7.1 Analiza e variancës. 2

Në këtë version të metodës, mostra të ndryshme lëndësh janë të ekspozuara ndaj ndikimit të secilit prej gradimeve. Duhet të ketë të paktën shkallëzime të faktorit tre.

Shembulli 1. Tre grupeve të ndryshme me gjashtë lëndë iu dhanë lista me dhjetë fjalë. Fjalët iu prezantuan grupit të parë me një shpejtësi të ulët - 1 fjalë për 5 sekonda, grupit të dytë me një shpejtësi mesatare - 1 fjalë për 2 sekonda, dhe grupit të tretë me një shpejtësi të lartë - 1 fjalë në sekondë. Performanca e riprodhimit ishte parashikuar të varej nga shpejtësia e prezantimit të fjalëve. Rezultatet janë paraqitur në tabelë. 1.

Tabela 1. Numri i fjalëve të riprodhuara (nga J. Greene, M D "Olivera, 1989, f. 99)

Subjekti Nr.

Grupi 1 me shpejtësi të ulët

Grupi 2 me shpejtësi mesatare

Grupi 3 me shpejtësi të lartë

shumat

mesatare

7,17

6,17

4,00

Shuma totale

Analiza e njëanshme e variancës ju lejon të testoni hipotezat:

H 0 : dallimet në vëllimin e prodhimit të fjalëve ndërmjet grupet nuk janë më të theksuara se dallimet e rastësishme brendaçdo grup

H 1 : Dallimet në vëllimin e prodhimit të fjalëve ndërmjet grupet janë më të theksuara se dallimet e rastësishme brendaçdo grup.

Sekuenca e operacioneve në analizën e njëanshme të variancës për mostrat e palidhura:

1. le të numërojmë Fakti SS- ndryshueshmëria e tiparit për shkak të veprimit të faktorit në studim. Emërtimi i përbashkët SS - shkurtesa për "shuma e katrorëve" ( shuma e katrorëve ). Ky shkurtim përdoret më shpesh në burime të përkthyera (shih, për shembull: Glass J., Stanley J., 1976).

,(1)

ku T c është shuma e vlerave individuale për çdo kusht. Për shembullin tonë, 43, 37, 24 (shih Tabelën 1);

с – numri i kushteve (gradacioneve) të faktorit (=3);

n – numri i lëndëve në secilin grup (=6);

N – numri total i vlerave individuale (=18);

Sheshi i shumës totale të vlerave individuale (=104 2 =10816)

Vini re ndryshimin midis , në të cilin të gjitha vlerat individuale fillimisht janë në katror dhe më pas përmblidhen, dhe , ku vlerat individuale së pari mblidhen për të marrë një shumë totale, dhe më pas kjo shumë është në katror.

Duke përdorur formulën (1), pasi kemi llogaritur ndryshueshmërinë aktuale të tiparit, marrim:

2. le të numërojmë Gjenerali SS– ndryshueshmëria e përgjithshme e tiparit:


(2)

3. njehsoni vlerën e rastësishme (të mbetur).SS sl, shkaktuar nga faktorë të pa llogaritur:

(3)

4.numri i shkallëve të lirisë barazohet me:

=3-1=2(4)

5."katrori i mesëm" ose vlera mesatare e shumave përkatëse të katrorëve SS është e barabartë me:

(5)

6.kuptim statistikat e kritereve F em llogaritni duke përdorur formulën:

(6)

Për shembullin tonë kemi : F em =15,72/2,11=7,45

7.përcaktoni F crit sipas tabelave statistikore Aplikimet 3 për df 1 =k 1 =2 dhe df 2 =k 2 =15 vlera e tabelës së statistikave është 3,68

8. nëse F em< F kritike, atëherë pranohet hipoteza zero, përndryshe pranohet hipoteza alternative. Për shembullin tonë F em> F crit (7.45>3.68), pra p

konkluzioni:dallimet në rikujtimin e fjalëve ndërmjet grupeve janë më të theksuara sesa dallimet e rastësishme brenda secilit grup (f<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.

7.1.2 Analiza e variancës për mostrat përkatëse

Metoda e analizës së variancës për mostrat përkatëse përdoret në rastet kur ndikimi i shkallëzimeve të ndryshme të një faktori ose kushteve të ndryshme në i njëjti mostër lëndësh. Duhet të ketë të paktën shkallëzime të faktorit tre.

Në këtë rast, dallimet ndërmjet subjekteve janë një burim i mundshëm i pavarur dallimesh. ANOVA njëkahëshe për mostrat përkatësedo të na lejojë të përcaktojmë se çfarë peshon më shumë - tendenca e shprehur nga kurba e ndryshimit të faktorëve, apo dallimet individuale midis subjekteve. Faktori i dallimeve individuale mund të jetë më i rëndësishëm se faktori i ndryshimeve në kushtet eksperimentale.

Shembulli 2.Një grup prej 5 lëndësh u ekzaminua duke përdorur tre detyra eksperimentale që synonin studimin e këmbënguljes intelektuale (Sidorenko E.V., 1984). Secila lëndë paraqitej individualisht me tre anagrame identike me radhë: një me katër shkronja, një pesë shkronja dhe një me gjashtë shkronja. A është e mundur të supozohet se faktori i gjatësisë së një anagrami ndikon në kohëzgjatjen e përpjekjeve për ta zgjidhur atë?

Tabela 2. Kohëzgjatja e zgjidhjes së anagrameve (sek)

Kodi i lëndës

Kushti 1. anagram me katër shkronja

Kushti 2. Anagrami me pesë shkronja

Kushti 3. anagram me gjashtë shkronja

Shumat sipas lëndëve

shumat

1244

1342

Le të formulojmë hipoteza. Në këtë rast ekzistojnë dy grupe hipotezash.

Seti A.

H 0 (A): Dallimet në kohëzgjatjen e përpjekjeve për të zgjidhur anagrame me gjatësi të ndryshme nuk janë më të theksuara sesa dallimet për arsye të rastësishme.

H 1 (A): Dallimet në kohëzgjatjen e përpjekjeve për të zgjidhur anagrame me gjatësi të ndryshme janë më të theksuara sesa ndryshimet për arsye të rastësishme.

Seti B.

N rreth (B): Dallimet individuale midis subjekteve nuk janë më të theksuara sesa dallimet për shkaqe të rastësishme.

H 1 (B): Dallimet individuale midis subjekteve janë më të theksuara se dallimet për arsye të rastësishme.

Sekuenca e operacioneve në analizën e variancës në një drejtim për mostrat përkatëse:

1. le të numërojmë Fakti SS- ndryshueshmëria e tiparit për shkak të veprimit të faktorit në studim sipas formulës (1).

ku T c është shuma e vlerave individuale për secilën prej kushteve (kolonave). Për shembullin tonë, 51, 1244, 47 (shih Tabelën 2); с – numri i kushteve (gradacioneve) të faktorit (=3); n – numri i lëndëve në secilin grup (=5); N – numri total i vlerave individuale (=15); - katrori i shumës totale të vlerave individuale (=1342 2)

2. le të numërojmë SS isp- ndryshueshmëria e shenjës për shkak të vlerave individuale të subjekteve.

Ku T dhe është shuma e vlerave individuale për secilën lëndë. Për shembullin tonë, 247, 631, 100, 181, 183 (shih Tabelën 2); с – numri i kushteve (gradacioneve) të faktorit (=3); N – numri total i vlerave individuale (=15);

3. le të numërojmë Gjenerali SS– ndryshueshmëria e përgjithshme e tiparit sipas formulës (2):


4. njehsoni vlerën e rastësishme (të mbetur).SS sl, shkaktuar nga faktorë të pa llogaritur sipas formulës (3):

5. numri i shkallëve të lirisëështë e barabartë me (4):

; ; ;

6. "katrori i mesëm" ose pritshmëria matematikore e shumës së katrorëve, vlera mesatare e shumave përkatëse të katrorëve SS është e barabartë me (5):

;

7. kriter vlera statistikore F em llogaritni duke përdorur formulën (6):

;

8. Le të përcaktojmë F krit nga tabelat statistikore të Shtojcës 3 për df 1 =k 1 =2 dhe df 2 =k 2 =8 vlerën e tabelës së statistikave F crit_fact =4.46, dhe për df 3 =k 3 =4 dhe df 2 =k 2 = 8 F crit_exp =3,84

9. F em_fakt> F kritik_fakt (6.872>4.46), prandaj p pranohet një hipotezë alternative.

10. F em_përdorim < F крит_исп (1,054<3,84), следовательно пHipoteza zero pranohet.

konkluzioni:dallimet në vëllimin e riprodhimit të fjalëve në kushte të ndryshme janë më të theksuara sesa ndryshimet për arsye të rastësishme (p<0,05).Индивидуальные различия между испытуе­мыми являются не более выраженными, чем различия, обусловленные случайными причинами.

7.2 Analiza e korrelacionit

7.2.1 Koncepti i korrelacionit

Një studiues shpesh është i interesuar se si dy ose më shumë variabla lidhen me njëri-tjetrin në një ose më shumë mostra që studiohen. Për shembull, a mundet nxënësit me nivele të larta ankthi të demonstrojnë arritje të qëndrueshme akademike, apo gjatësia e kohës që punon një mësues në një shkollë lidhet me madhësinë e pagës së tij, apo çfarë lidhet më shumë me nivelin e zhvillimit mendor të nxënësve - performanca në matematikë apo letërsi etj.?

Kjo lloj varësie midis variablave quhet korrelacion, ose korrelacion. Korrelacioni lidhje- ky është një ndryshim i koordinuar në dy karakteristika, duke reflektuar faktin se ndryshueshmëria e njërës karakteristikë është në përputhje me ndryshueshmërinë e tjetrës.

Dihet, për shembull, se mesatarisht ekziston një lidhje pozitive midis gjatësisë së njerëzve dhe peshës së tyre, dhe e tillë që sa më e madhe të jetë gjatësia, aq më e madhe është pesha e personit. Megjithatë, ka përjashtime nga ky rregull, kur njerëzit relativisht të shkurtër janë mbipeshë, dhe, anasjelltas, njerëzit asthenikë me shtat të lartë kanë peshë të ulët. Arsyeja për përjashtime të tilla është se çdo shenjë biologjike, fiziologjike ose psikologjike përcaktohet nga ndikimi i shumë faktorëve: mjedisor, gjenetik, social, mjedisor etj.

Lidhjet e korrelacionit janë ndryshime probabiliste që mund të studiohen vetëm në mostrat përfaqësuese duke përdorur metodat e statistikave matematikore. "Të dy termat," shkruan E.V. Sidorenko, - lidhje korrelacioni dhe varësia e korrelacionit- përdoren shpesh si sinonime. Varësia nënkupton ndikim, lidhje - çdo ndryshim i koordinuar që mund të shpjegohet me qindra arsye. Lidhjet e korrelacionit nuk mund të konsiderohen si dëshmi e një marrëdhënieje shkak-pasojë; ato tregojnë vetëm se ndryshimet në një karakteristikë zakonisht shoqërohen me ndryshime të caktuara në një tjetër.

varësia e korrelacionit - Këto janë ndryshime që futin vlerat e një karakteristike në probabilitetin e shfaqjes së vlerave të ndryshme të një karakteristike tjetër (E.V. Sidorenko, 2000).

Detyra e analizës së korrelacionit zbret në përcaktimin e drejtimit (pozitiv ose negativ) dhe formës (lineare, jolineare) të marrëdhënies midis karakteristikave të ndryshme, matjen e afërsisë së saj dhe, së fundi, kontrollimin e nivelit të rëndësisë së koeficientëve të korrelacionit të marrë.

Korrelacionet ndryshojnë në formë, drejtim dhe shkallë (fortësi).

Sipas formësmarrëdhënia e korrelacionit mund të jetë lineare ose lakuar. Për shembull, marrëdhënia midis numrit të seancave të trajnimit në simulator dhe numrit të problemeve të zgjidhura saktë në seancën e kontrollit mund të jetë e drejtpërdrejtë. Për shembull, marrëdhënia midis nivelit të motivimit dhe efektivitetit të një detyre mund të jetë lakor (shih Fig. 1). Me rritjen e motivimit, fillimisht rritet efektiviteti i kryerjes së një detyre, pastaj arrihet niveli optimal i motivimit, i cili korrespondon me efektivitetin maksimal të përfundimit të detyrës; Një rritje e mëtejshme e motivimit shoqërohet me një ulje të efikasitetit.

Fig.1. Marrëdhënia midis efektivitetit të zgjidhjes së një problemi

dhe forca e tendencës motivuese (sipas J. W. A t k in son, 1974, f. 200)

drejtkorrelacioni mund të jetë pozitiv (“i drejtpërdrejtë”) dhe negativ (“i anasjelltë”). Me një korrelacion linear pozitiv, vlerat më të larta të një karakteristike korrespondojnë me vlerat më të larta të një tjetër dhe vlerat më të ulëta të një karakteristike korrespondojnë me vlerat e ulëta të një tjetër. Me një korrelacion negativ, marrëdhëniet janë të kundërta. Me një korrelacion pozitiv, koeficienti i korrelacionit ka një shenjë pozitive, për shembullr =+0,207, me një korrelacion negativ - një shenjë negative, për shembullr = -0,207.

Shkalla, forca ose ngushtësia lidhja e korrelacionit përcaktohet nga vlera e koeficientit të korrelacionit.

Forca e lidhjes nuk varet nga drejtimi i saj dhe përcaktohet nga vlera absolute e koeficientit të korrelacionit.

Vlera maksimale e mundshme absolute e koeficientit të korrelacionitr = 1.00; minimale r =0.00.

Klasifikimi i përgjithshëm i korrelacioneve (sipas Ivanter E.V., Korosov A.V., 1992):

të fortë, ose ngushtë me koeficient korrelacionir >0.70;

mesatare0,50< r<0,69 ;

i moderuar0,30< r<0,49 ;

i dobët0,20< r<0,29 ;

shumë i dobëtr<0,19 .

Variablat X dhe Y mund të maten në shkallë të ndryshme, kjo është ajo që përcakton zgjedhjen e koeficientit të duhur të korrelacionit (shih Tabelën 3):

Tabela 3. Përdorimi i koeficientit të korrelacionit në varësi të llojit të variablave

Lloji i shkallës

Masa e lidhjes

Variabli X

Variabli Y

Interval ose marrëdhënie

Interval ose marrëdhënie

Koeficienti Pearson

Renditja, intervali ose raporti

Koeficienti Spearman

Renditur

Renditur

Koeficienti Kendall

Dikotomike

Dikotomike

Koeficienti "j"

Dikotomike

Renditur

Rank-biserial

Dikotomike

Interval ose marrëdhënie

Biserial

7.2.2 Koeficienti i korrelacionit Pearson

Termi "korrelacion" u fut në shkencë nga natyralisti i shquar anglez Francis Galton në 1886. Megjithatë, formula e saktë për llogaritjen e koeficientit të korrelacionit u zhvillua nga studenti i tij Karl Pearson.

Koeficienti karakterizon praninë e vetëm një lidhjeje lineare midis karakteristikave, zakonisht të shënuara me simbolet X dhe Y. Formula për llogaritjen e koeficientit të korrelacionit është ndërtuar në atë mënyrë që nëse marrëdhënia ndërmjet karakteristikave është lineare, koeficienti Pearson përcakton saktë afërsia e kësaj marrëdhënieje. Prandaj, quhet edhe koeficienti i korrelacionit linear Pearson. Nëse lidhja ndërmjet ndryshoreve X dhe Y nuk është lineare, atëherë Pearson propozoi të ashtuquajturën lidhje korrelacioni për të vlerësuar afërsinë e kësaj lidhjeje.

Vlera e koeficientit linear të korrelacionit Pearson nuk mund të kalojë +1 dhe të jetë më e vogël se -1. Këta dy numra +1 dhe -1 janë kufijtë për koeficientin e korrelacionit. Kur llogaritja rezulton në një vlerë më të madhe se +1 ose më pak se -1, atëherë ka ndodhur një gabim në llogaritjet.

Shenja e koeficientit të korrelacionit është shumë e rëndësishme për interpretimin e marrëdhënies që rezulton. Le të theksojmë edhe një herë se nëse shenja e koeficientit të korrelacionit linear është plus, atëherë marrëdhënia midis veçorive të korreluara është e tillë që një vlerë më e madhe e një tipari (variabli) korrespondon me një vlerë më të madhe të një tipari tjetër (një variabël tjetër). Me fjalë të tjera, nëse një tregues (ndryshues) rritet, atëherë treguesi tjetër (ndryshorja) rritet në përputhje me rrethanat. Kjo varësi quhet varësi proporcionale.

Nëse merret një shenjë minus, atëherë një vlerë më e madhe e një karakteristike korrespondon me një vlerë më të vogël të një tjetre. Me fjalë të tjera, nëse ka një shenjë minus, një rritje në një ndryshore (shenjë, vlerë) korrespondon me një rënie në një variabël tjetër. Kjo varësi quhet varësi e kundërt proporcionale.

Në përgjithësi, formula për llogaritjen e koeficientit të korrelacionit është:

(7)

Ku X i- vlerat e marra në mostrën X,

y i- vlerat e pranuara në mostrën Y;

Mesatarja për X, - mesatare për Y.

Llogaritja e koeficientit të korrelacionit Pearson supozon se variablat X dhe Y janë të shpërndarë Mirë.

Formula (7) përmban sasinë kur ndahet me n (numri i vlerave të ndryshores X ose Y) quhet kovarianca. Formula (7) gjithashtu supozon se kur llogariten koeficientët e korrelacionit, numri i vlerave të ndryshores X është i barabartë me numrin e vlerave të ndryshores Y.

Numri i shkallëve të lirisë k = n -2.

Shembulli 3. 10 nxënës u testuan për të menduarit vizual-figurativ dhe verbal. Koha mesatare për zgjidhjen e detyrave të testit është matur në sekonda. Studiuesit i intereson pyetja: a ka një lidhje mes kohës që duhet për të zgjidhur këto probleme? Variabli X tregon kohën mesatare për zgjidhjen e detyrave vizuale-figurative, dhe ndryshorja Y tregon kohën mesatare për zgjidhjen e detyrave të testit verbal.

Zgjidhje. Le t'i paraqesim të dhënat fillestare në formën e tabelës 4, e cila përmban kolona shtesë të nevojshme për llogaritjen duke përdorur formulën (7).

Tabela 4

Nr. i lëndëve

x

x i -

(x i - ) 2

y une -

(y i -) 2

16,7

278,89

51,84

120,24

13,69

17,2

295,84

63,64

7,29

51,84

19,44

68,89

14,44

31,54

59,29

7,84

21,56

0,49

46,24

4,76

10,89

17,64

13,86

10,89

51,84

23,76

68,89

10,8

116,64

89,64

68,89

18,8

353,44

156,04

Shuma

357

242

588,1

1007,6

416,6

Mesatare

35,7

24,2

Ne llogarisim vlerën empirike të koeficientit të korrelacionit duke përdorur formulën (7):

Ne përcaktojmë vlerat kritike për koeficientin e korrelacionit të marrë sipas tabelës në Shtojcën 3. Kur gjejmë vlerat kritike për koeficientin e llogaritur të korrelacionit linear Pearson, numri i shkallëve të lirisë llogaritet si k = n – 2 = 8.

k crit = 0,72 > 0,54, prandaj hipoteza H 1 refuzohet dhe hipoteza pranohet H 0 , me fjalë të tjera, nuk është vërtetuar lidhja ndërmjet kohës së zgjidhjes së detyrave të testit pamor-figurativ dhe verbal.

7.3 Analiza e regresionit

Ky është një grup metodash që synojnë identifikimin dhe shprehjen matematikore të atyre ndryshimeve dhe varësive që ndodhin në një sistem variablash të rastësishëm. Nëse një sistem i tillë modelon një sistem pedagogjik, atëherë, për rrjedhojë, përmes analizës së regresionit identifikohen dhe shprehen matematikisht dukuritë psikologjike e pedagogjike dhe varësitë ndërmjet tyre. Karakteristikat e këtyre dukurive maten në shkallë të ndryshme, gjë që vendos kufizime në mënyrat e shprehjes matematikore të ndryshimeve dhe varësive që studiohen nga mësuesi studiues.

Metodat e analizës së regresionit janë krijuar kryesisht për rastin e një shpërndarjeje normale të qëndrueshme, në të cilën ndryshimet nga prova në provë shfaqen vetëm në formën e provave të pavarura.

Janë identifikuar probleme të ndryshme formale të analizës së regresionit. Ato mund të jenë të thjeshta ose komplekse për sa i përket formulimit, mjeteve matematikore dhe intensitetit të punës. Le të rendisim dhe shqyrtojmë me shembuj ato që duken si kryesoret.

Detyra e parë është identifikoni faktin e ndryshueshmërisë fenomeni që studiohet në kushte të caktuara, por jo gjithmonë të fiksuara qartë. Në leksionin e mëparshëm, ne tashmë e zgjidhëm këtë problem duke përdorur kritere parametrike dhe joparametrike.

Detyra e dytë - identifikoni një prirje si një ndryshim periodik në një karakteristikë. Vetë kjo veçori mund ose nuk mund të jetë e varur nga ndryshorja e gjendjes (mund të varet nga kushte të panjohura ose të pakontrollueshme nga studiuesi). Por kjo nuk është e rëndësishme për detyrën në shqyrtim, e cila kufizohet vetëm në identifikimin e trendit dhe veçorive të tij.

Testimi i hipotezave për mungesën ose praninë e një tendence mund të kryhet duke përdorur kriterin Abbe . Kriteri Abbe projektuar për të testuar hipotezat në lidhje me barazinë e vlerave mesatare të vendosura për 4

Vlera empirike e kriterit Abbe llogaritet me formulën:

(8)

ku është mesatarja aritmetike e kampionit;

P- numri i vlerave në mostër.

Sipas kriterit, hipoteza e barazisë së mjeteve hidhet poshtë (pranohet hipoteza alternative) nëse vlera e statistikës është . Vlera tabelare (kritike) e statistikave përcaktohet nga tabela për kriterin q të Abbe, i cili, me shkurtesa, është huazuar nga libri i L.N. Bolysheva dhe N.V. Smirnova (shih Shtojcën 3).

Sasi të tilla për të cilat zbatohet kriteri Abbe mund të jenë përqindjet ose përqindjet e mostrës, mesataret aritmetike dhe statistika të tjera të shpërndarjeve të mostrës nëse ato janë afër normales (ose të normalizuara më parë). Prandaj, kriteri Abbe mund të gjejë zbatim të gjerë në kërkimin psikologjik dhe pedagogjik. Le të shqyrtojmë një shembull të identifikimit të një tendence duke përdorur kriterin Abbe.

Shembulli 4.Në tabelë 5 tregon dinamikën e përqindjes së nxënësve IV kursi, i cili ka dhënë provime në sesionet dimërore me “ekselencë” gjatë 10 viteve të punës në një nga fakultetet universitare.Duhet të përcaktohet nëse ka tendencë për të rritur performancën akademike.

Tabela 5. Dinamika e përqindjes së studentëve ekselentë të vitit të katërt mbi 10 vjet punë të fakultetit

Vit akademik

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

Si i pavlefshëm Ne testojmë hipotezën për mungesën e një tendence, pra për barazinë e përqindjeve.

Mesatojmë përqindjet e dhëna në tabelë. 5, gjejmë se =21.5. Ne llogarisim ndryshimet midis vlerave të mëvonshme dhe atyre të mëparshme në mostër, i vendosim në katror dhe i përmbledhim:

Në mënyrë të ngjashme llogarit emëruesin në formulën (8), duke mbledhur katrorët e diferencave midis secilës matje dhe mesatares aritmetike:

Tani duke përdorur formulën (8) marrim:

Në tabelën e kriterit Abbe nga Shtojca 3, gjejmë se me n = 10 dhe një nivel rëndësie 0,05, vlera kritike është më e madhe se 0,41 që kemi marrë, prandaj hipoteza për barazinë e përqindjes së "studentëve të shkëlqyer" duhet të jetë refuzohet dhe ne mund të pranojmë hipotezën alternative për praninë e një tendence .

Detyra e tretë është identifikimi i një modeli të shprehur në formën e një ekuacioni korrelacioni (regresioni).

Shembulli 5.Studiuesi estonez J. Mikk, duke studiuar vështirësitë e të kuptuarit të tekstit, krijoi një "formulë të lexueshmërisë", e cila është një regresion linear i shumëfishtë:

Vlerësimi i vështirësisë së të kuptuarit të tekstit,

ku x 1 është gjatësia e fjalive të pavarura në numrin e karaktereve të shtypura,

x 2 - përqindja e fjalëve të ndryshme të panjohura,

x 3 - abstraktiteti i koncepteve të përsëritura të shprehura me emra .

Duke krahasuar koeficientët e regresionit që shprehin shkallën e ndikimit të faktorëve, mund të shihet se vështirësia e të kuptuarit të një teksti përcaktohet kryesisht nga abstraktiteti i tij. Vështirësia e të kuptuarit të tekstit varet përgjysmë (0,27) nga numri i fjalëve të panjohura dhe praktikisht nuk varet fare nga gjatësia e fjalisë.