Varyans analizi. Çok değişkenli varyans analizi Varyans bileşenlerinin ANOVA modeli

Varyans analizi

1. Varyans analizi kavramı

Varyans analizi Herhangi bir kontrollü değişken faktörün etkisi altında bir özelliğin değişkenliğinin analizidir. Yabancı literatürde varyans analizi sıklıkla ANOVA olarak anılır ve bu, değişkenlik analizi (Varyans Analizi) olarak tercüme edilir.

ANOVA sorunu bir özelliğin genel değişkenliğinden farklı türdeki değişkenliğin izole edilmesinden oluşur:

a) incelenen bağımsız değişkenlerin her birinin etkisinden kaynaklanan değişkenlik;

b) incelenen bağımsız değişkenlerin etkileşiminden kaynaklanan değişkenlik;

c) diğer tüm bilinmeyen değişkenlerden kaynaklanan rastgele değişkenlik.

İncelenen değişkenlerin etkisinden ve bunların etkileşiminden kaynaklanan değişkenlik, rastgele değişkenlik ile ilişkilidir. Bu ilişkinin bir göstergesi Fisher'in F testidir.

F kriterini hesaplama formülü, varyans tahminlerini, yani özelliğin dağılım parametrelerini içerir, dolayısıyla F kriteri parametrik bir kriterdir.

Bir özelliğin değişkenliği, incelenen değişkenlerden (faktörlerden) veya bunların etkileşiminden ne kadar fazla kaynaklanıyorsa, o kadar yüksek olur. ampirik kriter değerleri.

Sıfır varyans analizindeki hipotez, çalışılan etkili özelliğin ortalama değerlerinin tüm derecelendirmelerde aynı olduğunu belirtecektir.

Alternatif hipotez, incelenen faktörün farklı derecelerinde ortaya çıkan özelliğin ortalama değerlerinin farklı olduğunu belirtecektir.

Varyans analizi, bir özellikteki değişikliği belirtmemize izin verir, ancak bunu belirtmez. yön bu değişiklikler.

Varyans analizine ilişkin değerlendirmemize yalnızca değişkenin eylemini incelediğimizde en basit durumla başlayalım. bir değişken (bir faktör).

2. İlgisiz örnekler için tek yönlü varyans analizi

2.1. Yöntemin amacı

Tek faktörlü varyans analizi yöntemi, etkili bir özellikteki değişikliklerin, bir faktörün değişen koşullarının veya derecelerinin etkisi altında incelendiği durumlarda kullanılır. Yöntemin bu versiyonunda, faktörün derecelendirilmesinin her birinin etkisi şu şekildedir: farklı konu örnekleri. Faktörün en az üç derecelendirmesi olmalıdır. (İki derecelendirme olabilir ancak bu durumda doğrusal olmayan bağımlılıklar kuramayacağız ve daha basit olanları kullanmak daha mantıklı görünüyor).

Bu tür analizin parametrik olmayan bir versiyonu Kruskal-Wallis H testidir.

hipotezler

H 0: Faktör dereceleri arasındaki farklar (farklı koşullar), her grup içindeki rastgele farklardan daha büyük değildir.

H 1: Faktör dereceleri arasındaki farklar (farklı koşullar), her grup içindeki rastgele farklardan daha büyüktür.

2.2. İlişkisiz Örnekler İçin Tek Yönlü Varyans Analizinin Sınırlamaları

1. Tek yönlü varyans analizi, faktörün en az üç derecelendirilmesini ve her derecelendirmede en az iki konunun olmasını gerektirir.

2. Ortaya çıkan karakteristik, incelenen örnekte normal şekilde dağılmalıdır.

Doğru, genellikle incelenen numunenin tamamındaki özelliğin dağılımından mı yoksa dağılım kompleksini oluşturan kısmından mı bahsettiğimiz belirtilmez.

3. Örnek kullanılarak ilgisiz örnekler için tek yönlü varyans analizi yöntemini kullanarak bir problemin çözülmesine bir örnek:

Altı kişiden oluşan üç farklı gruba on kelimelik listeler verildi. Kelimeler birinci gruba 5 saniyede 1 kelime olacak şekilde düşük bir hızda, ikinci gruba 2 saniyede 1 kelime olacak şekilde ortalama bir hızda, üçüncü gruba ise saniyede 1 kelime olacak şekilde yüksek bir hızda sunuldu. Çoğaltma performansının kelime sunumunun hızına bağlı olacağı tahmin ediliyordu. Sonuçlar Tabloda sunulmaktadır. 1.

Çoğaltılan kelime sayısı tablo 1

Konu No.

düşük hız

ortalama sürat

yüksek hız

toplam tutar

H 0: Kelime üretim aralığındaki farklılıklar arasında gruplar rastgele farklılıklardan daha belirgin değildir içeri her grup.

H1: Kelime üretim hacmindeki farklılıklar arasında gruplar rastgele farklılıklardan daha belirgindir içeri her grup. Tabloda sunulan deneysel değerlerin kullanılması. 1'de F kriterini hesaplamak için gerekli olacak bazı değerleri oluşturacağız.

Tek yönlü varyans analizi için ana büyüklüklerin hesaplanması tabloda sunulmaktadır:

Tablo 2

Tablo 3

İlgisiz örnekler için tek yönlü varyans analizinde işlem sırası

Bu ve sonraki tablolarda sıklıkla bulunan SS tanımı, "kareler toplamı"nın kısaltmasıdır. Bu kısaltma çoğunlukla tercüme edilmiş kaynaklarda kullanılır.

SS hakikat incelenen faktörün etkisine bağlı olarak özelliğin değişkenliği anlamına gelir;

SS genel olarak- özelliğin genel değişkenliği;

S CA.- hesaba katılmayan faktörlerden kaynaklanan değişkenlik, "rastgele" veya "artık" değişkenlik.

HANIM- “ortalama kare” veya kareler toplamının matematiksel beklentisi, karşılık gelen SS'nin ortalama değeri.

df - parametrik olmayan kriterleri göz önüne aldığımızda Yunan harfiyle gösterdiğimiz serbestlik derecesi sayısı v.

Sonuç: H 0 reddedildi. H 1 kabul edilir. Gruplar arasındaki kelime hatırlama farklılıkları, her grup içindeki rastgele farklardan daha büyüktü (α=0.05). Dolayısıyla kelimelerin sunulma hızı, çoğaltılma hacmini etkiler.

Sorunu Excel'de çözmenin bir örneği aşağıda sunulmuştur:

İlk veri:

Şu komutu kullanarak: Araçlar->Veri Analizi->Tek Yönlü ANOVA, aşağıdaki sonuçları elde ederiz:

Daha önce de belirtildiği gibi, dağılım yöntemi istatistiksel gruplamalarla yakından ilişkilidir ve incelenen popülasyonun, etkisinin araştırılması gereken faktör özelliklerine göre gruplara ayrıldığını varsaymaktadır.

Varyans analizine dayanarak aşağıdakiler üretilir:

1. bir veya daha fazla faktör özelliği için grup ortalamalarındaki farklılıkların güvenilirliğinin değerlendirilmesi;

2. faktör etkileşimlerinin güvenilirliğinin değerlendirilmesi;

3. ortalama çiftleri arasındaki kısmi farklılıkların değerlendirilmesi.

Varyans analizinin uygulanması, bir özelliğin varyanslarının (varyasyonlarının) bileşenlere ayrıştırılması yasasına dayanır.

Gruplandırma sırasında ortaya çıkan özelliğin toplam varyasyonu (Do) aşağıdaki bileşenlere ayrıştırılabilir:

1. gruplar arası D m bir gruplandırma özelliğiyle ilişkilidir;

2. artık için(grup içi) D B gruplama özelliğiyle ilgili değil.

Bu göstergeler arasındaki ilişki şu şekilde ifade edilmektedir:

D o = D m + D in. (1.30)

Bir örnekle varyans analizinin kullanımına bakalım.

Diyelim ki ekim tarihlerinin buğday verimini etkileyip etkilemediğini kanıtlamak istiyorsunuz. Varyans analizi için ilk deneysel veriler tabloda sunulmaktadır. 8.

Tablo 8

Bu örnekte N = 32, K = 4, l = 8.

Bir özelliğin bireysel değerlerinin genel ortalamadan karesel sapmalarının toplamı olan verimdeki toplam toplam değişimi belirleyelim:

burada N nüfus birimlerinin sayısıdır; Y i – bireysel verim değerleri; Y o, tüm popülasyon için genel ortalama verimdir.

Etkin özelliğin incelenen faktöre göre değişimini belirleyen gruplar arası toplam değişimi belirlemek için her grup için etkin özelliğin ortalama değerlerinin bilinmesi gerekir. Bu toplam varyasyon, her gruptaki popülasyon birimi sayısına göre ağırlıklandırılan, grup ortalamalarının özelliğin genel ortalama değerinden sapmalarının karelerinin toplamına eşittir:

Grup içi toplam varyasyon, bir özelliğin bireysel değerlerinin, her grup için grup ortalamalarından sapmalarının karelerinin toplamına eşittir ve popülasyondaki tüm gruplar üzerinden toplanır.

Bir faktörün ortaya çıkan karakteristik üzerindeki etkisi, Dm ve Dv arasındaki ilişkide kendini gösterir: Faktörün incelenen özelliğin değeri üzerindeki etkisi ne kadar güçlü olursa, Dm o kadar büyük ve Dv o kadar az olur.

Varyans analizini gerçekleştirmek için, bir özellikteki varyasyonun kaynaklarını, kaynağa göre varyasyonun hacmini belirlemek ve varyasyonun her bir bileşeni için serbestlik derecesi sayısını belirlemek gerekir.

Değişimin miktarı zaten belirlendi; şimdi değişimin serbestlik derecesinin sayısını belirlemek gerekiyor. Serbestlik derecesi sayısı bir özelliğin bireysel değerlerinin ortalama değerinden bağımsız sapmalarının sayısıdır. ANOVA'daki sapmaların karelerinin toplamına karşılık gelen toplam serbestlik derecesi sayısı, varyasyon bileşenlerine ayrıştırılır. Böylece, toplam sapmaların kare toplamı D o, N – 1 = 31'e eşit varyasyon serbestlik derecesi sayısına karşılık gelir. Grup varyasyonu D m, K – 1'e eşit varyasyon serbestlik derecesi sayısına karşılık gelir. = 3. Grup içi artık varyasyon, N – K = 28'e eşit olan varyasyon serbestlik derecesi sayısına karşılık gelir.


Artık sapmaların karesi toplamını ve serbestlik derecesi sayısını bildiğimize göre, her bileşen için varyansları belirleyebiliriz. Bu varyansları gösterelim: d m - grup ve d grup içi.

Bu varyansları hesapladıktan sonra, faktörün ortaya çıkan nitelik üzerindeki etkisinin önemini belirlemeye devam edeceğiz. Bunu yapmak için şu oranı buluyoruz: d M / d B = F f,

F f miktarına denir Fisher kriteri , tabloyla karşılaştırıldığında, F tablosu. Daha önce belirtildiği gibi, eğer F f > F tablosu ise faktörün etkin nitelik üzerindeki etkisi kanıtlanmıştır. Eğer F f< F табл то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, следовательно, не доказывает с достаточной вероятностью влияние изучаемого фактора.

Teorik değer olasılık ile ilişkilidir ve tabloda değeri belirli bir yargı olasılığı düzeyinde verilmiştir. Ekte, en sık kullanılanı olan yargılama olasılığı için olası F değerini ayarlamanıza olanak tanıyan bir tablo bulunmaktadır: "boş hipotezin" olasılık düzeyi 0,05'tir. Tabloya “Sıfır hipotezi” olasılıkları yerine faktörün etkisinin 0,95 anlamlılık olasılığı tablosu denilebilir. Olasılık düzeyinin arttırılması, karşılaştırma için tablonun daha yüksek bir F değeri gerektirir.

F tablosunun değeri aynı zamanda karşılaştırılan iki dispersiyonun serbestlik derecesi sayısına da bağlıdır. Serbestlik derecesi sayısı sonsuza doğru gidiyorsa, F tablosu birliğe doğru yönelir.

F tablosu değerleri tablosu şu şekilde oluşturulmuştur: tablonun sütunları daha büyük dağılım için varyasyon serbestlik derecelerini gösterir ve satırlar daha küçük (grup içi) dağılım için serbestlik derecelerini gösterir. F'nin değeri, karşılık gelen varyasyon serbestlik derecelerinin sütunu ve satırının kesişiminde bulunur.

Yani örneğimizde F f = 21,3/3,8 = 5,6. F tablosunun tablo değeri 0,95 olasılık ve serbestlik derecesi için sırasıyla 3 ve 28'e eşit, F tablosu = 2,95.

Deneysel olarak elde edilen Ff değeri, 0,99 olasılık için bile teorik değeri aşmaktadır. Sonuç olarak, 0,99'dan büyük olasılıkla elde edilen deneyim, çalışılan faktörün verim üzerindeki etkisini kanıtlar, yani. deneyim güvenilir, kanıtlanmış olarak kabul edilebilir ve bu nedenle ekim zamanının buğday verimi üzerinde önemli bir etkisi vardır. En uygun ekim dönemi 10-15 Mayıs arası olarak düşünülmelidir, çünkü en iyi verim sonuçları bu ekim döneminde elde edilmiştir.

Tek bir özelliğe göre gruplama yaparken ve kopyaları grup içinde rastgele dağıtırken varyans analizi yöntemini inceledik. Bununla birlikte, çoğu zaman deneysel arsanın toprak verimliliği vb. açısından bazı farklılıkları olduğu görülür. Bu nedenle, seçeneklerden birinin daha fazla sayıda parselinin en iyi kısma düşeceği ve göstergelerinin fazla tahmin edileceği bir durum ortaya çıkabilir ve diğer seçeneğin - en kötü kısmı ve bu durumda sonuçlar doğal olarak daha kötü olacak, yani hafife alınacak.

Deneyle ilgili olmayan nedenlerden kaynaklanan varyasyonu hariç tutmak için, tekrarlardan (bloklardan) hesaplanan varyansın grup içi (kalan) varyanstan izole edilmesi gerekir.

Bu durumda sapmaların karelerinin toplamı 3 bileşene bölünür:

D o = D m + D tekrar + D dinlenme. (1.33)

Örneğimiz için, tekrarlardan kaynaklanan sapmaların karelerinin toplamı şuna eşit olacaktır:

Bu nedenle, sapmaların karelerinin gerçek rastgele toplamı şuna eşit olacaktır:

D dinlenme = D in – D tekrarı; Geri kalan = 106 – 44 = 62.

Artık dağılım için serbestlik derecesi sayısı 28 – 7 = 21 olacaktır. Varyans analizi sonuçları tabloda sunulmaktadır. 9.

Tablo 9

F kriterinin 0,95 olasılık için gerçek değerleri tablodaki değerleri aştığı için ekim tarihlerinin ve tekrarlarının buğday verimi üzerindeki etkisinin önemli olduğu düşünülmelidir. Alanın önceden nispeten hizalanmış koşullara sahip bloklara bölündüğü ve test edilen seçeneklerin blok içinde rastgele bir sırayla dağıtıldığı bir deney oluşturma yöntemine rastgele blok yöntemi denir.

Varyans analizini kullanarak yalnızca bir faktörün değil, iki veya daha fazlasının sonuç üzerindeki etkisini inceleyebilirsiniz. Bu durumda varyans analizi çağrılacaktır. çok değişkenli varyans analizi .

İki yönlü ANOVA iki tek faktörlü olandan farklıdır: aşağıdaki sorulara cevap verebilir:

1. 1 Her iki faktörün birlikte etkisi nedir?

2. Bu faktörlerin kombinasyonunun rolü nedir?

Sadece ekim tarihlerinin değil aynı zamanda çeşitlerin buğday verimi üzerindeki etkisini tanımlamanın gerekli olduğu deneyin varyans analizini ele alalım (Tablo 10).

Tablo 10. Ekim tarihlerinin ve çeşitlerinin buğday verimine etkisine ilişkin deneysel veriler

bireysel değerlerin genel ortalamadan karesel sapmalarının toplamıdır.

Ekim zamanı ve çeşidinin ortak etkisindeki değişim

alt grup ortalamalarının tekrar sayısıyla, yani 4 ile ağırlıklandırılmış genel ortalamadan sapmalarının karelerinin toplamıdır.

Yalnızca ekim zamanının etkisine dayalı varyasyonun hesaplanması:

Artık varyasyon, toplam varyasyon ile incelenen faktörlerin ortak etkisindeki varyasyon arasındaki fark olarak tanımlanır:

D dinlenme = Do – D ps = 170 – 96 = 74.

Tüm hesaplamalar bir tablo şeklinde sunulabilir (Tablo 11).

Tablo 11. Varyans analizi sonuçları

Varyans analizinin sonuçları, üzerinde çalışılan faktörlerin, yani ekim zamanı ve çeşidin, buğday verimi üzerindeki etkisinin önemli olduğunu göstermektedir; çünkü faktörlerin her biri için gerçek F kriterleri, karşılık gelen dereceler için bulunan tablodaki kriterleri önemli ölçüde aşmaktadır. özgürlük ve aynı zamanda oldukça yüksek bir olasılıkla (p = 0,99). Bu durumda faktörlerin bir kombinasyonunun etkisi yoktur, çünkü faktörler birbirinden bağımsızdır.

Üç faktörün sonuç üzerindeki etkisinin analizi, iki faktörle aynı prensibe göre gerçekleştirilir, ancak bu durumda faktörler için üç varyans ve faktörlerin kombinasyonu için dört varyans olacaktır. Faktör sayısının artmasıyla birlikte hesaplama işinin hacmi de keskin bir şekilde artar ve ayrıca ilk bilgilerin bir kombinasyon tablosunda düzenlenmesi zorlaşır. Bu nedenle, varyans analizini kullanarak birçok faktörün sonuç üzerindeki etkisini incelemek pek tavsiye edilmez; daha küçük bir sayı almak daha iyidir, ancak ekonomik analiz açısından en önemli faktörleri seçmek daha iyidir.

Çoğu zaman araştırmacı, orantısız dağılım kompleksleri olarak adlandırılan, yani değişken sayısının orantılılığının gözlemlenmediği komplekslerle uğraşmak zorundadır.

Bu tür komplekslerde faktörlerin toplam etkisindeki değişim, faktörler arasındaki değişim ile faktörlerin birleşimindeki değişimin toplamına eşit değildir. Orantılılığın ihlali sonucu ortaya çıkan bireysel faktörler arasındaki bağlantıların derecesine bağlı olarak bir miktar farklılık gösterir.

Bu durumda, bireysel etkilerin toplamı toplam etkiye eşit olmadığından, her bir faktörün etki derecesinin belirlenmesinde zorluklar ortaya çıkar.

Orantısız bir kompleksi tek bir yapıya indirgemenin yollarından biri, frekansların gruplar üzerinden ortalamasının alındığı orantılı bir kompleksle değiştirmektir. Böyle bir yer değiştirme yapıldığında problem orantısal komplekslerin prensiplerine göre çözülür.

Varyans analizi, belirli özellikler ile niceliksel bir açıklamaya sahip olmayan incelenen faktörler arasındaki ilişki hakkındaki hipotezleri test etmek ve ayrıca faktörlerin etki derecesini ve etkileşimlerini belirlemek için tasarlanmış bir dizi istatistiksel yöntemdir. Özel literatürde buna genellikle ANOVA (Varyasyonların Analizi İngilizce isminden) denir. Bu yöntem ilk olarak 1925 yılında R. Fischer tarafından geliştirilmiştir.

Varyans analizi türleri ve kriterleri

Bu yöntem, niteliksel (nominal) özellikler ile niceliksel (sürekli) değişken arasındaki ilişkiyi incelemek için kullanılır. Temelde, çeşitli örneklerin aritmetik ortalamalarının eşitliği hakkındaki hipotezi test eder. Bu nedenle birden fazla numunenin merkezlerinin aynı anda karşılaştırılması için parametrik bir kriter olarak düşünülebilir. Bu yöntemin iki örnek için kullanılması halinde varyans analizinin sonuçları, Öğrenci t-testinin sonuçlarıyla aynı olacaktır. Ancak diğer kriterlerin aksine bu çalışma, sorunu daha detaylı incelememize olanak sağlıyor.

İstatistiklerdeki dağılım analizi şu yasaya dayanmaktadır: birleştirilmiş numunenin karesel sapmalarının toplamı, grup içi sapmaların karelerinin toplamına ve gruplar arası sapmaların karelerinin toplamına eşittir. Çalışma, gruplar arası varyanslar ile grup içi varyanslar arasındaki farkın önemini belirlemek için Fisher testini kullanıyor. Ancak bunun için gerekli önkoşullar dağılımın normalliği ve örneklerin eş varyanslılığıdır (varyansların eşitliği). Tek değişkenli (tek faktörlü) varyans analizi ve çok değişkenli (çok faktörlü) analizler vardır. Birincisi, incelenen değerin bir özelliğe, ikincisi ise aynı anda birçok özelliğe bağımlılığını dikkate alır ve aynı zamanda aralarındaki bağlantıyı tanımlamamıza da olanak tanır.

Faktörler

Faktörler, nihai sonucu etkileyen kontrollü koşullardır. Seviyesi veya işleme yöntemi, bu durumun belirli bir tezahürünü karakterize eden bir değerdir. Bu sayılar genellikle nominal veya sıralı ölçüm ölçeğinde sunulur. Çoğu zaman çıktı değerleri niceliksel veya sıralı ölçeklerde ölçülür. Daha sonra çıktı verilerinin yaklaşık olarak aynı sayısal değerlere karşılık gelen bir dizi gözlemde gruplandırılması sorunu ortaya çıkar. Eğer grup sayısı çok fazla alınırsa, içindeki gözlem sayısı güvenilir sonuçlar elde etmek için yetersiz kalabilir. Sayıyı çok küçük alırsanız, bu durum sistem üzerindeki etkinin önemli özelliklerinin kaybolmasına yol açabilir. Verileri gruplamanın özel yolu, değerlerdeki varyasyonun miktarına ve niteliğine bağlıdır. Tek değişkenli analizde aralıkların sayısı ve boyutu çoğunlukla eşit aralıklar ilkesine veya eşit frekanslar ilkesine göre belirlenir.

Varyans problemlerinin analizi

Bu nedenle, iki veya daha fazla örneği karşılaştırmanız gereken durumlar vardır. O zaman varyans analizinin kullanılması tavsiye edilir. Yöntemin adı, varyans bileşenlerinin incelenmesine dayanarak sonuçların çıkarıldığını gösterir. Çalışmanın özü, göstergedeki genel değişimin, her bir faktörün etkisine karşılık gelen bileşen parçalarına bölünmesidir. Tipik varyans analiziyle çözülen bir takım problemleri ele alalım.

örnek 1

Atölyede belirli bir parçayı üreten çok sayıda otomatik makine bulunmaktadır. Her parçanın boyutu, her makinenin kurulumuna ve parçaların üretim sürecinde meydana gelen rastgele sapmalara bağlı olan rastgele bir değişkendir. Parçaların boyutlarına ilişkin ölçüm verilerine dayanarak makinelerin aynı şekilde yapılandırılıp yapılandırılmadığının belirlenmesi gerekir.

Örnek 2

Elektrikli bir cihazın imalatı sırasında çeşitli türde yalıtım kağıtları kullanılır: kapasitör, elektrik vb. Cihaz çeşitli maddelerle emprenye edilebilir: epoksi reçine, vernik, ML-2 reçine vb. Sızıntılar vakum altında ortadan kaldırılabilir. ısıtma ile yüksek basınç. Emdirme, sürekli bir vernik akışı vb. altında verniğe daldırılarak yapılabilir. Elektrikli aparat bir bütün olarak çeşitli seçeneklerin bulunduğu belirli bir bileşikle doldurulur. Kalite göstergeleri, yalıtımın elektriksel gücü, çalışma modunda sargının aşırı ısınma sıcaklığı ve diğerleridir. Cihazların imalat teknolojik sürecinin geliştirilmesi sırasında, listelenen faktörlerden her birinin cihazın performansını nasıl etkilediğinin belirlenmesi gerekir.

Örnek 3

Troleybüs deposu çeşitli troleybüs güzergahlarına hizmet vermektedir. Çeşitli türlerde troleybüsler işletiyorlar ve 125 müfettiş ücret topluyor. Depo yönetimi şu soruyla ilgileniyor: Farklı rotalar ve farklı troleybüs türleri dikkate alınarak her kontrolörün ekonomik göstergeleri (gelir) nasıl karşılaştırılır? Belirli bir rotada belirli türde troleybüs üretmenin ekonomik fizibilitesi nasıl belirlenir? Çeşitli troleybüs türlerinde bir kondüktörün her güzergahta getirdiği gelir miktarına ilişkin makul gereksinimler nasıl belirlenir?

Bir yöntem seçme görevi, her bir faktörün nihai sonuç üzerindeki etkisine ilişkin maksimum bilginin nasıl elde edileceği, böyle bir etkinin sayısal özelliklerinin, güvenilirliklerinin minimum maliyetle ve mümkün olan en kısa sürede nasıl belirleneceğidir. Varyans analizi yöntemleri bu tür sorunların çözülmesine olanak tanır.

Tek değişkenli analiz

Çalışmanın amacı, belirli bir vakanın analiz edilen inceleme üzerindeki etkisinin büyüklüğünü değerlendirmektir. Tek değişkenli analizin bir diğer amacı, iki veya daha fazla durumu birbiriyle karşılaştırmak ve bunların hatırlama üzerindeki etkisindeki farkı belirlemek olabilir. Sıfır hipotezi reddedilirse bir sonraki adım, elde edilen özellikler için güven aralıklarını ölçmek ve oluşturmaktır. Sıfır hipotezinin reddedilemediği durumlarda genellikle kabul edilir ve etkinin doğası hakkında bir sonuca varılır.

Tek yönlü varyans analizi, Kruskal-Wallis sıralama yönteminin parametrik olmayan bir benzeri olabilir. Amerikalı matematikçi William Kruskal ve ekonomist Wilson Wallis tarafından 1952 yılında geliştirilmiştir. Bu kriter, bilinmeyen ancak eşit ortalama değerlere sahip, incelenen örnekler üzerindeki etkilerin eşitliğine ilişkin sıfır hipotezini test etmek için tasarlanmıştır. Bu durumda örnek sayısının ikiden fazla olması gerekir.

Jonckheere-Terpstra kriteri, 1952'de Hollandalı matematikçi T. J. Terpstra ve 1954'te İngiliz psikolog E. R. Jonckheere tarafından bağımsız olarak önerildi. Mevcut sonuç gruplarının, etkinin büyümesine göre sıralandığı önceden bilindiğinde kullanılır. sıralı bir ölçekte ölçülen, incelenen faktör.

İngiliz istatistikçi Maurice Stevenson Bartlett tarafından 1937'de önerilen M - Bartlett testi, incelenen örneklerin alındığı, genellikle farklı boyutlara sahip (her birinin sayısı) birkaç normal popülasyonun varyanslarının eşitliği hakkındaki sıfır hipotezini test etmek için kullanılır. örnek en az dört olmalıdır).

G - Cochran testi, 1941 yılında Amerikalı William Gemmell Cochran tarafından keşfedilmiştir. Normal popülasyonların varyanslarının eşit büyüklükteki bağımsız örneklerde eşitliği hakkındaki sıfır hipotezini test etmek için kullanılır.

Amerikalı matematikçi Howard Levene tarafından 1960 yılında önerilen parametrik olmayan Levene testi, incelenen örneklerin normal dağılıma tabi olduğuna dair güvenin olmadığı durumlarda Bartlett testine bir alternatiftir.

1974 yılında Amerikalı istatistikçiler Morton B. Brown ve Alan B. Forsythe, Levene testinden biraz farklı bir test (Brown-Forsyth testi) önerdiler.

İki faktörlü analiz

İlgili normal dağılmış örnekler için iki yönlü varyans analizi kullanılır. Uygulamada, bu yöntemin karmaşık tabloları, özellikle de her hücrenin sabit seviye değerlerine karşılık gelen bir dizi veri (tekrarlanan ölçümler) içerdiği tablolar sıklıkla kullanılır. İki yönlü varyans analizini uygulamak için gereken varsayımlar karşılanmıyorsa, Amerikalı iktisatçı Milton Friedman tarafından 1930'un sonlarında geliştirilen parametrik olmayan Friedman sıralama testini (Friedman, Kendall ve Smith) kullanın. Bu test, türe bağlı değildir. dağıtım.

Yalnızca değerlerin dağılımının aynı ve sürekli olduğu, kendilerinin de birbirlerinden bağımsız olduğu varsayılmaktadır. Boş hipotezi test ederken, çıktı verileri, satırların B faktörünün seviyelerine ve sütunların A seviyelerine karşılık geldiği dikdörtgen bir matris biçiminde sunulur. Tablonun (blok) her hücresi, her iki faktörün seviyelerinin sabit değerlerine sahip bir nesne veya bir grup nesne üzerindeki parametrelerin ölçümlerinin sonucu. Bu durumda, karşılık gelen veriler, incelenen numunenin tüm boyutları veya nesneleri için belirli bir parametrenin ortalama değerleri olarak sunulur. Çıktı kriterini uygulamak için, ölçümlerin doğrudan sonuçlarından sıralamalarına geçmek gerekir. Sıralama her satır için ayrı ayrı yapılır, yani her sabit değer için değerler sıralanır.

Amerikalı istatistikçi E. B. Page tarafından 1963'te önerilen Page testi (L-testi), sıfır hipotezini test etmek için tasarlanmıştır. Büyük örnekler için Page yaklaşımı kullanılır. Karşılık gelen sıfır hipotezlerinin gerçekliğine bağlı olarak standart normal dağılıma uyarlar. Kaynak tablonun satırlarının aynı değerlere sahip olması durumunda ortalama sıralamaların kullanılması gerekmektedir. Bu durumda, bu tür eşleşmelerin sayısı arttıkça sonuçların doğruluğu daha kötü olacaktır.

Q - Cochran'ın kriteri, W. Cochran tarafından 1937'de önerildi. Homojen denek gruplarının etkilere maruz kaldığı, sayısı ikiyi aşan ve geri bildirim için iki seçeneğin mümkün olduğu durumlarda kullanılır - koşullu olarak negatif (0) ve koşullu olarak olumlu (1) . Boş hipotez, tedavi etkilerinin eşitliğinden oluşur. İki yönlü varyans analizi, tedavi etkilerinin varlığını belirlemeyi mümkün kılar, ancak bu etkinin hangi belirli sütunlar için mevcut olduğunu belirlemeyi mümkün kılmaz. Bu sorunu çözmek için ilgili örnekler için çoklu Scheffe denklemleri yöntemi kullanılır.

Çok değişkenli analiz

Çok değişkenli varyans analizi sorunu, iki veya daha fazla koşulun belirli bir rastgele değişken üzerindeki etkisini belirlemeniz gerektiğinde ortaya çıkar. Çalışma, bir fark veya oran ölçeğinde ölçülen bir bağımlı rastgele değişkenin ve her biri bir adlandırma veya sıralama ölçeğinde ifade edilen birkaç bağımsız değişkenin varlığını içerir. Verilerin varyans analizi, matematiksel istatistiğin oldukça gelişmiş ve birçok seçeneğe sahip bir bölümüdür. Araştırma konsepti hem tek faktörlü hem de çok faktörlü için ortaktır. Bunun özü, toplam varyansın belirli bir veri gruplamasına karşılık gelen bileşenlere bölünmesi gerçeğinde yatmaktadır. Her veri gruplamasının kendi modeli vardır. Burada yalnızca en çok kullanılan seçeneklerin anlaşılması ve pratik kullanımı için gerekli olan temel hükümleri ele alacağız.

Faktörlerin varyans analizi, girdi verilerinin toplanması ve sunumunda ve özellikle sonuçların yorumlanmasında oldukça dikkatli bir tutum gerektirir. Sonuçları koşullu olarak belirli bir sıraya yerleştirilebilen tek faktörlü bir testin aksine, iki faktörlü bir testin sonuçları daha karmaşık bir sunum gerektirir. Üç, dört veya daha fazla durum söz konusu olduğunda durum daha da karmaşık hale gelir. Bu nedenle bir modele üçten (dört) fazla koşulun dahil edilmesi oldukça nadirdir. Bir elektrik çemberinin belirli bir kapasitans ve endüktans değerinde rezonansın oluşması bir örnek olabilir; sistemin inşa edildiği belirli bir dizi elementle kimyasal reaksiyonun tezahürü; Belirli koşulların çakışması durumunda karmaşık sistemlerde anormal etkilerin ortaya çıkması. Etkileşimin varlığı sistemin modelini kökten değiştirebilir ve bazen deneycinin uğraştığı olgunun doğasının yeniden düşünülmesine yol açabilir.

Tekrarlanan deneylerle çok değişkenli varyans analizi

Ölçüm verileri çoğunlukla ikiye göre değil, daha fazla sayıda faktöre göre gruplandırılabilir. Dolayısıyla, troleybüs tekerleği lastiklerinin hizmet ömrünün dağılım analizini koşulları (üretim tesisi ve lastiklerin çalıştırıldığı rota) dikkate alarak ele alırsak, o zaman lastiklerin kullanıldığı sezonu ayrı bir koşul olarak seçebiliriz. lastikler çalıştırılır (yani: kış ve yaz çalışması). Sonuç olarak üç faktörlü yöntemde sorun yaşayacağız.

Daha fazla koşulun olması durumunda yaklaşım, iki faktörlü analizdekiyle aynıdır. Her durumda modeli basitleştirmeye çalışıyorlar. İki faktörün etkileşimi olgusu çok sık görülmez ve üçlü etkileşim yalnızca istisnai durumlarda ortaya çıkar. Hakkında önceden bilgi bulunan etkileşimleri ve bunların dikkate alınması için iyi nedenlerin modele dahil edilmesi. Bireysel faktörleri belirleme ve bunları dikkate alma süreci nispeten basittir. Bu nedenle çoğu zaman daha fazla durumu vurgulama isteği vardır. Bu duruma kendinizi kaptırmamalısınız. Koşullar arttıkça modelin güvenilirliği azalır ve hata olasılığı artar. Çok sayıda bağımsız değişken içeren modelin kendisi yorumlanması oldukça karmaşık hale gelmekte ve pratik kullanım açısından elverişsiz hale gelmektedir.

Varyans analizine ilişkin genel fikir

İstatistiklerdeki varyans analizi, eşzamanlı olarak işleyen çeşitli koşullara bağlı olarak gözlemsel sonuçların elde edilmesine ve bunların etkilerinin değerlendirilmesine yönelik bir yöntemdir. Çalışma nesnesini etkileme yöntemine karşılık gelen ve belirli bir süre içinde belirli bir değer kazanan kontrollü bir değişkene faktör denir. Niteliksel ve niceliksel olabilirler. Niceliksel koşulların düzeyleri sayısal ölçekte belli bir anlam kazanır. Örnekler sıcaklık, presleme basıncı, madde miktarıdır. Niteliksel faktörler farklı maddeler, farklı teknolojik yöntemler, cihazlar, dolgu maddeleridir. Seviyeleri bir isim ölçeğine karşılık gelir.

Kalite ayrıca ambalaj malzemesinin türünü ve dozaj formunun saklama koşullarını da içerebilir. Hammaddelerin öğütülme derecesini, granüllerin fraksiyonel bileşimini de dahil etmek mantıklıdır; bunlar niceliksel öneme sahiptir, ancak niceliksel bir ölçek kullanılırsa düzenlenmesi zordur. Niteliksel faktörlerin sayısı, dozaj formunun türüne ve ayrıca tıbbi maddelerin fiziksel ve teknolojik özelliklerine bağlıdır. Örneğin tabletler, kristalli maddelerden doğrudan sıkıştırma yoluyla elde edilebilir. Bu durumda kaydırıcı ve yağlayıcı maddelerin seçilmesi yeterlidir.

Farklı dozaj formları türleri için kalite faktörlerine örnekler

  • Tentürler. Ekstraktant bileşimi, ekstraktör tipi, hammadde hazırlama yöntemi, üretim yöntemi, filtrasyon yöntemi.
  • Ekstraktlar (sıvı, kalın, kuru). Ekstraktantın bileşimi, ekstraksiyon yöntemi, kurulum tipi, ekstraktant ve balast maddelerinin uzaklaştırılma yöntemi.
  • Haplar. Yardımcı maddeler, dolgu maddeleri, parçalayıcılar, bağlayıcılar, yağlayıcılar ve yağlayıcıların bileşimi. Tablet elde etme yöntemi, teknolojik ekipman türü. Kabuğun türü ve bileşenleri, film oluşturucular, pigmentler, boyalar, plastikleştiriciler, çözücüler.
  • Enjeksiyon çözümleri.Çözücü tipi, filtrasyon yöntemi, stabilizatörlerin ve koruyucuların doğası, sterilizasyon koşulları, ampul doldurma yöntemi.
  • Fitiller. Fitil bazının bileşimi, fitiller üretme yöntemi, dolgu maddeleri, paketleme.
  • Merhemler. Bazın bileşimi, yapısal bileşenler, merhem hazırlama yöntemi, ekipman tipi, paketleme.
  • Kapsüller. Kabuk malzemesinin türü, kapsül üretme yöntemi, plastikleştiricinin türü, koruyucu madde, boya.
  • Liniments. Hazırlama yöntemi, bileşimi, ekipman tipi, emülgatörün tipi.
  • Süspansiyonlar.Çözücü tipi, stabilizatör tipi, dispersiyon yöntemi.

Tablet üretim sürecinde incelenen kalite faktörlerine ve bunların düzeylerine örnekler

  • Kabartma tozu. Patates nişastası, beyaz kil, sodyum bikarbonat ile sitrik asit karışımı, bazik magnezyum karbonat.
  • Bağlayıcı çözüm. Su, nişasta ezmesi, şeker şurubu, metilselüloz çözeltisi, hidroksipropilmetilselüloz çözeltisi, polivinilpirolidon çözeltisi, polivinil alkol çözeltisi.
  • Kayan madde. Aerosil, nişasta, talk.
  • Dolgu.Şeker, glikoz, laktoz, sodyum klorür, kalsiyum fosfat.
  • Yağlayıcı. Stearik asit, polietilen glikol, parafin.

Devletin rekabet edebilirlik düzeyinin araştırılmasında varyans analizi modelleri

Bir devletin refahının ve sosyo-ekonomik gelişiminin düzeyinin değerlendirildiği devletin durumunu değerlendirmenin en önemli kriterlerinden biri rekabet edebilirlik, yani devletin doğasını belirleyen ulusal ekonominin doğasında bulunan bir dizi özelliktir. Diğer ülkelerle rekabet edebilme yeteneği. Devletin dünya pazarındaki yerini ve rolünü belirledikten sonra, uluslararası ölçekte ekonomik güvenliği sağlamak için net bir strateji oluşturmak mümkündür, çünkü bu, Rusya ile dünya pazarındaki tüm oyuncular (yatırımcılar) arasındaki olumlu ilişkilerin anahtarıdır. , alacaklılar ve hükümetler.

Devletlerin rekabet edebilirlik düzeyini karşılaştırmak için ülkeler, çeşitli ağırlıklı göstergeleri içeren karmaşık endeksler kullanılarak sıralanmaktadır. Bu endeksler ekonomik, politik vb. durumu etkileyen temel faktörlere dayanmaktadır. Devletin rekabet gücünü araştırmaya yönelik bir dizi model, çok değişkenli istatistiksel analiz yöntemlerinin (özellikle varyans analizi (istatistik), ekonometrik modelleme, karar verme) kullanımını içerir ve aşağıdaki ana aşamaları içerir:

  1. Bir göstergeler sisteminin oluşturulması.
  2. Devlet rekabet edebilirlik göstergelerinin değerlendirilmesi ve tahmin edilmesi.
  3. Devletlerin rekabet edebilirliğine ilişkin göstergelerin karşılaştırılması.

Şimdi bu kompleksin her aşamasına ait modellerin içeriğine bakalım.

İlk aşamada Uzman çalışma yöntemleri kullanılarak, devletin rekabet gücünü değerlendirmek için sağlam temellere dayanan bir dizi ekonomik gösterge oluşturulur; uluslararası derecelendirmelere ve istatistik departmanlarından gelen verilere dayanarak, sistemin bir bütün olarak durumunu yansıtan gelişiminin özellikleri dikkate alınır. ve süreçleri. Bu göstergelerin seçimi, pratik açıdan devletin seviyesini, yatırım çekiciliğini ve mevcut potansiyel ve fiili tehditlerin göreceli yerelleştirme olasılığını belirlememize izin verenleri en eksiksiz şekilde seçme ihtiyacıyla haklı çıkar.

Uluslararası derecelendirme sistemlerinin ana göstergeleri endekslerdir:

  1. Küresel Rekabet Edebilirlik (GC).
  2. Ekonomik özgürlük (IES).
  3. İnsani Gelişme (İGE).
  4. Yolsuzluk Algısı (TBM).
  5. İç ve dış tehditler (IETH).
  6. Uluslararası Etki Potansiyeli (IPIP).

İkinci aşamaÇalışma kapsamındaki dünyanın 139 ülkesi için uluslararası derecelendirmelere göre devlet rekabet edebilirlik göstergelerinin değerlendirilmesini ve tahmin edilmesini sağlar.

Üçüncü sahne Korelasyon ve regresyon analizi yöntemlerini kullanarak devletlerin rekabet edebilirlik koşullarının karşılaştırılmasını sağlar.

Çalışmanın sonuçlarını kullanarak, genel olarak süreçlerin doğasını ve devletin rekabet edebilirliğinin bireysel bileşenlerini belirlemek mümkündür; Faktörlerin etkisi ve ilişkileri hakkındaki hipotezi uygun önem düzeyinde test edin.

Önerilen model setinin uygulanması, yalnızca devletlerin rekabet gücü ve yatırım çekiciliği düzeyinin mevcut durumunun değerlendirilmesine değil, aynı zamanda yönetim eksikliklerinin analiz edilmesine, yanlış kararlardaki hataların önlenmesine ve ülkede bir krizin gelişmesinin önlenmesine de olanak tanıyacaktır. durum.

Tek yönlü varyans analizi.

Varyans analizi kavramı ve modelleri.

Konu 13. Varyans analizi

Ders 1. Sorular:

Bir araştırma yöntemi olarak varyans analizi, test edilen tarımsal ürün çeşidinin maksimum verimi sağladığı koşulları belirlemek için R. Fischer'in (1918-1935) tarım araştırmalarıyla bağlantılı çalışmalarında ortaya çıktı. Varyans analizi Yeats'in çalışmalarında daha da geliştirildi. Varyans analizi, belirli faktörlerin, değerleri deneyim sonucu elde edilebilecek bir faktörün değişkenliği üzerinde önemli bir etkiye sahip olup olmadığı sorusuna cevap vermemizi sağlar. İstatistiksel hipotezleri test ederken, incelenen faktörlerdeki rastgele değişimler varsayılır. Varyans analizinde bir veya daha fazla faktör belirli bir şekilde değiştirilir ve bu değişiklikler gözlem sonuçlarını etkileyebilir. Bu tür etkinin incelenmesi, varyans analizinin amacıdır.

Günümüzde varyans analizinin ekonomi, sosyoloji, biyoloji vb. alanlarda, özellikle istatistiksel hesaplamaların hantallığından kaynaklanan sorunları ortadan kaldıran yazılımların ortaya çıkmasından sonra giderek yaygınlaşan bir kullanımı vardır.

Bilimin çeşitli alanlarındaki pratik faaliyetlerde, çeşitli faktörlerin belirli göstergeler üzerindeki etkisini değerlendirme ihtiyacıyla sıklıkla karşı karşıya kalıyoruz. Çoğu zaman bu faktörler niteliksel niteliktedir (örneğin, ekonomik etkiyi etkileyen niteliksel bir faktör, yeni bir üretim yönetim sisteminin uygulamaya konması olabilir) ve daha sonra varyans analizi, bu tür sonuçları veren tek istatistiksel araştırma yöntemi haline geldiğinden, özel bir değer kazanır. bir değerlendirme.

Varyans analizi, incelenen faktörlerden birinin veya diğerinin bir özelliğin değişkenliği üzerinde önemli bir etkiye sahip olup olmadığını belirlemeyi ve ayrıca her bir değişkenlik kaynağının kendi bütünlüğü içindeki "özgül ağırlığını" ölçmeyi mümkün kılar. Ancak varyans analizi, yalnızca önemli bir etkinin varlığı hakkında olumlu bir cevap vermemize izin verir, aksi takdirde soru açık kalır ve ek araştırma gerektirir (çoğunlukla deney sayısındaki artış).

Varyans analizinde aşağıdaki terimler kullanılmaktadır.

Faktör (X), Y sonucunu (sonuç niteliği) etkilemesi gerektiğine inandığımız bir şeydir.

Faktör düzeyi (veya işleme yöntemi, bazen kelimenin tam anlamıyla örneğin toprak işleme yöntemi) - faktörün alabileceği değerler (X, i = 1.2,...I).

Yanıt – ölçülen karakteristiğin değeri (sonuç değeri Y).

ANOVA tekniği, incelenen bağımsız faktörlerin sayısına bağlı olarak değişir. Bir özelliğin ortalama değerinde değişkenliğe neden olan faktörler tek bir kaynağa aitse, o zaman basit bir gruplandırmaya veya tek faktörlü varyans analizine ve ardından buna göre çift gruplandırmaya (iki faktörlü varyans analizi, üç faktörlü varyans analizi) sahip oluruz. varyans analizi, ..., m-faktörü. Çok değişkenli analizdeki faktörler genellikle Latin harfleriyle gösterilir: A, B, C, vb.



Varyans analizinin görevi, belirli faktörlerin (veya faktör seviyelerinin) gözlemlenen rastgele değişkenlerin ortalama değerlerinin değişkenliği üzerindeki etkisini incelemektir.

Varyans analizinin özü. Varyans analizi, değişkenliğe neden olan bireysel faktörlerin izole edilmesi ve değerlendirilmesinden oluşur. Bu amaçla, gözlemlenen kısmi popülasyonun tüm değişkenlik kaynaklarının neden olduğu toplam varyansı (özelliğin toplam varyansı), bağımsız faktörler tarafından oluşturulan varyans bileşenlerine ayrıştırılır. Bu bileşenlerin her biri, genel popülasyonda belirli bir değişkenlik kaynağının neden olduğu varyansın (,...) bir tahminini sağlar. Bu bileşen varyans tahminlerinin anlamlılığını test etmek için bunlar popülasyondaki toplam varyansla karşılaştırılır (Fisher testi).

Örneğin, iki faktörlü analizde formun bir ayrıştırmasını elde ederiz:

Çalışılan özelliğin toplam varyansı C;

A faktörünün etkisinden kaynaklanan varyansın payı;

B faktörünün etkisinden kaynaklanan varyansın payı;

A ve B faktörlerinin etkileşiminden kaynaklanan varyansın oranı;

Açıklanmayan rastgele nedenlerin neden olduğu varyansın payı (rastgele varyans);

Varyans analizinde şu hipotez dikkate alınır: H 0 - dikkate alınan faktörlerden hiçbirinin özelliğin değişkenliği üzerinde etkisi yoktur. Her bir varyans tahmininin önemi, rastgele varyans tahminine olan oranının değeri ile kontrol edilir ve Fisher-Snedecor F dağılımının kritik değer tabloları kullanılarak anlamlılık düzeyi a'da karşılık gelen kritik değerle karşılaştırılır (Ek 4) . F hesaplanırsa, bir veya başka değişkenlik kaynağına ilişkin H 0 hipotezi reddedilir. >F cr. (örneğin B faktörü için: S B 2 /S ε 2 >F cr.).

Varyans analizi 3 türdeki deneyleri dikkate alır:

a) tüm faktörlerin sistematik (sabit) seviyelere sahip olduğu deneyler;

b) tüm faktörlerin rastgele düzeylere sahip olduğu deneyler;

c) rastgele düzeylere sahip faktörlerin yanı sıra sabit düzeylere sahip faktörlerin de bulunduğu deneyler.

a), b), c) durumları, varyans analizinde dikkate alınan üç modele karşılık gelir.

Varyans analizi için girdi verileri genellikle aşağıdaki tablo biçiminde sunulur:

Gözlem numarası j Faktör seviyeleri
1 bir 2 Ar
X 11 X 21 X p1
X 12 X 22 XP2
X 13 X 23 X p3
. . .
. . .
. . .
N X 1n X2n Xpn
SONUÇLAR

p farklı seviye alan tek bir faktör düşünün ve her seviyede n gözlemin yapıldığını varsayalım, bu da N=np gözlem verir. (Kendimizi varyans analizinin ilk modelini ele almakla sınırlayacağız - tüm faktörlerin sabit seviyeleri vardır.)

Sonuçlar X ij (i=1,2…,р; j=1,2,…,n) formunda sunulsun.

Her n gözlem seviyesi için, genel ortalamanın ve bunun seçilen seviyeye bağlı değişiminin toplamına eşit olan bir ortalamanın olduğu varsayılır:

burada m genel ortalamadır;

A i - faktörün i – m seviyesinin neden olduğu etki;

e ij – bireysel faktör düzeyinde sonuçların değişimi. E ij terimi kontrol edilemeyen tüm faktörleri hesaba katar.

Sabit bir faktör seviyesindeki gözlemlerin ortalama m + Ai etrafında ortak varyans s2 ile normal şekilde dağıldığını varsayalım.

Daha sonra (indeks yerine nokta, bu indeks üzerinden karşılık gelen gözlemlerin ortalamasını belirtir):

A.X ij – X.. = (X i . – X..) + (X ij – X i .). (12.3)

Denklemin her iki tarafının karesini alıp i ve j'yi topladıktan sonra şunu elde ederiz:

o zamandan beri, ama

Aksi halde kareler toplamı şu şekilde yazılabilir: S = S 1 + S 2. S 1'in değeri, p ortalamalarının X.. genel ortalamasından sapmalarından hesaplanır, dolayısıyla S 1 (p-1) serbestlik derecesine sahiptir. S 2 değeri, N gözlemin p örnek ortalamasından sapmalarından hesaplanır ve bu nedenle N-р = np - p=p(n-1) serbestlik derecesine sahiptir. S (N-1) serbestlik derecesine sahiptir. Hesaplama sonuçlarına göre varyans analizi tablosu oluşturulur.

ANOVA tablosu

Tüm seviyelerin etkisinin eşit olduğu hipotezi doğruysa, o zaman hem M 1 hem de M 2 (ortalama kareler), s 2'nin tarafsız tahminleri olacaktır. Bu, hipotezin (M 1 / M 2) oranı hesaplanarak ve F cr ile karşılaştırılarak test edilebileceği anlamına gelir. ν 1 = (p-1) ve ν 2 = (N-p) serbestlik derecesi ile.

F hesaplanırsa >F cr. , A faktörünün gözlemlerin sonucu üzerindeki önemsiz etkisine ilişkin hipotez kabul edilmez.

F hesaplamasındaki farklılıkların önemini değerlendirmek. F tablosu hesaplamak:

a) deneysel hata

b) ortalamalar farkı hatası

c) en küçük anlamlı fark

Opsiyonların ortalama değerleri arasındaki farkı NSR ile karşılaştırarak ortalama düzeyindeki farklılıkların anlamlı olduğu sonucuna varıyorlar.

Yorum. Varyans analizinin kullanımı şunları varsayar:

2) D(ε ij)=σ 2 = sabit,

3) ε ij → N (0, σ) veya x ij → N (a, σ).

Analitik istatistikçi

7.1 Varyans analizi. 2

Yöntemin bu versiyonunda, deneklerin farklı örnekleri her bir derecelendirmenin etkisine maruz bırakılır. Faktörün en azından derecelendirmeleri olmalıdır üç.

Örnek 1. Altı kişiden oluşan üç farklı gruba on kelimelik listeler verildi. Kelimeler birinci gruba 5 saniyede 1 kelime olacak şekilde düşük bir hızda, ikinci gruba 2 saniyede 1 kelime olacak şekilde ortalama bir hızda, üçüncü gruba ise saniyede 1 kelime olacak şekilde yüksek bir hızda sunuldu. Çoğaltma performansının kelime sunumunun hızına bağlı olacağı tahmin ediliyordu. Sonuçlar tabloda sunulmaktadır. 1.

Tablo 1. Çoğaltılan kelime sayısı (tarafından) J. Greene, MD "Olivera, 1989, s. 99)

Konu No.

Grup 1 düşük hız

Grup 2 orta hız

Grup 3 yüksek hız

miktarlar

ortalama

7,17

6,17

4,00

Toplam tutar

Tek değişkenli varyans analizi hipotezleri test etmenize olanak tanır:

H 0 : kelime üretim hacmindeki farklılıklar arasında gruplar rastgele farklılıklardan daha belirgin değildir içeri her grup

H 1 : Kelime üretim hacmindeki farklılıklar arasında gruplar rastgele farklılıklardan daha belirgindir içeri her grup.

İlgisiz örnekler için tek yönlü varyans analizindeki işlem sırası:

1. hadi sayalım SS gerçeği- incelenen faktörün etkisine bağlı olarak özelliğin değişkenliği. Ortak tanım SS - "kareler toplamı"nın kısaltması ( kareler toplamı ). Bu kısaltma çoğunlukla tercüme edilmiş kaynaklarda kullanılır (örneğin bakınız: Glass J., Stanley J., 1976).

,(1)

burada T c, her durum için bireysel değerlerin toplamıdır. Örneğimiz için 43, 37, 24 (bkz. Tablo 1);

с – faktörün koşullarının (derecelendirme) sayısı (=3);

N – her gruptaki denek sayısı (=6);

N – bireysel değerlerin toplam sayısı (=18);

Bireysel değerlerin toplamının karesi (=104 2 =10816)

Tüm bireysel değerlerin önce karesi alınıp sonra toplandığı ve bireysel değerlerin önce toplam toplam elde etmek için toplandığı ve ardından bu toplamın karesinin alındığı arasındaki farka dikkat edin.

Özelliğin gerçek değişkenliğini hesaplayarak formül (1)'i kullanarak şunu elde ederiz:

2. hadi sayalım SS generali– özelliğin genel değişkenliği:


(2)

3. Rastgele (artık) değeri hesaplayınSS sl, hesaba katılmayan faktörlerin neden olduğu:

(3)

4.serbestlik derecesi sayısı eşittir:

=3-1=2(4)

5."orta kare" veya karşılık gelen SS karelerinin toplamlarının ortalama değeri şuna eşittir:

(5)

6. anlam kriter istatistikleri Kadın formülü kullanarak hesaplayın:

(6)

Örneğimiz için elimizde : F em =15,72/2,11=7,45

7. tanımla F kritik istatistiksel tablolara göre Uygulamalar 3 df 1 =k 1 =2 ve df 2 =k 2 =15 için istatistiğin tablo değeri 3,68'dir.

8. eğer Kadın< F kritikse sıfır hipotezi kabul edilir, aksi halde alternatif hipotez kabul edilir. Örneğimiz için Kadın> F kritik (7,45>3,68), dolayısıyla p

Çözüm:gruplar arasındaki kelime hatırlama farklılıkları, her grup içindeki rastgele farklılıklardan daha belirgindir (p<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.

7.1.2 İlgili örnekler için varyans analizi

İlgili örneklemler için varyans analizi yöntemi, bir faktörün farklı derecelendirmelerinin veya farklı koşulların etkisinin olduğu durumlarda kullanılır. aynı konu örneği. Faktörün en azından derecelendirmeleri olmalıdır üç.

Bu durumda denekler arasındaki farklılıklar olası bağımsız bir farklılık kaynağıdır. İlgili örnekler için tek yönlü ANOVAFaktör değişim eğrisi tarafından ifade edilen eğilimin mi, yoksa denekler arasındaki bireysel farklılıkların mı daha ağır bastığını belirlememize olanak tanıyacak. Bireysel farklılıklar faktörü, deney koşullarındaki değişiklik faktöründen daha önemli olabilir.

Örnek 2.5 denekten oluşan bir grup, entelektüel kararlılığı incelemeyi amaçlayan üç deneysel görev kullanılarak incelendi (Sidorenko E.V., 1984). Her deneğe bireysel olarak art arda üç özdeş anagram sunuldu: dört harfli, beş harfli ve altı harfli. Bir anagramın uzunluk faktörünün, onu çözme girişimlerinin süresini etkilediğini varsaymak mümkün müdür?

Tablo 2. Anagram çözme süresi (sn)

Konu kodu

Durum 1. dört harfli anagram

Durum 2. Beş harfli anagram

Durum 3. altı harfli anagram

Konulara göre tutarlar

miktarlar

1244

1342

Hipotezleri formüle edelim. Bu durumda iki grup hipotez vardır.

A'yı ayarla.

H 0 (A): Farklı uzunluklardaki anagramları çözme girişimlerinin süresindeki farklılıklar, rastgele nedenlerden kaynaklanan farklılıklardan daha belirgin değildir.

H 1 (A): Farklı uzunluktaki anagramları çözme girişimlerinin süresindeki farklılıklar, rastgele nedenlerden kaynaklanan farklılıklardan daha belirgindir.

B'yi ayarlayın.

N hakkında (B): Denekler arasındaki bireysel farklılıklar, rastgele nedenlerden kaynaklanan farklılıklardan daha belirgin değildir.

H 1 (B): Denekler arasındaki bireysel farklılıklar, rastgele nedenlerden kaynaklanan farklılıklardan daha belirgindir.

İlgili örnekler için tek yönlü varyans analizindeki işlem sırası:

1. hadi sayalım SS gerçeği- formül (1)'e göre incelenen faktörün etkisine bağlı olarak özelliğin değişkenliği.

burada T c, koşulların (sütunlar) her biri için ayrı değerlerin toplamıdır. Örneğimiz için 51, 1244, 47 (bkz. Tablo 2); с – faktörün koşullarının (derecelendirme) sayısı (=3); N – her gruptaki denek sayısı (=5); N – bireysel değerlerin toplam sayısı (=15); - bireysel değerlerin toplam toplamının karesi (=1342 2)

2. hadi sayalım SS isp'si- konuların bireysel değerlerinden dolayı işaretin değişkenliği.

Nerede T ve her konu için bireysel değerlerin toplamıdır. Örneğimiz için 247, 631, 100, 181, 183 (bkz. Tablo 2); с – faktörün koşullarının (derecelendirme) sayısı (=3); N – bireysel değerlerin toplam sayısı (=15);

3. hadi sayalım SS generali- formül (2)'ye göre özelliğin genel değişkenliği:


4. Rastgele (artık) değeri hesaplayınSS slformül (3)'e göre hesaba katılmayan faktörlerin neden olduğu:

5. serbestlik derecesi sayısı eşittir (4):

; ; ;

6. "orta kare" veya kareler toplamının matematiksel beklentisi, karşılık gelen SS karelerinin toplamlarının ortalama değeri (5)'e eşittir:

;

7. kriter istatistik değeri Kadın formül (6)'yı kullanarak hesaplayın:

;

8. df 1 =k 1 =2 ve df 2 =k 2 =8 istatistiğinin tablo değeri F crit_fact =4.46 ve df 3 =k 3 =4 ve df 2 =k için Ek 3'teki istatistiksel tablolardan F kritiğini belirleyelim. 2 = 8 F kritik_ifade =3,84

9. F em_fact> F kritik_gerçek (6,872>4,46), dolayısıyla p alternatif hipotez kabul edilir.

10. F em_use < F крит_исп (1,054<3,84), следовательно пSıfır hipotezi kabul edilir.

Çözüm:Farklı koşullarda sözcük yeniden üretim hacmindeki farklılıklar, rastgele nedenlerden kaynaklanan farklılıklardan daha belirgindir (p<0,05).Индивидуальные различия между испытуе­мыми являются не более выраженными, чем различия, обусловленные случайными причинами.

7.2 Korelasyon analizi

7.2.1 Korelasyon kavramı

Bir araştırmacı genellikle incelenen bir veya daha fazla örnekte iki veya daha fazla değişkenin birbiriyle nasıl ilişkili olduğuyla ilgilenir. Örneğin, kaygı düzeyi yüksek olan öğrenciler istikrarlı bir akademik başarı sergileyebilir mi, yoksa bir öğretmenin okulda çalıştığı süre maaşının büyüklüğüyle mi, yoksa öğrencilerin zihinsel gelişim düzeyiyle - onların matematik veya edebiyat vb. alanlardaki performans?

Değişkenler arasındaki bu tür bağımlılığa korelasyon veya korelasyon denir. Korelasyon bağlantı- Bu, bir özelliğin değişkenliğinin diğerinin değişkenliğine uygun olduğu gerçeğini yansıtan, iki özellikteki koordineli bir değişikliktir.

Örneğin insanların boyu ile kiloları arasında ortalama olarak pozitif bir ilişki olduğu ve boy arttıkça kişinin kilosunun da arttığı bilinmektedir. Bununla birlikte, nispeten kısa kişilerin aşırı kilolu olduğu ve tam tersine, yüksek boylu astenik kişilerin düşük kilolu olduğu bu kuralın istisnaları vardır. Bu tür istisnaların nedeni, her biyolojik, fizyolojik veya psikolojik işaretin birçok faktörün etkisiyle belirlenmesidir: çevresel, genetik, sosyal, çevresel vb.

Korelasyon bağlantıları, yalnızca matematiksel istatistik yöntemleri kullanılarak temsili örnekler üzerinde çalışılabilen olasılıksal değişikliklerdir. "Her iki terim de" diye yazıyor E.V. Sidorenko, - korelasyon bağlantısı ve korelasyon bağımlılığı- genellikle eşanlamlı olarak kullanılır. Bağımlılık etkiyi, bağlantıyı, yani yüzlerce nedenden dolayı açıklanabilecek her türlü koordineli değişikliği ima eder. Korelasyon bağlantıları neden-sonuç ilişkisinin kanıtı olarak değerlendirilemez; yalnızca bir özellikteki değişikliklere genellikle diğerindeki belirli değişikliklerin eşlik ettiğini gösterir.

Korelasyon bağımlılığı - bunlar, bir özelliğin değerlerini başka bir özelliğin farklı değerlerinin ortaya çıkma olasılığına sokan değişikliklerdir (E.V. Sidorenko, 2000).

Korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü (pozitif veya negatif) ve formunu (doğrusal, doğrusal olmayan) belirlemek, yakınlığını ölçmek ve son olarak elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmekten ibarettir.

Korelasyonlar değişiklik gösterir biçim, yön ve derece (kuvvet) bakımından.

Şekline görekorelasyon ilişkisi doğrusal veya eğrisel olabilir. Örneğin, simülatördeki eğitim oturumlarının sayısı ile kontrol oturumundaki doğru çözülmüş problemlerin sayısı arasındaki ilişki basit olabilir. Örneğin motivasyon düzeyi ile bir görevin etkinliği arasındaki ilişki eğrisel olabilir (bkz. Şekil 1). Motivasyon arttıkça, önce bir görevi tamamlamanın etkinliği artar, daha sonra görevi tamamlamanın maksimum etkinliğine karşılık gelen optimum motivasyon düzeyine ulaşılır; Motivasyondaki daha fazla artışa verimlilikte bir azalma eşlik eder.

Şekil 1. Bir problemi çözmenin etkinliği arasındaki ilişki

ve motivasyon eğiliminin gücü (J.W.A'ya göre) t k oğlu, 1974, s 200)

Karşıkorelasyon pozitif (“doğrudan”) ve negatif (“ters”) olabilir. Pozitif doğrusal korelasyonda, bir özelliğin daha yüksek değerleri diğerinin daha yüksek değerlerine karşılık gelir ve bir özelliğin daha düşük değerleri diğerinin düşük değerlerine karşılık gelir. Negatif korelasyon durumunda ilişkiler tersine döner. Pozitif bir korelasyonda korelasyon katsayısı pozitif bir işarete sahiptir; örneğinr =+0,207, negatif korelasyonla - örneğin negatif bir işaretler = -0,207.

Derece, kuvvet veya sıkılık Korelasyon bağlantısı korelasyon katsayısının değeri ile belirlenir.

Bağlantının gücü yönüne bağlı değildir ve korelasyon katsayısının mutlak değeri ile belirlenir.

Korelasyon katsayısının mümkün olan maksimum mutlak değerir =1,00; minimum r =0,00.

Korelasyonların genel sınıflandırması (Ivanter E.V., Korosov A.V., 1992'ye göre):

güçlü, veya sıkı korelasyon katsayısı iler>0,70;

ortalama en 0,50< R<0,69 ;

ılıman en 0,30< R<0,49 ;

zayıf en 0,20< R<0,29 ;

çok zayıf en R<0,19 .

X ve Y değişkenleri farklı ölçeklerde ölçülebilir; uygun korelasyon katsayısının seçimini belirleyen şey budur (bkz. Tablo 3):

Tablo 3. Değişken türüne göre korelasyon katsayısının kullanımı

Ölçek türü

Bağlantı ölçüsü

Değişken X

Değişken Y

Aralık veya ilişki

Aralık veya ilişki

Pearson katsayısı

Sıra, aralık veya oran

Mızrakçı katsayısı

Dereceli

Dereceli

Kendall katsayısı

İkili

İkili

Katsayısı "j"

İkili

Dereceli

Sıra-iki serili

İkili

Aralık veya ilişki

İki serili

7.2.2 Pearson korelasyon katsayısı

"Korelasyon" terimi, 1886'da seçkin İngiliz doğa bilimci Francis Galton tarafından bilime tanıtıldı. Bununla birlikte, korelasyon katsayısını hesaplamak için kesin formül, öğrencisi Karl Pearson tarafından geliştirildi.

Katsayı, genellikle X ve Y simgeleriyle gösterilen, özellikler arasında yalnızca doğrusal bir ilişkinin varlığını karakterize eder. Korelasyon katsayısının hesaplanmasına yönelik formül, özellikler arasındaki ilişki doğrusalsa Pearson katsayısının doğru bir şekilde hesaplanacağı şekilde oluşturulur. Bu ilişkinin yakınlığı. Bu nedenle Pearson doğrusal korelasyon katsayısı olarak da adlandırılır. X ve değişkenler arasındaki bağlantı ise e doğrusal olmadığı için Pearson bu bağlantının yakınlığını değerlendirmek için korelasyon ilişkisini önerdi.

Pearson doğrusal korelasyon katsayısının değeri +1'i aşamaz ve -1'den küçük olamaz. Bu iki sayı +1 ve -1 korelasyon katsayısının sınırlarıdır. Hesaplama +1'den büyük veya -1'den küçük bir değerle sonuçlandığında hesaplamalarda bir hata oluşmuştur.

Korelasyon katsayısının işareti ortaya çıkan ilişkinin yorumlanması açısından oldukça önemlidir. Doğrusal korelasyon katsayısının işareti artı ise, ilişkili özellikler arasındaki ilişkinin, bir özelliğin (değişken) daha büyük bir değerinin, başka bir özelliğin (başka bir değişken) daha büyük bir değerine karşılık gelecek şekilde olduğunu bir kez daha vurgulayalım. Yani bir gösterge (değişken) artarsa ​​diğer gösterge (değişken) de buna bağlı olarak artar. Bu bağımlılığa doğrudan orantılı bağımlılık denir.

Eksi işareti alınırsa, bir özelliğin daha büyük değeri diğerinin daha küçük değerine karşılık gelir. Yani eksi işareti varsa bir değişkendeki (işaret, değer) artış diğer değişkendeki azalmaya karşılık gelir. Bu bağımlılığa ters orantılı bağımlılık denir.

Genel olarak korelasyon katsayısını hesaplama formülü şöyledir:

(7)

Nerede X Ben- X örneğinde alınan değerler,

sen ben- Y örneğinde kabul edilen değerler;

X için ortalama, - Y için ortalama.

Pearson korelasyon katsayısının hesaplanması, X ve Y değişkenlerinin dağıtıldığını varsayar İyi.

Formül (7) miktarı içerir bölündüğünde N (X veya Y değişkeninin değer sayısı) denir kovaryans. Formül (7) ayrıca korelasyon katsayılarını hesaplarken X değişkeninin değer sayısının değişkenin değer sayısına eşit olduğunu varsayar. Y.

Serbestlik derecesi sayısı k = n -2.

Örnek 3. 10 okul çocuğuna görsel-figüratif ve sözel düşünme testleri uygulandı. Test görevlerini çözmek için geçen ortalama süre saniye cinsinden ölçüldü. Araştırmacı şu soruyla ilgileniyor: Bu sorunların çözülmesi için geçen süre arasında bir ilişki var mı? Değişken X, görsel-figüratif görevlerin çözülmesi için geçen ortalama süreyi, Y değişkeni ise sözel test görevlerinin çözülmesi için geçen ortalama süreyi belirtir.

Çözüm. Formül (7)'yi kullanarak hesaplama için gerekli ek sütunları içeren başlangıç ​​verilerini Tablo 4 biçiminde sunalım.

Tablo 4

Konu sayısı

X

x ben -

(x ben - ) 2

sen ben -

(y ben -) 2

16,7

278,89

51,84

120,24

13,69

17,2

295,84

63,64

7,29

51,84

19,44

68,89

14,44

31,54

59,29

7,84

21,56

0,49

46,24

4,76

10,89

17,64

13,86

10,89

51,84

23,76

68,89

10,8

116,64

89,64

68,89

18,8

353,44

156,04

Toplam

357

242

588,1

1007,6

416,6

Ortalama

35,7

24,2

Korelasyon katsayısının ampirik değerini formül (7) kullanarak hesaplıyoruz:

Elde edilen korelasyon katsayısı için kritik değerleri Ek 3'teki tabloya göre belirliyoruz. Hesaplanan Pearson doğrusal korelasyon katsayısı için kritik değerler bulunurken serbestlik derecesi sayısı k = olarak hesaplanır. n – 2 = 8.

k crit = 0,72 > 0,54, dolayısıyla H 1 hipotezi reddedilir ve hipotez kabul edilir H 0 yani görsel-figüratif ve sözel test görevlerini çözme süresi arasındaki bağlantı kanıtlanmamıştır.

7.3 Regresyon analizi

Bu, rastgele değişkenlerden oluşan bir sistemde meydana gelen değişiklikleri ve bağımlılıkları tanımlamayı ve matematiksel olarak ifade etmeyi amaçlayan bir grup yöntemdir. Eğer böyle bir sistem pedagojik bir sistemi modelliyorsa, o zaman sonuç olarak regresyon analizi yoluyla psikolojik ve pedagojik olgular ve aralarındaki bağımlılıklar tanımlanır ve matematiksel olarak ifade edilir. Bu fenomenlerin özellikleri farklı ölçeklerde ölçülür ve bu da öğretmen-araştırmacı tarafından incelenen değişikliklerin ve bağımlılıkların matematiksel ifade yollarına kısıtlamalar getirir.

Regresyon analizi yöntemleri öncelikle denemeden denemeye değişikliklerin yalnızca bağımsız denemeler şeklinde ortaya çıktığı istikrarlı bir normal dağılım durumu için tasarlanmıştır.

Regresyon analizinin çeşitli biçimsel sorunları tanımlanmıştır. Formülasyon, matematiksel araçlar ve emek yoğunluğu açısından basit veya karmaşık olabilirler. Ana olanlar gibi görünenleri listeleyip örneklerle ele alalım.

İlk görev değişkenlik gerçeğini tanımlayın belirli, ancak her zaman açıkça sabitlenmemiş koşullar altında incelenen fenomen. Önceki derste bu problemi parametrik ve parametrik olmayan kriterleri kullanarak zaten çözmüştük.

İkinci görev - bir trend tanımlamak bir karakteristikte periyodik bir değişiklik olarak. Bu özelliğin kendisi durum değişkenine bağlı olabilir veya olmayabilir (araştırmacı tarafından bilinmeyen veya kontrol edilemeyen koşullara bağlı olabilir). Ancak bu, yalnızca eğilimin ve onun özelliklerinin tanımlanmasıyla sınırlı olan, söz konusu görev için önemli değildir.

Bir eğilimin yokluğuna veya varlığına ilişkin hipotezlerin test edilmesi Abbe kriteri kullanılarak yapılabilir. . Abbe kriteri 4 için oluşturulan ortalama değerlerin eşitliğine ilişkin hipotezleri test etmek için tasarlanmıştır

Abbe kriterinin ampirik değeri aşağıdaki formülle hesaplanır:

(8)

örneğin aritmetik ortalaması nerede;

P– numunedeki değerlerin sayısı.

Kritere göre, istatistiğin değeri .8 ise ortalamaların eşitliği hipotezi reddedilir (alternatif hipotez kabul edilir). İstatistiğin tablo (kritik) değeri, kısaltmalarla birlikte L.N.'nin kitabından ödünç alınan Abbe'nin q kriteri tablosundan belirlenir. Bolysheva ve N.V. Smirnova (bkz. Ek 3).

Abbe kriterinin geçerli olduğu miktarlar, normale yakın olmaları (veya daha önce normalize edilmiş olmaları) halinde numune payları veya yüzdeleri, aritmetik ortalamalar ve numune dağılımlarının diğer istatistikleri olabilir. Bu nedenle Abbe kriteri psikolojik ve pedagojik araştırmalarda geniş uygulama alanı bulabilir. Abbe kriterini kullanarak bir trend belirleme örneğini ele alalım.

Örnek 4.Masada 5 öğrenci yüzdesinin dinamiklerini gösterir IV Üniversitenin fakültelerinden birinde 10 yıl çalıştığı süre boyunca kış oturumlarında sınavları “mükemmellik” ile geçenlerin akademik performansı artırma eğiliminin olup olmadığının tespit edilmesi gerekmektedir.

Tablo 5. Fakültede 10 yıllık çalışma süresi boyunca dördüncü sınıftaki mükemmel öğrencilerin yüzdesinin dinamiği

Akademik yıl

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

Gibi hükümsüz Bir eğilimin yokluğuna, yani yüzdelerin eşitliğine ilişkin hipotezi test ediyoruz.

Tabloda verilen yüzdelerin ortalamasını alıyoruz. 5'ten =21.5'i buluyoruz. Örnekteki sonraki ve önceki değerler arasındaki farkları hesaplıyoruz, karelerini alıyoruz ve özetliyoruz:

Benzer şekilde, her ölçüm ile aritmetik ortalama arasındaki farkların karelerini toplayarak formül (8)'deki paydayı hesaplar:

Şimdi formül (8)'i kullanarak şunu elde ederiz:

Ek 3'teki Abbe kriter tablosunda, n = 10 ve 0,05 anlamlılık düzeyi ile kritik değerin elde ettiğimiz 0,41'den büyük olduğunu, dolayısıyla "mükemmel öğrencilerin" yüzdesinin eşitliğine ilişkin hipotezin şu şekilde olması gerektiğini görüyoruz: reddedilir ve bir eğilimin varlığına ilişkin alternatif hipotezi kabul edebiliriz.

Üçüncü görev ise korelasyon denklemi biçiminde ifade edilen bir modeli belirleme (regresyon).

Örnek 5.Metni anlamanın zorluklarını inceleyen Estonyalı araştırmacı J. Mikk, çoklu doğrusal regresyon olan bir "okunabilirlik formülü" oluşturdu:

Metnin anlaşılmasının güçlüğünün değerlendirilmesi,

burada x 1, yazdırılan karakter sayısındaki bağımsız cümlelerin uzunluğudur,

x 2 - farklı yabancı kelimelerin yüzdesi,

x 3 - isimlerle ifade edilen tekrarlanan kavramların soyutluğu .

Faktörlerin etki derecesini ifade eden regresyon katsayıları karşılaştırıldığında, bir metni anlamanın zorluğunun öncelikle onun soyutluğu tarafından belirlendiği görülebilir. Metni anlamanın zorluğu, bilinmeyen kelimelerin sayısına yarısı kadar (0,27) bağlıdır ve pratikte cümlenin uzunluğuna hiç bağlı değildir.