Yapısal eşitlik modelleme (YEM, İnglizcesi structural equation modeling) gözlenen (içsel, endogeneous) ve gözlenemeyen (dışsal, latent, exogeneous) değişkenler arasındaki nedensel ilişkilerin sınanmasında kullanılan kapsamlı bir istatistiksel tekniktir. Özellikle ekonometri, psikoloji, sosyoloji, pazarlama ve eğitim bilimlerinde değişkenler arasındaki ilişkilerin değerlendirilmesinde ve kuramsal modellerin sınanmasında kullanılan sistemli bir araçtır. YEM gizil (gözlenemeyen, kavram) değişkenler seti arasında bir nedensellik yapısının var olduğunu ve gizil değişkenlerin gözlenen değişkenler aracılığıyla ölçülebildiğini varsayar.
Gizil değişkenler YEM’in en önemli kavramlarından biridir ve araştırmacıların gerçekte ilgilendikleri zeka, güdü, duygu, tutum gibi soyut kavramlara ya da psikolojik yapılara karşılık gelir. Bu yapılara ancak dolaylı olarak belirli davranışlar ya da göstergeler temelinde ölçülen değişkenler yardımıyla gözlenebilir. Psikoloji, sosyoloji, eğitim, ekonomi ve pazarlama gibi çoğu alanda asıl ilgilenilen kavramların doğrudan ölçülmesi bazen mümkün
olmaz. Psikolojide, kişinin kendine bakış açısı ve motivasyon; sosyolojide, çaresizlik ve huzursuzluk; eğitimde sözlü yetenek ve eğiticinin beklentisi; ekonomi de ise davranışlar, müşteri memnuniyeti, kalitenin algılanışı gibi kavramlar gizil değişkenlere örnek olarak
verilebilir. Sözü edilen gizil değişkenler gözlenemediği için doğrudan ölçülemezler. Bu yüzden, araştırmacı, gizil değişkeni işlemsel olarak tanımlamak için varsayılan yapı açısından gizil değişkeni gözlenebilir değişkenlerle ilişkilendirmek zorundadır. YEM, içsel (bağımlı, endogenous) yapıların dışsal (bağımsız, exogenous) yapılara nasıl bağlı olduğunu betimleyen bir ya da daha fazla doğrusal regresyon eşitliklerini içerir. Bu eşitliklerin çözümlenmesi sonucu bulunan bu katsayılara, path (ölçüm modeli) katsayıları ya da çoğu zaman regresyon tartıları denir. Unutulmaması gereken bir husus, YEM'de bir değişkenin regresyondan farklı olarak hem bağımsız, hem de bağımlı değişken olabilmesidir. Bu nedenle sadece bir değişkenin bağımlı olabildiği regresyon analizi YEM'in özel bir durumudur.
YEM'de model 2 parçalıdır. İlki gözlenmeyen değişkenler arasındaki potansiyel nedensel ilişkileri gösteren yapısal model (structural model), diğeri de gözlenen ve gözlenmeyen değişkenler arasındaki ilişkileri gösteren ölçüm modelidir (measurement model). Açıklayıcı ve doğrulayıcı faktör analizi YEM'in yalnız ölçüm modeli kısmını kapsarken, kavramların birbirini nasıl etkilediğini araştıran path analiziyse yalnız yapısal modele sahip bir YEM olarak görülebilir. Bu nedenle bu yöntemler de YEM'in özel durumlarıdır.
YEM analizi yapılırken ölçüm modelindeki regresyon katsayılarından bazıları modeldeki katsayıların doğru ölçeklenmesi adına bire sabitlenirken, diğerleri serbestçe tahmin edilir. YEM'de asıl önemli olan standartlaştırılmış ölçüm modeli katsayılarının birden küçük olmasıdır. Eğer bir standartlaştırılmış regresyon katsayısı birden büyükse, ilgili gözlenen değişkenin hata varsansı sıfırdan küçük olur. Literatürde Heywood durumu denen bu istenmeyen olay veride uçdeğerin (outlier) varlığı, modelin bir çözüme yakınsayamaması (nonconvergence), modelin eksik tanımlanması (underidentification), modelin yanlış tanımlanması (structurally misspecified model) veya örneklemedeki değişimler (sampling fluctuations) gibi olası hatalardan kaynaklanır. Bunu çözmek için verideki uçdeğerlerin silinmesi, modelde tahmin edilecek parametre sayısının artırılması, modellemede düzeltmeye gitme, katsayıları 0, artı sonsuz aralığında sınırlama ve önyüklemeyle (bootstrapping) veriden belirlenen bir sayıda örneklem alarak YEM yapma gibi çözümlere başvurulur.
Genellikle LISREL (Lineer Structural Equations), eskiden Smallwaters ve SPSS'e aitken 2009'da IBM'ce satın alınan AMOS (Analysis of Moment Structures), EQS ve Mplus gibi programlarla yapılabilen YEM'de parametre tahmini değişkenler arasındaki ilişkileri temsil eden mevcut kovaryans matrisiyle en iyi uyuma sahip modelin kovaryans matrisinin karşılaştırılmasına dayanır. Parametre tahmininde genellikle en çok olabilirlik (ML, Maximum likelihood) kullanılır. Ancak verinin büyüklüğüne, kullanılan yazılıma ve verinin çoklu normal dağılıma (Multivariate normal distribution) uyup uymadığına göre ağırlıklı en küçük kareler (WLS, Weighted least squares), genelleştirilmiş en küçük kareler (GLS, Generalized least squares), ağırlıksız en küçük kareler (ULS, Unweighted least squares), çaprazlama ağırlıklı en küçük kareler (DWLS, Diagonally weighted least squares), sağlam (Robust), asimptotik olarak dağılımdan bağımsız (ADF, Asymptotically distribution-free) gibi tahmin yöntemleri de kullanılabilir.
YEM modellerini değerlendirmek için birçok ölçü vardır. Bunlar Ki-Kare, Akaike bilgi ölçütü (AIC, Akaike information criterion), yaklaşık hataların ortalama karekökü (RMSEA, Root Mean Square Error of Approximation), ortalama hataların karekökü (RMR, Root mean square residuals), standartlaştırılmış ortalama hataların karekökü (SRMR, Standardized root mean square residuals), göreli uyum indeksi (CFI, Comparative fit index), iyilik uyum indeksi (GFI, Goodness of fit index) gibi uyum ölçüleri kullanılır.
Ki-Kare/Modelin serbestlik derecesi (df)< 3 Model veriye çok iyi uyum gösteriyor anlamına gelir. Üçle beş arası iyi uyum anlamına gelir. Beşten yukarısı modelin veriye uyumu kötüdür.
RMSEA 0.05'ten küçükse çok iyi model uyumu vardır. 0.05-0.08 arasında iyi model uyumu vadır. 0.08'den büyükse modelin uyumu kötüdür.
CFI ve GFI 0.90'dan küçükse model uyumu kötüdür. 0.09-0.95 arasında iyi model uyumu vardır. Bu indeksler 0.95'ten büyükse çok iyi model uyumu vardır.
AIC, olası modeller karşılaştırılırken kullanılır. En küçük AIC'ye sahip model, en uygun model olarak seçilir.
YEM'in basitten karmaşığa başlıca uygulama alanları şöyledir:
1) Basit ve çoklu regresyon
2) Açıklayıcı etken analizi
3) Doğrulayıcı etken analizi
4) Path analizi
5) Çoklu grup karşılaştırması (Multiple group comparison)
6) Değişmezlik (Invariance) analizi (Gruplar arasında)
7) Gelişim eğrisi analizi (Growth curve analysis, bu konu literatürde ayrıca örtük gelişim modeleleme anlamında latent growth modeling olarak ta geçmekte)
8) Çoklu özellik çoklu-grup analizi (Multi-trait multi-method analysis)
9) Sağlam sonuç çıkarımı (Robust inference, burada kategorik ve sürekli değişkenlere WLS yoluyla YEM uygulanıyor)
10) Hiyerarşik yani çok aşamalı modeller ve madde yanıt kuramı (item response theory) modellerle ilişkiler
11) Örtük sınıf analizi (LCA, Latent class analysis): Bu analize literatürde karışım modeli (mixture model) de denmekte.
12) Bayesgil (Bayesian) YEM
Oh ! Nihayet ileri istatistik konularını (zaman serisi analizi ve yapısal eşitlik modelleme) bitirdim.
Not: Yukarıdaki başlıca YEM kullanım alanlarından ilk dördünü biliyorum. Daha sonra gruplar arası yapılan çoklu grup karşılaştırması ve değişmezlik analizlerini de öğrenmeyi planlıyorum.