- Oyunun formuna, normalliğine ve büyüklüğüne göre Pearson, Spearman veya Kendall'ı seçin.
- Çeşitli kategorilerde chi-quadro/Fisher kullanılır ve Cramer veya φ ile farklı ilişkiler kurulur.
- Valuta confondenti con correlazione parziale ve analizi grafikler ve teşhislerle destekler.
- Cebir ilişkisi (insiemi, funzioni, composizione), veri tabanındaki kalemi ve uygulamayı yapılandırır.

Değişkenlik nedeniyle yasal türün türünü öğrenin İstatistiksel uygulamalarda en sık karşılaşılanlardan biri de verilerden ve deneysel testlerden elde edilen verilerdir ve nicel. Diğer yol ise ilişki doğrusaldır ve her zaman cogliere'nin bir parçasıdır, geriye doğru diğer yol ise monotondur ama doğrusal değildir, eşanlamlı kategori ve non numeri, çapa, acque'yi bağlayan üçüncü bir değişkene bağlıdır: insomma, non è una passeggiata.
İtalyanca olan bu pratik ve teorik rehberde, bunu organik modda tartışıyoruz Değişkenlik nedeniyle matematiksel ilişkilerin ana ipucu, görsel olarak nasıl teşhis konulacağı ve resmi test ile, kullanılan nitel katsayılar (Pearson, Spearman, Kendall), kategorik değişkenlerle nasıl değiştirileceği (chi-quadro di indipendenza, test esatto di Fisher, V di Cramér, katsayılar di contingenza, phi), nasıl misurare l'accordo Kappa ile çalışmak ve onu nasıl yöneteceğiniz variabili di confundimento parziale korelasyonunu işleyeceğiz. Ayrıca, güneydeki bir finestra'yı geliştireceğiz.algebra delle relazioni (siyemistik ve hesaplamalı anlamda), alan, kompozisyon, ters ve işlevler gibi formalizzare concetti için esaslar.
Değişkenlik nedeniyle "relazione" ile neyi amaçlıyoruz?
Matematik dilinde, A ve B arasındaki ilişki A×B Kartezyen ürününün özeti: ogni coppia ordinata (a, b) appartenente a R, a di A öğesinin b di B öğesiyle “ilişkili” olduğunu belirtir. deterministik bir ilişki (fonksiyon) olası olasılık (associazione stochastica): ilk durumda ad ogni a karşılık gelen esattamente una b, ikinci durumda osserviamo una eğilim (più veya daha az güçlü) ve yasal olmayan uno-a-uno.
İlişkilerin tüm 'içsel cebiri' (siemistik anlamda) ilginçtir yansıtma (kendisine göre ogni a è), Simmetria ((a, b) (b, a) anlamına gelir), antisimetri (eğer (a, b) ve (b, a) ise a = b) ve geçişkenlik ((a, b) ve (b, c)'den (a, c) çıkar). Bu önemli mülk sahibi: eğer bir ilişki simetrikse, simetrik ve geçişliyse bir olur relazione di equivalenza eşdeğer öğe sınıfında "partiziona" A bulunur. Eğer invece keskin, antisimetrik ve geçişli ise, biz onu abbiamo ilişki.
Bu analizimizde bu fikri pratiğe döküyoruz: değişkenlik türünü değerlendiriyoruz (nicel devam, ordinali, nominali/dicotomiche) ve orada bu istatistikte sıralama ve "ilişki"nin her zaman "neden-sonuç" anlamına gelmediğini bilerek, ilişkiyi düzeltmek için yeterli araçlara sahip olun.
Görsel ispezione: Riconoscere desenini ve yönünü yiyin
Prima di buttarsi nei numeri, un dağılım grafiği Bu, en zeki şeyin ağırlığıdır. Düz bir çizgi boyunca uzanan bir bulut, doğrusal ilişki (pozitif veya negatif); gösterge eğrisini yapılandırın doğrusal olmayan ilişkiler (ma magari monoton). Bir kalıbı içselleştirmezseniz, doğrusal ilişki rızayı bozabilir.
Çok az değişkenlikle, dağılım grafiğini (ve örneğin R'de) çizdim çiftler(dati)) ve smussate olma eğiliminde olan çizgi (ggplot2'de geom_smooth), böylece not edebilirsiniz dernekler, küme ve aykırı değer. Dikkat: gli aykırı değer Podeno influenzare moltissimo ve katsayıları, tür Pearson.
Örneğin R'de şöyle başlayabilirsiniz: çiftler(dati)
# Matrice di grafici a dispersione
pairs(dati)
# Correlazioni grezze (matrice)
cor(dati, use = "pairwise.complete.obs")
Sayıya göre ilk görsel tarama, Scegliere il test giusto'ya gidin biçim, monotonluk ve doğrusallık esasına dayanmaktadır.
Normalliğini kontrol edin: Davvero'ya servis yaparken
Çok sayıda test parametresi (Pearson testinin bir örneği) Değişen derecelerde varsayıyorum, normallik Almeno, yoğun kod içermeyen simetrik bir yapıdır. Ipotesi'yi kontrol etmek için grafik yapının belirli bir kısmı kullanılır. istogrammi con densità e QQ-komplosu.
R'de, una minimum pil şunları içerebilir:
# Istogrammi con densità e curva normale sovrapposta
par(mfrow = c(2, 2))
plot_hist <- function(x) {
hist(x, prob = TRUE)
lines(density(x), col = "red")
curve(dnorm(x, mean(x), sd(x)), add = TRUE, col = "blue")
}
plot_hist(dati$GASTEDU)
plot_hist(dati$GASAUDE)
plot_hist(dati$GASLAZER)
plot_hist(dati$IDADE)
Nicel gözlemleri normal bir standartla karşılaştırmak için, QQ-komplosu è insostituibile:
par(mfrow = c(2, 2))
qqfun <- function(x) {
qqnorm(x, main = "", xlab = "Quantili teorici N(0,1)", pch = 20)
qqline(x, col = "red", lty = 1)
}
qqfun(dati$IDADE)
qqfun(dati$GASAUDE)
qqfun(dati$GASLAZER)
qqfun(dati$GASTEDU)
Kullanamazsam göz önünde bulundururum test formali di normalità birikim kanıtı başına: parametre tahminleriyle Kolmogorov–Smirnov, Lilliefors, Cramér–von Mises, Shapiro–Wilk, Shapiro–Francia, Anderson–Darling ve normal Pearson (chi-quadro) testi.
normalita <- function(x) {
t1 <- ks.test(x, "pnorm", mean(x), sd(x)) # Kolmogorov–Smirnov
t2 <- nortest::lillie.test(x) # Lilliefors
t3 <- nortest::cvm.test(x) # Cramér–von Mises
t4 <- shapiro.test(x) # Shapiro–Wilk
t5 <- nortest::sf.test(x) # Shapiro–Francia
t6 <- nortest::ad.test(x) # Anderson–Darling
t7 <- PearsonDS::pearson.test(x) # Pearson chi-quadro di normalità
pv <- c(t1$p.value, t2$p.value, t3$p.value, t4$p.value, t5$p.value, t6$p.value, t7$p.value)
data.frame(p_value = pv, row.names = c(t1$method, t2$method, t3$method, t4$method, t5$method, t6$method, t7$method))
}
normalita(dati$GASAUDE)
Eğer normal bir şekilde etrafta dolaşırsam ve ilişki doğrusal olursa, Pearson katsayısı iyi bir Kelt kuzenidir; aksi takdirde basate sui ranghi'yi Spearman veya Kendall ile karıştırmayı tercih etmek akıllıca olacaktır.
Nicel değişkenlik arasındaki ilişki: kovaryans ve korelasyon
La kovaryans Sorun kovaryanstır depende dall'unità di misura, quindi è poco comparabile.
La Pearson doğrusal korelasyonu Sorunu standart sapmaya göre standartlaştırarak çözün: katsayı r -1 ile 1 arasında değişir ve ±1'e kadar bir değer verir. forte relazione lineare (pozitif veya negatif) ve 0 doğrusallığın doğruluğunu belirtir. Lütfen aklınızda bulundurun: r = 0 doğrusal olmayan ilişkileri dışlamaz.
Calcoli per correlazioni R'de:
# Coefficiente di Pearson e test di significatività
cor(dati$GASTEDU, dati$GASAUDE, method = "pearson")
cor.test(dati$GASTEDU, dati$GASAUDE, method = "pearson")
Quando la relazione è monotona ma non lineare veya normal uyumadığımda (veya aykırı değeri içermediğimde) kullanmanın bir anlamı var mızrakçı (ranghi; sağlam ve medio-grandi campioni'ye uyarlanmış) Kendall τ (basato su concordanze/discordanze; tercih edilebilir su küçük şampiyonlar (veya çok sayıda pareggi ile):
# Correlazioni non parametriche
cor.test(dati$GASTEDU, dati$GASAUDE, method = "spearman")
# Su un sottoinsieme più piccolo, meglio Kendall
dati2 <- head(dati, 20)
cor.test(dati2$IDADE, dati2$GASAUDE, method = "kendall")
Un'idea usefule: belirleme katsayısı R² di un modello lineare semplice Y spiegata'nın değişken payını X'ten doğrusal olarak geri yükler. R'de:
summary(lm(GASAUDE ~ ESTCIVIL, data = dati))$r.squared
Değişkenlik başına ikilik vs niceliksel, katsayı nokta-çift serili 0/1 kodlanmış değişkenli Pearson hesaplamasıyla örtüşmektedir; pratikte, renk (ikili, nicel) con metodu = “pearson”.
Değişken kategoriler: indipendenza, çağrışımın gücü ve piccoli campioni
Uyku değişkenliği devreye girdiğinde nominali od ordinali, la relazione si studia con tabelle di contingentza (sıklıkla doppia sınıflandırmasıyla). Tipik ipotesi şu şekildedir: H0 = bağımsız (gerekli ilişki), kontrol H1 = dipendenza.
Il test di riferimento è il chi-quadro di indipendenza. Se ci sono frequenze attese troppo basse (genellikle < 5), eğer kullanırsanız Yates'in düzeltmesi per 2×2 o si passa al test esatto di Fisherözellikle campioni piccoli ile belirtilir.
# Tabella incrociata e chi-quadro
xtabs(~ PROFI + ESTCIVIL, data = dati) -> tab1
chisq.test(dati$PROFI, dati$ESTCIVIL) # p-value non significativo => indipendenza plausibile
# Campioni piccoli: test di Fisher
chisq.test(dati$PROFI, dati$RENDA)
fisher.test(dati2$PROFI, dati2$RENDA)
Per quantcare yoğunlaştırılmış ilişki in tabelle I×J si usano: V di Cramér (0-1), coefficiente di contingentza (0–1, sınırlama) ve 2×2 il'de phi (φ), bu resmi olarak bir Pearson uygulaması alla tabella ikilisidir.
# Misure di associazione per tabelle
library(vcd)
xtabs(~ PROFI + RENDA, data = dati) -> tab2
assocstats(tab2) # riporta V di Cramér, coeff. di contingenza e test
# Attenzione: cor() su codifiche numeriche di categorie non è equivalente a φ in generale
Se l'intersse è confrontore gruppi nicel değişkenliği (örn. meslek başına reddito), eğer valutano ise testi yapmak, ANOVA Parametrik olmayan, riskli bir alternatif, aralıklı gizlilik yok. Genel olarak, değişkenlik türü ve yöntemde tutarlılık kritik.
Değerlendiren kişi: Cohen Kappa
Vadesi gelmiş (veya più) giudici kategoride hiçbir gli stessi oggetti'yi sınıflandırmadığında, anlaşma yüzdesini karıştırmak yeterli değildir, perché a quota può essere dovuta al durum. Kappa di Cohen rastgele anlaşma için doğru anlaşmayı nicelleştirir: Her durum için anlaşmayı gösteren 0'a kadar değer verdim, maggiori suggeriscono değerini verdim büyüyen anlaşma (toplu yorum: Scarso, sağduyulu, moderato, buono, molto buono).
Mümkün olan bir uyarım var versione ponderata (sıralı kategori başına):
set.seed(1)
val1 <- sample(0:1, 10, replace = TRUE)
val2 <- sample(0:1, 10, replace = TRUE)
# Kappa non ponderato
fmsb::Kappa.test(val1, val2)
Kategori doğal bir düzen değilse (ad empio, lieve/moderata/severa), Kappa poserato penalizza minör anlaşmazlıkta "vicini" ve più quelli "lontani", sonuçta spesso più bilgilendirici olur.
İlişki ve Karışıklık Çeşitleri: Bazı Korelasyonlar
X ve Y'nin çok sayıda korelasyona sahip olması gerekir, ancak gerçek anlamda bu ilişkinin gücü birdir. variabile di confundimento Z Entrabe ile ilişkilendirildi. Soru şu ki, üzerine tıklarsanız kısmi korelasyon tra X ve Y Z başına kontrol edilir.
R'de, ggm::pcor ile ilk sıradaki korelasyonu düzeltin ve anlamlılığı test edin. Karşılaştırmak faydalıdır klasik r e r parziale kişi başına Z "spiega" del legam grezzo olarak.
library(ggm)
# Correlazione parziale tra GASLAZER e GASAUDE controllando GASTEDU
rp <- pcor(c("GASLAZER", "GASAUDE", "GASTEDU"), var(dati))
# Correlazione grezza
r <- cor(dati$GASLAZER, dati$GASAUDE)
# Test della correlazione parziale (1 variabile di controllo)
pcor.test(rp, 1, length(dati$GASAUDE))
# Confronto R^2 grezzo vs parziale
data.frame("Senza_controllo" = r^2, "Con_controllo" = rp^2)
Eğer spiegata kotası “crollas”sa, şimdi kontrol edin Z önemli bir müttefiktiKontrol değişkeni kategori (meslek) olduğunda, kategoriyi bir faktör olarak içeren benzer yaklaşımları veya modelleri kullanamam.
Korelasyonun kullanımında sınır ve iyi uygulama
Pearson katsayısı karışımı solo la linearitàİlişki doğrusal değilse (ikinci dereceden, bağımlı, logaritmik), güçlü bir bağımlılık varsa 0 pur ile sonuçlanabilir. mızrakçı, onu doğrusal olmayan bir modele dönüştürün.
Gli aykırı Sonucu çarpıtamam. Bu nedenle, öncelikle verileri izlemek, grafikler oluşturmak ve gerekirse aynı anda kapsamlı analizler yapmak veya sonuçların hassasiyetini doğrulamak kullanışlıdır.
Bir başka klasik: korelasyon ≠ nedensellik. Değişkenlik nedeniyle perché uyku gribini ilişkilendiremiyorum, yalnızca tesadüf veya ters bir mekanizmanın etkisi ile üçüncü bir şişmanlık verir. Hizmet deneysel, araçsal nedensel veya neden-sonuç ilişkisine uygun modellerdir.
İlişki türü: doğrusal, monoton, sıfır, kategorik
Nei casi misti (kantitatif vs ikili/nominale/ordinata) grup, korelasyon çift serili/nokta-iki serili veya arasındaki karşılaştırma testini geçer modelleri (Öngörülen faktörlerle örnek regresyon). Değişkenlikle entrarbe categoriali, eğer bir chi-quadro/Fisher'a bağlıysanız ve tüm ilişkinizin gücünden eminseniz.
Funzioni özel ilişkiler yiyor
bir işlev Bu, alanın bir öğesi başına, aşağıdakileri içeren bir ilişkidir: tam olarak bir unsur Kat mülkiyeti. Sonuç olarak, A'daki ogni a'nın ilk bileşenle bir volta ile karşılaştırıldığı bir A×B hikayesidir. Uykuyla ilgili cebirdeki diğer önemli işlemler: Birlik (R1 ∪ R2), kavşak (R1 ∩ R2), kompozisyon (R2 ∘ R1) ve tersine çevirmek (R^{-1}, (b, a)'da che scambbia ciascuna coppia (a, b)).
Bu mattoni concettuali tornano utili sia nella saf matematik (eşdeğer, sıra, eşdeğerlik sınıfı) uygulamada somut güvercin, ilişkilerin baştan sona resmileştirilmesine hizmet eder.
İlişkiler ve bilim cebirini verdim
Nel mondo dei database, l'ilişkisel cebir SQL'in teorik yapısı şöyledir: nasıl çalıştırılır seç, proiezione, join, unione ve intersezione İlişkisel işlem pratiğinin son versiyonu. Bu formalleştirme, işleri hızlı bir şekilde tanımlamak, optimize etmek ve değiştirmek için güçlü bir silahtır.
İçinde yapay zeka ve makine öğrenimi, konsensüs grafiklerinin oluşturulmasını mümkün kılan ilişkileri modelleme kapasitesi, yönlendirme sistemleri ve bütünleştirme boru hattı; Bu değer ekonomi, biyoistatistik ve sosyal bilimlerde geçerlidir, neredeyse her zaman "chi legato a chi'dir ve che modundadır anlayışının sonucu olarak, buzdolabında iki üç günden fazla durmayan küçük şişeler elinizin altında bulunur.
İnsiemi teorisindeki ilişkilerin klasik örnekleri
İlişkiler denklik: uyku tüfeksiz, simetrik ve geçişli. "Çözüm olarak bu değeri al" gibi örnekler gerçekten gerçektir veya uyum modu n İçsel olarak şunu önerdim: Ogni eşdeğerlik ilişkisi classi di equivalenza che ripartiscono l'insieme in blocchi disgiunti.
İlişkilerOrdine: tüfek, antisimetri ve geçişli. Örnekler: ≤ doğal sayılar, dahil etme ⊆ P(X)'in tüm parçaları veya doğal olarak “böl” (|). Tanıma göre Fondamentali uyku ordinamenti totali o parziali ve bölgeye göre massimi, minimi, catene ve antichains'leri vardır.
Sipariş azsikografik: dediğim buydu. Eleman eleman karşılaştıran bir dizideki (dizi, sayı) sıralamadır; bu yapıda önemli bir gürültü var ve algoritmaları ihmal ediyorum.
Bu bölüm, matematikte "relazione"nin bir kavram olduğunu anlamak için faydalıdır daha fazla ampio della sole korelasyonu: uguaglianze, ordini, kompozisyon ve çok daha fazlasını içerir; hepsi modellare system complessi için vazgeçilmezdir.
Pratik iş akışı: Sonuçları orada kontrol edin
Mümkün bir Flusso di lavoro böylece enstrümanı çaldığınızda ve nerede olduğunuzu kaybettiğinizde:
- Grafik inceleme: dağılım grafiği, yumuşatma, istogrammi, QQ grafiği. Occhio bir aykırı değer ve doğrusal olmayan bir biçim.
- Çekler: eğer işe yararsa, normalliği test edin; Doğrusal bir model öngörülürse Controlli di omoscedasticità.
- Scelta del coefficiente: Pearson (doğrusal, normal civarındaki veriler), Spearman/Kendall (monoton/normal olmayan/piccoli campioni).
- Kategorik: chi-quadro/Fisher + misure d'associazione (V di Cramér, coeff. di contingenza, φ). Grup karşılaştırması için t-testi/ANOVA veya alternatif.
- Confundenti: parziale veya çok değişkenli modeli ilişkilendirin (kategori fattori dahil).
Qualunque sia la scelta, contexto'da yorumlamak İşin sırrı bu: büyük bir etki, önemli istatistikler, kampın genişliği ve final sayısının (eğer değilse) kalitesi.
Esempi di codice R ricorrenti
Riassumendo alcune chiamate utili Bu, değişkenler arasındaki ilişkiyi analiz etmede daha doğru olmasını sağlar ve veri setinize uyarlanabilir:
# 1) Correlazioni
cor(x, y, method = "pearson")
cor.test(x, y, method = "spearman")
cor.test(x_small, y_small, method = "kendall")
# 2) Grafici (base e ggplot2)
plot(x, y)
# ggplot2: geom_point() + geom_smooth(method = "lm" o se = FALSE)
# 3) Normalità
shapiro.test(x)
nortest::ad.test(x)
# 4) Tabelle e test
xtabs(~ a + b, data = dati) -> tab
chisq.test(tab)
fisher.test(tab) # campioni piccoli o celle con attesi < 5
vcd::assocstats(tab) # V di Cramér e coeff. di contingenza
# 5) Kappa
afmsb::Kappa.test(giudice1, giudice2)
# 6) Correlazione parziale
ggm::pcor(c("x", "y", "z"), var(dati))
Pratik not: "Güler" skalası verilerle destekleniyor. Hipotezi doğrulamak, yöntemi karşılaştırmak ve işe yaradığında, soruyu güvenilir bir şekilde hızlı bir şekilde teşhis etmek için kısa bir yazı oluşturmak faydalı olacaktır.
Abbiamo, “relazione”nin çoğunlukla şu anlama gelebileceğini gördü: Pearson ile doğrusal form, Spearman/Kendall ile monotonluk, kategori içindeki chi-quadro/Fisher ile zayıf tüm ilişkiler ve V di Cramér ve φ ile yanlış ilişki; senza dimenticare giudici (Kappa) ile yönetim arasındaki anlaşmayı parziale korelasyonu ile teyit ettim. Bu nedenle, ilişkisel cebir, tanımlı bir şekilde, tersten ve bileşime göre kavramsal olarak ilişkisel cebir, arşivleme ve veri tabanını sorgulama modunu yönlendirir. En önemli fikir, temel olarak çeşitli türlerde araçlar kullanmaktır, tüm yasal biçimler ve analizler için iyi bir yaklaşım, tek başına katsayıları dikkate alarak, hikayeyi tuttare raccontare.