Tipi di ubudlelwano bezibalo ngenxa yokuhlukahluka: ithiyori, ukuhlolwa kanye nokusetshenziswa

Isibuyekezo sokugcina: Novemba 25, 2025
  • Khetha u-Pearson, Spearman noma u-Kendall ngokusekelwe kuhlobo lomdlalo, ukujwayelekile kanye nosayizi we-camionaria.
  • Ngokwezigaba ezihlukene usa chi-quadro/Fisher futhi misura l'associazione kanye no-V di Cramér o φ.
  • I-Valuta confondenti con correlazione parziale futhi isekela ukuhlaziya ngezithombe kanye nokuxilongwa.
  • I-algebra yobudlelwano (i-insiemi, i-funzioni, i-composizione) yakha i-pensiero kanye nohlelo lokusebenza kusizindalwazi.

relazione tra due variabili

I-Caire che uhlobo lwe-legam c'è tra due variabili Ingenye yazo ebusa kakhulu ezinhlelweni zezibalo, idatha evela kudatha kanye nokuhlolwa kokuhlola kanye ubuningi. Enye indlela ezungeze ubudlelwano iwumugqa futhi iyingxenye ye-cogliere, enye indlela yokubuyela emuva iyisihluthulelo kodwa ayiyona yomugqa, isigaba se-oppure coinvolge kanye nenombolo engeyona inombolo, ihange lincike ekuhlukeni kwesithathu okuhambisana ne-acque: insomma, non è una passeggiata.

Kulo mhlahlandlela osebenzayo nowethiyori ngesi-Italian, sixoxa ngawo ngemodi ye-organic Ithiphu eyinhloko yobudlelwano bezibalo ngenxa yokuhlukahluka, indlela yokuxilonga ngokubukeka kanye nokuhlola okusemthethweni, ama-coefficients ekhwalithi asetshenzisiwe (uPearson, Spearman, Kendall), ungashintsha kanjani ngokuguquguquka kwezigaba ezihlukene (chi-quadro di indipendenza, test esatto di Fisher, V di Cramér, coefficiente di contingenza, phi), kanjani iphutha l'accordo sebenza neKappa, nendlela yokuyiphatha i-variabili di confundimento cubungula ukuhlobana kwe-parziale. Inoltre, sizothuthukisa i-finestra eseningizimu'algebra delle relazioni (ngomqondo we-insiemistic kanye nowokubala), i-essenziale per formalizzare concetti come domain, composition, inversa kanye ne-funzioni.

Esihlose ukuthi “relazione” ngenxa yokuhlukahluka

Olimini lwezibalo, ubudlelwano phakathi kuka-A no-B ngu isifinyezo somkhiqizo we-Cartesian A×B: ogni coppia ordinata (a, b) appartenente a R ibonisa ukuthi isici esithi a di A “sihlobene” nento ethi b di B. Ku-termini applicati, ubuhlobo obunqumayo (umsebenzi) oppure probabilistica (associazione stochastica): esimweni sokuqala i-ad ogni a corresponde esattamente una b, ku secondo osserviamo una ukuthambekela (i-più noma iqine kancane) kanye ne-non un legam uno-a-uno.

Yonke 'i-algebra yangaphakathi yobudlelwano (ngomqondo we-siemistic) iyathakazelisa proprietà come riflessività (ogni a è maqondana nayo uqobo), ukulinganisa ((a, b) kusho (b, a)), i-antisymmetry (uma (a, b) kanye (b, a) ne-allora a = b) kanye transitività (kusuka ku (a, b) kanye no (b, c) kulandela (a, c)). Lo mnikazi wendawo ebalulekile: uma ubudlelwano buyi-symmetrical, symmetrical futhi buyashintsha diventa una relazione di equivalenza che “partiziona” A in classi di elementi equivalenti. Uma i-invece iyisibhamu, i-antisymmetric futhi idlula, we abbiamo una i-relazione d'ordine.

Kulokhu kuhlaziya, sihumusha lo mbono ube ngokoqobo: sihlola uhlobo lokuhlukahluka (ubuningi buyaqhubeka, ordinali, nominali/dicotomiche) nalapho isikhundla kulesi sibalo kanye ne-scegliamo strumenti adeguati per misurare la relazione, ukwazi ukuthi elithi “relazione” alisho njalo “umphumela wesizathu”.

I-ispezione ebonakalayo: idla iphethini ye-riconoscere nesiqondiso

Prima di buttarsi nei numeri, un hlakaza itulo Kuyisisindo sento ehlakaniphe kakhulu. Ifu yonke indlela phansi ngomugqa oqondile lisikisela a ubudlelwano bomugqa (enhle noma embi); hlela ijika eliyinkomba ubudlelwano obungaqondile (magari monotone). Uma ungangeni ephethinini, ubudlelwano bomugqa bungase buqede imvume.

Ngokuhlukahluka okuncane, i-pannelli di scatter plot (futhi isibonelo ku-R nge ngababili(dati)) kanye nomugqa ovame uku-smussate (geom_smooth ku-ggplot2) ukuze ukwazi ukuqaphela izinhlangano, iqoqo kanye nangaphandleQaphela: i-gli outlier I-Podeno influenzare moltissimo kanye ne-coefficienti, i-specie Pearson.

Isibonelo kokuthi R si può iniziare così: ngababili(dati)

# Matrice di grafici a dispersione
pairs(dati)

# Correlazioni grezze (matrice)
cor(dati, use = "pairwise.complete.obs")

Ukuhlolwa kokuqala okubonakalayo, okulungile kunombolo, Iya ku-scegliere il test giusto ngokusekelwe efomini, i-monotony kanye ne-linearity apparenti.

Hlola ukujwayelekile kwayo: lapho ukhonza i-davvero

I-Molti test parametrici (isibonelo sesikhangiso sokuhlolwa kwe-Pearson) ngicabanga, ngamazinga ahlukahlukene, evamile i-almeno iyisakhiwo esilinganayo ngaphandle kwekhodi esindayo. Ukuze ulawule i-ipotesi, ingxenye ethile yesakhiwo sesithombe siza istogrammi kanye nokuqina e Isakhiwo se-QQ.

Ngo-R, una ubuncane bebhethri i-potrebbe ihlanganisa:

# Istogrammi con densità e curva normale sovrapposta
par(mfrow = c(2, 2))
plot_hist <- function(x) {
  hist(x, prob = TRUE)
  lines(density(x), col = "red")
  curve(dnorm(x, mean(x), sd(x)), add = TRUE, col = "blue")
}
plot_hist(dati$GASTEDU)
plot_hist(dati$GASAUDE)
plot_hist(dati$GASLAZER)
plot_hist(dati$IDADE)

Ukuqhathanisa ukubonwa kwenani nalokho kwezinga elijwayelekile, Isakhiwo se-QQ i-insostituibile:

par(mfrow = c(2, 2))
qqfun <- function(x) {
  qqnorm(x, main = "", xlab = "Quantili teorici N(0,1)", pch = 20)
  qqline(x, col = "red", lty = 1)
}
qqfun(dati$IDADE)
qqfun(dati$GASAUDE)
qqfun(dati$GASLAZER)
qqfun(dati$GASTEDU)

Kugcine ekubukeni, uma ngingakwazi ukukusebenzisa test formali di normalità ngobufakazi obuqoqiwe: I-Kolmogorov–Smirnov enezilinganiso zepharamitha, Lilliefors, Cramér–von Mises, Shapiro–Wilk, Shapiro–Francia, Anderson–Darling e il test di Pearson (chi-quadro) di normalità.

normalita <- function(x) {
  t1 <- ks.test(x, "pnorm", mean(x), sd(x))            # Kolmogorov–Smirnov
  t2 <- nortest::lillie.test(x)                         # Lilliefors
  t3 <- nortest::cvm.test(x)                            # Cramér–von Mises
  t4 <- shapiro.test(x)                                 # Shapiro–Wilk
  t5 <- nortest::sf.test(x)                             # Shapiro–Francia
  t6 <- nortest::ad.test(x)                             # Anderson–Darling
  t7 <- PearsonDS::pearson.test(x)                      # Pearson chi-quadro di normalità
  pv <- c(t1$p.value, t2$p.value, t3$p.value, t4$p.value, t5$p.value, t6$p.value, t7$p.value)
  data.frame(p_value = pv, row.names = c(t1$method, t2$method, t3$method, t4$method, t5$method, t6$method, t7$method))
}
normalita(dati$GASAUDE)

Uma ngilala endaweni evamile futhi ubuhlobo buqondile, i-Pearson coefficient ingumzala omuhle weCeltic; ngaphandle kwalokho kuwukuhlakanipha ukukhetha ukuxuba i-basate sui ranghi ne-Spearman noma i-Kendall.

Okuhlobene:  Uziguqula Kanjani Izingxenyana zibe Izinombolo Eziphelele namaDesimali: Umhlahlandlela ophelele

Ubudlelwano phakathi kokuhlukahluka kobuningi: i-covariance kanye nokuhlobana

La i-covariance fra Inkinga i-covariance incike ekudalweni kwe-misura, quindi è poco comparabile.

La Pearson linear correlation Rarulula inkinga yokulinganisa ngokuchezuka okujwayelekile ngakunye: i-coefficient r iyahluka phakathi -1 kanye no-1, inikeze inani ku-±1 elibonisiwe forte relazione lineare (enhle noma embi) futhi u-0 uphakamisa ukuthi i-assenza di linearità. Ngicela uqaphele: r = 0 akubandakanyi ubudlelwano obungewona omugqa.

I-Calcoli nge-correlazioni ku-R:

# Coefficiente di Pearson e test di significatività
cor(dati$GASTEDU, dati$GASAUDE, method = "pearson")
cor.test(dati$GASTEDU, dati$GASAUDE, method = "pearson")

Quando la relazione è okuyisidina kodwa okungaqondile noma lapho ngingalali ngokujwayelekile (noma ngiqukethe okungaphandle), kunengqondo ukusebenzisa Isikhulumi (i-ranghi; iqinile futhi ijwayele i-medio-grandi campioni) I-Kendall τ (basato su concordanze/discodanze; preferibile su ompetha abancane (noma ngama-pareggi amaningi):

# Correlazioni non parametriche
cor.test(dati$GASTEDU, dati$GASAUDE, method = "spearman")

# Su un sottoinsieme più piccolo, meglio Kendall
dati2 <- head(dati, 20)
cor.test(dati2$IDADE, dati2$GASAUDE, method = "kendall")

Umbono owusizo: i-coefficient yokunquma R² di un modello lineare semplice ibuyisela isabelo esiguquguqukayo se-Y spiegata ngokulandelana ukusuka ku-X. Ku-R:

summary(lm(GASAUDE ~ ESTCIVIL, data = dati))$r.squared

Ngokwe-variabili dichotomy vs ubuningi, i-coefficient iphuzu-biserial kuhambisana nokubala kukaPearson nokuguquguquka okunekhodi 0/1; ngokusebenza, umbala (i-dichotomous, quantitative) con method = “pearson”.

Izigaba eziguquguqukayo: indipendenza, amandla okuhlanganisa kanye ne-piccoli campioni

Lapho kungena ukushintshashintsha kokulala igama elithi ordinali, la relazione si studia con tabelle di contingentza (ngokuvamile nge-doppia classification). I-ipotesi evamile ithi: H0 = indipendenza (ukuxhumana okudingekayo), control H1 = dipendenza.

I test di riferimento è il chi-quadro di indipendenza. Sesi sono i-frequenze attese troppo basse (imvamisa <5), uma uyisebenzisa Ukulungiswa kukaYates nge 2×2 o si passa al test esatto di Fisher, ikakhulukazi ekhonjiswa nge-campioni piccoli.

# Tabella incrociata e chi-quadro
xtabs(~ PROFI + ESTCIVIL, data = dati) -> tab1
chisq.test(dati$PROFI, dati$ESTCIVIL)  # p-value non significativo => indipendenza plausibile

# Campioni piccoli: test di Fisher
chisq.test(dati$PROFI, dati$RENDA)
fisher.test(dati2$PROFI, dati2$RENDA)

Ngokwesilinganiso l'intensità dell'associazione ku-tabelle I×J sihlanganisa: V di Cramér (0-1), coefficiente di contingentza (0–1, umkhawulo), naku-2×2 il phi (φ), okungokomthetho i-Pearson applicato alla tabella binaria.

# Misure di associazione per tabelle
library(vcd)
xtabs(~ PROFI + RENDA, data = dati) -> tab2
assocstats(tab2)  # riporta V di Cramér, coeff. di contingenza e test

# Attenzione: cor() su codifiche numeriche di categorie non è equivalente a φ in generale

Se l'intersse è confrontore gruppi ukuhluka kwayo kobuningi (is. reddito per professione), uma i-valtano isivivinyo t, ANOVA e le rispettive alternative non parametriche, no intervalli di confidenza. Ngenjwayelo, ukuhambisana ohlotsheni lokuhlukahluka nendlela futhi fondamentale.

Okuhlobene:  Ukuhunyushwa kwemishini: indlela i-AI eyakha futhi yembule ngayo amamodeli ayo angaphakathi

I-Accordo tra valutatori: Kappa di Cohen

Uma kufanele (noma più) giudici hlukanisa no gli stessi oggetti esigabeni, akwanele ukuxuba iphesenti lesivumelwano, perché a quota può essere dovuta al icala. ke Kappa di Cohen ilinganisa isivumelwano esilungile sesivumelwano esivamile: Ngilinganisele ngokuqhubekayo ku-0 ngibonisa isivumelwano secala ngalinye, ngithathele phezulu i-maggiori suggeriscono isivumelwano esikhulayo (i-interpretazioni comuni: i-scarso, ihlakaniphile, i-moderato, i-buono, i-molto buono).

Ku-R è kungenzeka i-stimare i-Kappa ingene versione ponderata (ngesigaba ngasinye):

set.seed(1)
val1 <- sample(0:1, 10, replace = TRUE)
val2 <- sample(0:1, 10, replace = TRUE)

# Kappa non ponderato
fmsb::Kappa.test(val1, val2)

Uma isigaba singeyona i-oda lemvelo (i-ad empio, i-lieve/moderata/severa), i-Kappa ponderato penalizza encane ekungavumelanini okuthi “vicini” kanye ne-più quelli “lontani”, okuholela ekwazisweni kwe-spesso più.

Relazioni e variabili di confusione: la correlazione parziale

I-Può capitare che due variabili X e Y sembrino molto correlate, kodwa in realtà la strength dell'associazione sia dovuta a una i-variabile di confundimento Z ihambisana ne-entrabe. Umbuzo, uma uchofoza kukho ukuhlobana okuyingxenye i-tra X kanye no-Y elawula ngo-Z ngamunye.

Ku-R, nge-ggm::pcor si ottiene la correlazione parziale di primo ordine e si può testne la significatività. Kuyasiza ukuqhathanisa zakudala r e r usizi umuntu ngamunye njengo-Z “spiega” del legam grezzo.

library(ggm)
# Correlazione parziale tra GASLAZER e GASAUDE controllando GASTEDU
rp <- pcor(c("GASLAZER", "GASAUDE", "GASTEDU"), var(dati))

# Correlazione grezza
r  <- cor(dati$GASLAZER, dati$GASAUDE)

# Test della correlazione parziale (1 variabile di controllo)
pcor.test(rp, 1, length(dati$GASAUDE))

# Confronto R^2 grezzo vs parziale
data.frame("Senza_controllo" = r^2, "Con_controllo" = rp^2)

Uma i-spiegata quota "crollas" dopo il controllo, manje U-Z wayengumfelandawonye obalulekile. Uma okuguquguqukayo kokulawula kuyisigaba (is. professione), angikwazi ukusebenzisa izindlela ezifanayo noma amamodeli afaka isigaba njengesici.

Umkhawulo kanye nokuzijwayeza okuhle ekusebenziseni ukuhlobana

Inhlanganisela ye-Pearson coefficient solo la linearità. Uma ubudlelwano bungahlangene (quadratic, sponenziale, logarithmic), bungabangela u-0 pur ebukhoneni bokuncika okuqinile. In questi casi, valutare Isikhulumi, ukuyiguqula ibe imodeli engaqondile.

le ngaphambili Angikwazi ukuhlanekezela umphumela. Ngenxa yalesi sizathu, okokuqala, kulula ukuhlola igrafu futhi, uma kunesidingo, uhlaziye ngokuqinile noma uhlole ukuzwela kwemiphumela ngesikhathi esifanayo.

Enye i-classic: ukuhlobana ≠ imbangela. Ngenxa yokuhlukahluka angikwazi ukuhlobanisa i-perché sleep influenzate inikeza i-fattore yesithathu, ukuvele kwenzeke ngengozi noma ngomthelela ngamunye wendlela ephambene. I-Servono disegni sperimentali, i-strumenti causali noma i-modelli appropriati per parlare di causa-effetto.

Uhlobo lobudlelwano: okuqondile, okukodwa, okungenalutho, okuyingxenye

I-Nei casi misti (ubuningi ngokumelene ne-dichotomica/nominale/ordinata) se iphumelele isivivinyo sokungqubuzana phakathi kwe-gruppi, correlazioni biseriali/point-biserial oa imodeli (isibonelo sokuhlehla kwesikhangiso nge-factori ebikezelwe). Ngokuhlukahluka i-entrarbe categoriali, ci si affida a chi-quadro/Fisher e all misure di strength dell'associazione già viste.

I-Funzioni idla ubudlelwano obukhethekile

Una umsebenzi Ubudlelwano, into ngayinye yesizinda, ebuhlobanisa ncamashi into we condominium. Sengiphetha, kuyinganekwane ye-sottoinsieme di A×B ethi ogni a in A eqhathanisa i-volta eyodwa nengxenye yokuqala. Eminye imisebenzi ebalulekile ku-algebra ehlobene nokulala: inyunyana (R1 ∪ R2), impambanamgwaqo (R1 ∩ R2), ukwakheka (R2 ∘ R1) kanye ukuhlanekezela (R^{-1}, che scambia ciascuna coppia (a, b) ku-(b, a)).

Lezi mattoni concettuali i-tornano utili sia nella izibalo ezimsulwa (equivalenze, ordini, classi di equivalenza) sia in applicazioni concrete dove lisebenzela ubudlelwano obusemthethweni fra entità.

I-Algebra yobudlelwano nesayensi ngiyinikezile

Nel mondo dei database, l'algebra relational Lesi yisakhiwo setiyetha se-SQL: indlela yokusebenza khetha, proiezione, join, unione kanye intersezione sono versioni pratiche di operazioni su relazioni-insiemi. Lokhu kwenziwa kube semthethweni kuyisikhali esinamandla sokuchaza, ukwenza kahle kanye nokukhohlisa izinto ngokushesha.

Okuhlobene:  Ubhalwa kanjani amafrakshini amabili alingana nengxenye ethile

Kumongo ubuhlakani bokufakelwa nokufunda komshini, amandla okwenza ubudlelwano bokumodela ukuze kwakhiwe amagrafu e-conoscence, amasistimu wokuhlangana kanye nepayipi lokuhlanganisa; Leli nani lisebenza kwezomnotho, biostatistics kanye nesayensi yezenhlalo, cishe njalo "i-chi iyi-legato a chi, futhi ikumodi ye-che".

Izibonelo zakudala zobudlelwano kuthiyori ye-insiemi

Relazioni di equivalenza: lala isibhamu, i-symmetriche futhi iyashintsha. Izibonelo ezihlanganisa "iba naleli nani njengesixazululo" zingokoqobo noma zikhona ukuhlanganisa imodulo n Ngiphakamise ngaphakathi. Ubudlelwano be-Ogni bokulingana budala classi di equivalenza che ripartiscono l'insieme in blocchi disgiunti.

e-Relazioni d'ukuhleleka: isibhamu, i-antisimmetriche kanye ne-transitive. I-Esempi: ≤ sui numeri naturali, l'inclusione ⊆ sull'insieme delle parti P(X), o “hlukanisa” (|) sui naturali. Ukulala kwe-Fondamentali ngokwencazelo ngayinye ordinamenti total or parziali futhi isifunda ngasinye kukhona massimi, minimi, catene kanye antichains.

Oda i-lessicographic: bengishilo. Kuwuhlelo ngokulandelana (iyunithi yezinhlamvu, inombolo ebhalwe ngokulandelana) eqhathanisa isici nesici; Kunomsindo obalulekile kulesi sakhiwo futhi angiwanaki ama-algorithms.

Lesi sigaba siwusizo ekuqondeni ukuthi i-“relazione” kwizibalo ingumqondo più ampio della sole correlazione: faka uguaglianze, ordini, ukwakheka nokunye okuningi, konke okubalulekile ohlelweni lwe-modellare complessi.

Ukuhamba komsebenzi okusebenzayo: kulawule lapho imiphumela

A kungenzeka flusso di lavoro ukuze ungakulahlekeli uma ushaya insimbi nalapho:

  • Ukuhlolwa kwezithombe: uhlaka lokuhlakaza, ukushelela, istogrammi, QQ-plot. I-Occhio a outlier ne-forma non lineari.
  • Hlola: uma kusebenza, hlola ukujwayelekile; Controlli di omoscedasticità uma imodeli yomugqa ibonwa kusengaphambili.
  • I-Scelta del coefficiente: Pearson (lineare, dati circa normali), Spearman/Kendall (monotona/non normale/piccoli campioni).
  • Ngokwezigaba: chi-quadro/Fisher + misure d'associazione (V di Cramér, coeff. di contingenza, φ). Ukuze uqhathanise iqembu, t-test/ANOVA noma okunye.
  • Confundenti: correlate parziale noma imodeli ye-multivariate (kuhlanganise nesigaba se-fattori).

Qualunque sia la scelta, interpretae nel contexto Yi-chiave: grandezza dell'effetto, izibalo ezibalulekile, ampiezza del campione e qualità dei dati contano como (uma kungenjalo più) del numero finale.

Esempi di codice R ricorrenti

I-alcune ye-alcune chiamate utili okwenza kube nembe kakhulu ekuhlaziyeni ubudlelwano phakathi kokuhluka, futhi okungashintshwa kudathasethi yakho:

# 1) Correlazioni
cor(x, y, method = "pearson")
cor.test(x, y, method = "spearman")
cor.test(x_small, y_small, method = "kendall")

# 2) Grafici (base e ggplot2)
plot(x, y)
# ggplot2: geom_point() + geom_smooth(method = "lm" o se = FALSE)

# 3) Normalità
shapiro.test(x)
nortest::ad.test(x)

# 4) Tabelle e test
xtabs(~ a + b, data = dati) -> tab
chisq.test(tab)
fisher.test(tab)  # campioni piccoli o celle con attesi < 5
vcd::assocstats(tab)  # V di Cramér e coeff. di contingenza

# 5) Kappa
afmsb::Kappa.test(giudice1, giudice2)

# 6) Correlazione parziale
ggm::pcor(c("x", "y", "z"), var(dati))

Inothi eliwusizo: le scelte “giuste” dipendono dai dati. Kuyafaneleka ukuqinisekisa i-hypothesis, ukuqhathanisa indlela futhi, uma isebenza, ukwakha umbhalo we-piccolo wokuxilonga umbuzo ngokushesha ngendlela ethembekile.

U-Abbiamo ubonile ukuthi elithi “relazione” lingasho kaningi kunalokho: uhlobo lomugqa no-Pearson, i-monotony ne-Spearman/Kendall, i- all'association emincane phakathi kwesigaba ne-chi-quadro/Fisher kanye nokungalungi no-V di Cramér kanye no-φ; senza dimenticare isivumelwano phakathi kwe-giudici (Kappa) nabaphathi engibanikezile ukuhambisana nokuhlobana kwe-parziale. Ngakho-ke, i-algebra ehlobene i-fornisce i mattoni concettuali per definee dominio, inversa e composizione, mentre i-algebra ehlobene iqondisa imodi lapho ngigcina khona kungobo yomlando kanye ne-interroghiamo i dati nei database. Umbono we-chiave uthi scegliere lo strumento in base al type di variabili, alla forma del legam e agli obiettivi dell'analisi, ricordandoci che nessun coefficiente, da solo, può raccontare tutta la storia.

I-athikili ehlobene:
Izinhlobo eziyi-13 zemisebenzi yezibalo (kanye nezici zayo)