- Válassz Pearsont, Spearmant vagy Kendallt a játék formája, a normalitása és a bajnokság mérete alapján.
- A chi-quadro/Fisher e misura l'associazione V di Cramér o φ változó kategóriái szerint.
- Valuta confondenti con correlazione parziale, és támogatja az elemzést grafikával és diagnózissal.
- A kapcsolati algebra (insiemi, funzioni, composizione) strukturálja a pensiero-t és az alkalmazást az adatbázisban.

Capire che típusú legam c'è tra due variabili Ez az egyik, amely a leggyakrabban dominál a statisztikai alkalmazásokban, az adatokból származó adatokban és a kísérleti tesztekben, valamint mennyiségiA kapcsolat fordítva lineáris és mindig a kockák része, a visszaút monoton, de nemlineáris, oppure coinvolge kategória és non numeri, a horgony egy harmadik változótól függ, amely confonde le acque: insomma, non è una passeggiata.
Ebben az olasz nyelvű gyakorlati és elméleti útmutatóban organikus módon tárgyaljuk a témát. A változékonyságból adódó matematikai összefüggések fő tippje, hogyan lehet vizuálisan és formális teszttel diagnosztizálni, felhasznált kvalitatív együtthatók (Pearson, Spearman, Kendall), hogyan lehet változtatni változó kategorikus változókkal (chi-quadro di indipendenza, test esatto di Fisher, V di Cramér, coefficiente di contingenza, phi), hogyan harmonikazavar Hogyan dolgozzunk a Kappával, és hogyan kezeljük azt bizonytalanság változói feldolgozzuk a parziale-korrelációt. Intre, javítani fogunk egy déli finestra-tkapcsolatok algebrái (insiemisztikus és számítási értelemben), essenziale per formalizzare concetti jön a domain, a kompozíció, az inversa és a funzioni.
Amit a változékonyság miatt „relazione”-nak szánunk
Matematikai nyelven az A és B közötti kapcsolat a következő: az A×B derékszögű szorzat összefoglalása: ogni coppia ordinata (a, b) appartenente a R azt jelzi, hogy az a di A elem „kapcsolatban van” a b di B elemmel. In termini applicati, determinisztikus kapcsolat (függvény) oppure probabilistica (associazione stochastica): az első esetben ad ogni a megfelele esattamente una b, a második esetben osserviamo una tendenza (più vagy kevésbé erős) és non un legam uno-a-uno.
Minden „belső algebrai kapcsolatok (siemisztikus értelemben) érdekes, mint például puskacsapás (ogni a è önmagához képest), szimmetria ((a, b) magában foglalja (b, a)-t), antiszimmetria (ha (a, b) és (b, a) akkor a = b) és tranzitivitás (az (a, b) és (b, c) pontokból következik (a, c)). Ez a kulcsfontosságú ingatlantulajdonos: ha egy kapcsolat szimmetrikus, akkor szimmetrikus és tranzitív eggyé válik egyenértékű kapcsolat che „partiziona” A in classi di elementi equali. Ha az invece puskás, antiszimmetrikus és tranzitív, akkor abbiamo una rendelési kapcsolat.
Ebben az elemzésben ezt az elképzelést ültetjük át a gyakorlatba: értékeljük a változékonyság típusát (mennyiségi tovább, ordinali, nominali/dicotomiche) és ott helyezés ebben a statisztikában és scegliamo strumenti adeguati per misurare la relazione, tudván, hogy a „relazione” nem mindig jelent „ok-okozatot”.
Vizuális ispezione: egyél riconoscere mintát és irányt
Prima di buttarsi nei numeri, un szóródási diagram Ez a legintelligensebb dolog súlya. Egy egyenes vonalban végigfutó felhő egy... lineáris kapcsolat (pozitív vagy negatív); az indikatív görbe strukturálása nemlineáris kapcsolatok (monoton hangnem). Ha nem építesz be egy mintázatba, a lineáris kapcsolat tönkreteheti az egyetértést.
Kis változékonysággal, I pannelli di szóródási diagram (és például R-ben a párok(adatok)) és egy sima vonal, ami hajlamos a smussate-re (geom_smooth a ggplot2-ben), így megjegyezheted asszociációk, klaszterek és kiugró értékekFigyelem: gli-kiugró érték Podeno influenzare moltissimo i coefficienti, Pearson faj.
Például az R si può iniziare così nyelven: párok(adatok)
# Matrice di grafici a dispersione
pairs(dati)
# Correlazioni grezze (matrice)
cor(dati, use = "pairwise.complete.obs")
Első vizuális ellenőrzés, a számnak megfelelően, Menjen a scegliere il test giusto oldalra formán, monotonititáson és látszólagos linearitáson alapul.
Ellenőrizze a normális állapotát: davvero tálalásakor
Molti-teszt paraméterei (a Pearson-teszt példája) Feltételezem, hogy különböző mértékben, szabályszerűség Az almeno egy szimmetrikus struktúra nehéz kód nélkül. Az ipotesi vezérléséhez a grafikus struktúra egy adott része jön létre sűrűségű iszogrammok e QQ-diagram.
R-ben, una minimális akkumulátor-kapacitás A potrebbe tartalmazza:
# Istogrammi con densità e curva normale sovrapposta
par(mfrow = c(2, 2))
plot_hist <- function(x) {
hist(x, prob = TRUE)
lines(density(x), col = "red")
curve(dnorm(x, mean(x), sd(x)), add = TRUE, col = "blue")
}
plot_hist(dati$GASTEDU)
plot_hist(dati$GASAUDE)
plot_hist(dati$GASLAZER)
plot_hist(dati$IDADE)
A kvantitatív megfigyelések összehasonlítása egy normál standardéval, QQ-diagram beidegzhetetlen:
par(mfrow = c(2, 2))
qqfun <- function(x) {
qqnorm(x, main = "", xlab = "Quantili teorici N(0,1)", pch = 20)
qqline(x, col = "red", lty = 1)
}
qqfun(dati$IDADE)
qqfun(dati$GASAUDE)
qqfun(dati$GASLAZER)
qqfun(dati$GASTEDU)
Tartsd szem előtt, ha nem tudom használni formai normalitásvizsgálat akkumulációs bizonyítékonként: Kolmogorov–Smirnov paraméterbecslésekkel, Lilliefors, Cramér–von Mises, Shapiro–Wilk, Shapiro–Francia, Anderson–Darling e il test di Pearson (chi-quadro) di normalità.
normalita <- function(x) {
t1 <- ks.test(x, "pnorm", mean(x), sd(x)) # Kolmogorov–Smirnov
t2 <- nortest::lillie.test(x) # Lilliefors
t3 <- nortest::cvm.test(x) # Cramér–von Mises
t4 <- shapiro.test(x) # Shapiro–Wilk
t5 <- nortest::sf.test(x) # Shapiro–Francia
t6 <- nortest::ad.test(x) # Anderson–Darling
t7 <- PearsonDS::pearson.test(x) # Pearson chi-quadro di normalità
pv <- c(t1$p.value, t2$p.value, t3$p.value, t4$p.value, t5$p.value, t6$p.value, t7$p.value)
data.frame(p_value = pv, row.names = c(t1$method, t2$method, t3$method, t4$method, t5$method, t6$method, t7$method))
}
normalita(dati$GASAUDE)
Ha normálisan alszom, és a kapcsolat lineáris, a Pearson-együttható jó kelta unokatestvér; egyébként célszerűbb a basate sui ranghit Spearmannal vagy Kendall-lal keverni.
A mennyiségi variabilitás kapcsolata: kovariancia és korreláció
La kovariancia fra A probléma a kovariancia a misura egységétől függ, ezért kicsit összehasonlítható.
La Pearson-féle lineáris korreláció Oldjuk meg a standardizálási problémát szórás szerint: az r együttható -1 és 1 között változik, ami ±1 értéket ad a megadott értéknek. lineáris kapcsolat erőssége (pozitív vagy negatív), a 0 pedig assenza di linearità-ra utal. Kérjük, vegye figyelembe: r = 0 nem zárja ki a nemlineáris kapcsolatokat.
Korrelációs számítások R-ben:
# Coefficiente di Pearson e test di significatività
cor(dati$GASTEDU, dati$GASAUDE, method = "pearson")
cor.test(dati$GASTEDU, dati$GASAUDE, method = "pearson")
Amikor a kapcsolat megtörténik monoton és nemlineáris vagy amikor nem alszom normálisan (vagy kordában tartom a kiugró esetet), van értelme használni Dárdás (ranghi; robusztus és közepes-grandi campionihoz igazítva) Kendall τ (basato su concordanze/discordanze; preferibile su kis bajnokok (vagy sok pareggivel):
# Correlazioni non parametriche
cor.test(dati$GASTEDU, dati$GASAUDE, method = "spearman")
# Su un sottoinsieme più piccolo, meglio Kendall
dati2 <- head(dati, 20)
cor.test(dati2$IDADE, dati2$GASAUDE, method = "kendall")
Hasznos ötlet: a meghatározási együttható R² di egy egyszerű lineáris modell Az Y spiegata változó részesedését lineárisan visszaállítja X-ből. R-ben:
summary(lm(GASAUDE ~ ESTCIVIL, data = dati))$r.squared
Változónkénti dichotómia vs. kvantitatív, az együttható pont-biszeriális egybeesik a Pearson-számítással egy 0/1 kódolt változóval; a gyakorlatban szín (dichotóm, kvantitatív) con metódus = „pearson”.
Változó kategóriák: indipendenza, asszociációs erősség és piccoli campioni
Amikor az alvás változékonysága megjelenik névleges vagy rendes, a stúdióval való kapcsolat csoportos táblázatok (gyakran doppia besorolással). A tipikus ipotesi: H0 = indipendenza (szükséges asszociáció), kontroll H1 = dipendenza.
A teszteredmény az független négyszögSe ci sono frekvencia attese troppo basse (általában < 5), ha használod Yates korrekciója 2×2 darabonként Fisher tesztje, különösen campioni piccolival javallt.
# Tabella incrociata e chi-quadro
xtabs(~ PROFI + ESTCIVIL, data = dati) -> tab1
chisq.test(dati$PROFI, dati$ESTCIVIL) # p-value non significativo => indipendenza plausibile
# Campioni piccoli: test di Fisher
chisq.test(dati$PROFI, dati$RENDA)
fisher.test(dati2$PROFI, dati2$RENDA)
Quantcare szerint l'intensità dell'associazione az I×J táblázatban, ha használjuk: V di Cramér (0-1), kontingens együtthatók (0–1, korlátozás), és 2×2 il-ben phi (φ), ami formálisan Pearson applicato alla tabella binaria.
# Misure di associazione per tabelle
library(vcd)
xtabs(~ PROFI + RENDA, data = dati) -> tab2
assocstats(tab2) # riporta V di Cramér, coeff. di contingenza e test
# Attenzione: cor() su codifiche numeriche di categorie non è equivalente a φ in generale
Ha a közbeszól, szembeszállunk vele gruppi mennyiségi változékonysága (es. reddito per professione), ha valutano t-próba, ANOVA e le ripettive alternatív non parametriche, nincs intervalli di confidenza. Általában, a változékonyság típusának és a módszernek a koherenciája kritikus.
Accordo tra valutatori: Kappa di Cohen
Ha a due (vagy più) giudici a no gli stessi oggetti-t kategóriába sorolja, nem elég keverni az egyetértési százalékot, perché a quota può essere dovuta al eset. A Kappa di Cohen számszerűsíti a véletlenszerű megállapodás helyes egyetértését: 0-ig értékeltem, jelezve az egyes esetek egyetértését, a maggiori suggeriscono értéket adtam. növekvő egyetértés (interpretazioni comuni: scarso, diszkrét, moderato, buono, molto buono).
In R è possibile stimare Kappa anche in változat (sorrendi kategóriánként):
set.seed(1)
val1 <- sample(0:1, 10, replace = TRUE)
val2 <- sample(0:1, 10, replace = TRUE)
# Kappa non ponderato
fmsb::Kappa.test(val1, val2)
Ha a kategória nem természetes sorrend (ad empio, lieve/moderata/severa), Kappa ponderato penalizza minor a nézeteltérésben „vicini” és più quelli „lontani”, ami egy spesso più tájékoztató jellegű.
Relazioni e variabili di confusione: la correlazione parziale
Può capitare che due variabili X e Y sembrino molto korrelál, de in realtà la strong dell'associazione sia dovuta a una Z bizonytalansági változó összefüggésben áll az entrabe-vel. Kérdéses, hogy ha rákattintasz részleges korreláció X és Y vezérlés Z szerint.
R-ben a ggm::pcor si ottiene la correlazione parziale di primo ordine e si può testne la significatività segítségével. Hasznos összehasonlítani klasszikus r e r parziale per capire, mint Z „spiega” del legam grezzo.
library(ggm)
# Correlazione parziale tra GASLAZER e GASAUDE controllando GASTEDU
rp <- pcor(c("GASLAZER", "GASAUDE", "GASTEDU"), var(dati))
# Correlazione grezza
r <- cor(dati$GASLAZER, dati$GASAUDE)
# Test della correlazione parziale (1 variabile di controllo)
pcor.test(rp, 1, length(dati$GASAUDE))
# Confronto R^2 grezzo vs parziale
data.frame("Senza_controllo" = r^2, "Con_controllo" = rp^2)
Ha a spiegata kvóta „crollas” dopo il controllo, most Z fontos konföderációs fél voltAmikor a kontrollváltozó kategória (pl. professione), nem használhatok hasonló megközelítéseket vagy modelleket, amelyek a kategóriát tényezőként tartalmazzák.
Korlát és bevált gyakorlat a korreláció használatában
A Pearson-együttható keverék csak a linearitásHa a kapcsolat nemlineáris (kvadratikus, sponenciális, logaritmikus), akkor erős függőség esetén 0-t eredményezhet. Kérdéses esetben az értékek... Dárdás, alakítsa át nemlineáris modellé.
az kívülálló Nem torzíthatom az eredményt. Ezért mindenekelőtt célszerű ellenőrizni a grafikont, és ha szükséges, robusztus elemzést végezni, vagy egyidejűleg ellenőrizni az eredmények érzékenységét.
Egy másik klasszikus: korreláció ≠ oksági viszony. A variabilitás miatt nem tudom korrelálni a perché alvásinfluenzát egy harmadik zsírt ad, pusztán egybeesés vagy inverz mechanizmus hatására. Servono disegni sperimentali, strumenti kausali o modelli appropriati per parlare di causa-effetto.
Kapcsolat típusa: lineáris, monoton, null, kategorikus
Nei casi misti (kvantitatív vs dichotomica/nominale/ordinata) ez megfelelt a csoportok, correlazioni biseriali/point-biseriali oa konfrontációjának próbáján modellek (példa regresszióra előrejelzett faktorokkal). Variabilitással kategorikus belépők, ci si affida a chi-quadro/Fisher e alle misure di force dell'associazione già viste.
Funzioni különleges kapcsolatokat eszik
egy funkció Ez egy olyan kapcsolat, amely a tartomány egy eleméhez kapcsolódik pontosan egy elem a társasházból. Összefoglalva, ez egy A×B-s kis történet, amely az A-ban egy olyan ogni-t hasonlít össze, amely egyetlen voltát tartalmaz az első komponenssel. További fontos műveletek az alvással kapcsolatos algebrában: Unió (R1 ∪ R2), útkereszteződés (R1 ∩ R2), composizione (R2 ∘ R1) és fordított (R^{-1}, che scambia ciascuna coppia (a, b) in (b, a)).
ezek fogalmi mattoni tornano utili sia nella tiszta matematika (equivalenze, ordini, classi di equivalenza) sia in appliazioni betongalamb szolgál formalizzare relations fra entità.
Az összefüggések és a tudomány algebráját adtam
Az adatbázis világábanrelációs algebra Ez az SQL elméleti szerkezete: hogyan kell működni kiválaszt, proiezione, join, unione és intersezione sono versioni pratiche di operazioni su relazioni-insiemi. Ez a formalizálás hatékony fegyver a dolgok gyors leírására, optimalizálására és manipulálására.
A mezőn mesterséges intelligencia és a gépi tanulás, a modellek közötti kapcsolatok képessége, amely lehetővé teszi konoszcens gráfok, versenyelemzési rendszerek és integrációs folyamatok felépítését; Ez az érték érvényes a közgazdaságtanban, a biostatisztikában és a társadalomtudományban, szinte mindig „a chi legato a chi, és che módban van".
Klasszikus példák az insiemi elméletében szereplő kapcsolatokra
Kapcsolatok ekvivalencia: alvás riflesszív, szimmetrikus és tranzitív. Az olyan példák, mint a „megoldásként ez az érték” valóban valósak vagy léteznek kongruencia modulo n Belsőleg javasoltam. Az egni ekvivalenciaviszony indukál egyenértékű osztályok che ripartiscono l'insieme in blocchi disgiunti.
Kapcsolatokrendelés: puskás, szimmetrikus és tranzitív. Esempi: ≤ sui numeri naturali, l'inclusione ⊆ sull'insieme delle parti P(X), o „oszt” (|) sui naturali. Alapvető alvás definíció szerint teljes egészében elrendelve vagy parziali és régiónként a massimi, minimi, katén és antiláncok tartoznak hozzá.
Rendelés lesszikográfiai: ezt mondtam. Ez egy sorrend egy sorozatban (karakterlánc, szekvenciába írt szám), amely elemről elemre hasonlítja össze; Van egy fontos zaj ebben a struktúrában, és elhanyagolom az algoritmusokat.
Ez a rész hasznos annak megértéséhez, hogy a „relazione” a matematikában egy fogalom. più ampio della sole correlazione: tartalmazza az uguaglianze-t, az ordini-t, a kompozíciót és még sok minden mást, amelyek mind nélkülözhetetlenek a modellare rendszer komplessi számára.
Gyakorlati munkafolyamat: irányítsa az eredményeket
Egy lehetséges munkafolyam így nem veszíted el, ha műszert használsz, és hol:
- Grafikus ellenőrzés: szórványrajz, simítás, istogrammi, QQ-plot. Occhio a outlier e forma non lineari.
- Ellenőrzés: ha működik, tesztelje a normalitás állapotát; Controllli di omoscedascicità, ha lineáris modellt terveznek.
- Koefficiens skálája: Pearson (lineare, dati circa normal), Spearman/Kendall (monoton/non normale/piccoli campioni).
- Kategorikus: chi-quadro/Fisher + misure d'associazione (V di Cramér, coeff. di contingenza, φ). Csoportos összehasonlításhoz t-teszt/ANOVA vagy alternatíva.
- Confundenti: korrelál parziale vagy többváltozós modellt (beleértve a fattori kategóriát).
Qualunque sia la scelta, kontextuson belül értelmezni Ez a chiave: grandezza dell'effetto, szignifikáns statisztika, ampiezza del campione e qualità dei dati contano como (ha nem più) del numero finale.
R kóddal kapcsolatos példák
Riassumendo alcune chiamate utili ami pontosabbá teszi a változók közötti kapcsolatok elemzését, és amely adaptálható az adathalmazhoz:
# 1) Correlazioni
cor(x, y, method = "pearson")
cor.test(x, y, method = "spearman")
cor.test(x_small, y_small, method = "kendall")
# 2) Grafici (base e ggplot2)
plot(x, y)
# ggplot2: geom_point() + geom_smooth(method = "lm" o se = FALSE)
# 3) Normalità
shapiro.test(x)
nortest::ad.test(x)
# 4) Tabelle e test
xtabs(~ a + b, data = dati) -> tab
chisq.test(tab)
fisher.test(tab) # campioni piccoli o celle con attesi < 5
vcd::assocstats(tab) # V di Cramér e coeff. di contingenza
# 5) Kappa
afmsb::Kappa.test(giudice1, giudice2)
# 6) Correlazione parziale
ggm::pcor(c("x", "y", "z"), var(dati))
Gyakorlati megjegyzés: az adatoktól függő „legnagyobb” scelte. Érdemes validálni a hipotézist, összehasonlítani a módszert, és ha működik, egy pikolóírást konstruálni a kérdés gyors és megbízható diagnosztizálására.
Abbiamo látta, hogy a „relazione” gyakrabban jelentheti: a lineáris formát Pearsonnal, a monotóniát Spearman/Kendall-lel, a kategórián belüli vékony asszociációt a chi-quadro/Fisherrel és a misure-t V di Cramérral és φ-vel; senza dimenticare a giudici (Kappa) és a menedzsment közötti megegyezést Confondenti adtam a parziale összefüggéssel. Ezért a relációs algebra fornisce i mattoni concettuali per definee domininio, inversa e composizione, mentre the relációs algebra irányítja azt a módot, amelyben archiválok és interroghiamo i dati nei adatbázist. A chiave ötlet scegliere lo strumento in base al type di variabili, alla forma del legam e agli obiettivi dell'analisi, ricordandoci che nessun coefficiente, da solo, può raccontare tutta la storia.