Vaihtelevuudesta johtuvien matemaattisten suhteiden tyypit: teoria, testaus ja sovellukset

Viimeisin päivitys: Marraskuu 25, 2025
Kirjoittaja: Virtuaaliopettaja
  • Valitse Pearson, Spearman tai Kendall pelin kunnon, normaaliuden ja liigan koon perusteella.
  • Peri variabili categoriali usa chi-quadro/Fisher e misura l'associazione con V di Cramér o φ.
  • Valuta confondenti con correlazione parziale ja tukee analyysiä grafiikalla ja diagnoosilla.
  • Suhdealgebra (insiemi, funzioni, composizione) strukturoi tietokannan pensieron ja sovelluksen.

vaihtelevien tekijöiden aiheuttama suhde

Capire che tyyppi legam c'è tra due variabili Se on yksi niistä, joka hallitsee useimmiten tilastollisissa sovelluksissa, datasta saatavasta datasta ja kokeellisista testeistä ja kvantitatiivinenToisin sanoen suhde on lineaarinen ja aina osa ympyrää, toinen tie takaisin on monotoninen mutta epälineaarinen, jos kyseessä on vain kategoria eikä numero, ankkuri riippuu kolmannesta muuttujasta, joka yhdistää sen: unsomma, non è una passeggiata.

Tässä italiankielisessä käytännön ja teorian oppaassa käsittelemme sitä orgaanisessa muodossa Vaihtelevuudesta johtuvien matemaattisten suhteiden päävinkki, miten diagnosoidaan visuaalisesti ja muodollisella testillä, käytetyt kvalitatiiviset kertoimet (Pearson, Spearman, Kendall), miten muuttuvat kategorisilla muuttujilla (chi-quadro di indipendenza, test esatto di Fisher, V di Cramér, coefficiente di contingenza, phi), miten rikkoa harmonikkaa työskentely Kappan kanssa ja sen hallinta epäselvyyksien käsittele parziale-korrelaatio. Sen lisäksi parannamme eteläistä finestraa.suhteiden algebra (insiemistisessä ja laskennallisessa mielessä), essenziale per formalizzare concetti tulevat domain, kokoonpano, käänteinen ja funzioni.

Mitä tarkoitamme "suhteellisella" vaihtelevuuden vuoksi

Matemaattisella kielellä A:n ja B:n välinen suhde on yhteenveto karteesisesta tulosta A×B: ogni coppia ordinata (a, b) appartenente a R osoittaa, että elementti a di A on "suhteessa" elementtiin b di B. In termini applicati, deterministinen suhde (funktio) oppure probabilistica (associazione stochastica): ensimmäisessä tapauksessa ad ogni a megfelele esattamente una b, toisessa tapauksessa osserviamo una trendi (più tai vähemmän vahva) ja non un legam uno-a-uno.

Kaikki "suhteiden sisäinen algebra" (siemistisessä mielessä) on mielenkiintoista omaisuutta, koska kivääriliike (ogni a è suhteessa itseensä), simmetria ((a, b) tarkoittaa (b, a)), antisymmetria (jos (a, b) ja (b, a) ovat a = b) ja transitiivisuus (kohtien (a, b) ja (b, c) perusteella seuraa (a, c)). Tämä ratkaisevan tärkeä kiinteistön omistaja: jos suhde on symmetrinen, symmetrinen ja transitiivinen diventa una vastaavuussuhde che "partiziona" A in classi di elementi vastaavat. Jos invece on riflessive, antisymmetric ja transitiivinen, me abbiamo una järjestyssuhde.

Tässä analyysissä sovellamme tätä ajatusta käytäntöön: arvioimme vaihtelun tyyppiä (kvantitatiivinen jatka, ordinali, nominali/dicotomiche) ja siellä sijoitus tässä tilastossa ja scegliamo strumenti adeguati per misurare la relazione, tietäen, että "relazione" ei aina tarkoita "syy-seuraus".

Visual ispezione: syö riconoscere kuvio ja suunta

Prima di buttarsi ei numeri, un sirontakaavio Se on älykkäimmän asian paino. Pilvi suoraan alaspäin viittaa johonkin. lineaarinen suhde (positiivinen tai negatiivinen); jäsennä indikatiivinen käyrä epälineaariset suhteet (monotoninen juttu). Jos et sisällytä kaavaa, lineaarinen suhde voi tuhota suostumuksen.

Pienellä vaihtelevuudella I pannelli di -sirontakaavio (ja esimerkiksi R:ssä, jossa parit(data)) ja viiva, jolla on taipumus smussate-kuvioon (geom_smooth ggplot2:ssa), jotta voit huomata yhdistykset, klusteri ja poikkeavatHuomio: gli-poikkeava Podeno influenzare moltissimo i coefficienti, laji Pearson.

Esimerkiksi kielessä R si può iniziare così: parit(data)

# Matrice di grafici a dispersione
pairs(dati)

# Correlazioni grezze (matrice)
cor(dati, use = "pairwise.complete.obs")

Ensimmäinen visuaalinen seulonta, numeron mukaan Siirry scegliere il test giustoon muodon, monotonisuuden ja lineaarisuuden ilmeisyyden perusteella.

Tarkista sen normaalius: tarjoillessasi davveroa

Moltin testin parametrit (esimerkki Pearsonin testistä). Oletan, että vaihtelevassa määrin, normaalius Almeno on symmetrinen rakenne ilman raskasta koodia. Ipoteesin hallitsemiseksi tulee tietty osa graafisesta rakenteesta tiheät isogrammit e QQ-kuvaaja.

R-kielellä, una vähimmäisakku potrebbe sisältää:

# Istogrammi con densità e curva normale sovrapposta
par(mfrow = c(2, 2))
plot_hist <- function(x) {
  hist(x, prob = TRUE)
  lines(density(x), col = "red")
  curve(dnorm(x, mean(x), sd(x)), add = TRUE, col = "blue")
}
plot_hist(dati$GASTEDU)
plot_hist(dati$GASAUDE)
plot_hist(dati$GASLAZER)
plot_hist(dati$IDADE)

Kvantitatiivisten havaintojen vertaamiseksi normaalin standardin havaintoihin, QQ-kuvaaja è korvaamaton:

par(mfrow = c(2, 2))
qqfun <- function(x) {
  qqnorm(x, main = "", xlab = "Quantili teorici N(0,1)", pch = 20)
  qqline(x, col = "red", lty = 1)
}
qqfun(dati$IDADE)
qqfun(dati$GASAUDE)
qqfun(dati$GASLAZER)
qqfun(dati$GASTEDU)

Pidä se näkyvissä, jos en voi käyttää sitä normaalin virallisen testin kumulaatiotodistusten mukaan: Kolmogorov–Smirnov parametriestimaateilla, Lilliefors, Cramér–von Mises, Shapiro–Wilk, Shapiro–Francia, Anderson–Darling e il testi di Pearson (chi-quadro) di normalità.

normalita <- function(x) {
  t1 <- ks.test(x, "pnorm", mean(x), sd(x))            # Kolmogorov–Smirnov
  t2 <- nortest::lillie.test(x)                         # Lilliefors
  t3 <- nortest::cvm.test(x)                            # Cramér–von Mises
  t4 <- shapiro.test(x)                                 # Shapiro–Wilk
  t5 <- nortest::sf.test(x)                             # Shapiro–Francia
  t6 <- nortest::ad.test(x)                             # Anderson–Darling
  t7 <- PearsonDS::pearson.test(x)                      # Pearson chi-quadro di normalità
  pv <- c(t1$p.value, t2$p.value, t3$p.value, t4$p.value, t5$p.value, t6$p.value, t7$p.value)
  data.frame(p_value = pv, row.names = c(t1$method, t2$method, t3$method, t4$method, t5$method, t6$method, t7$method))
}
normalita(dati$GASAUDE)

Jos nukun suunnilleen normaalisti ja suhde on lineaarinenPearsonin kerroin on hyvä kelttiläinen serkku; muuten on järkevää sekoittaa basate sui ranghia Spearmanin tai Kendallin kanssa.

liittyvät:  Murtolukujen korottaminen korkeampiin termeihin: murtolukueksponentit yksinkertaisesti.

Määrällisen vaihtelun välinen suhde: kovarianssi ja korrelaatio

La kovarianssi fra Ongelmana on kovarianssi riippuu misuran yksiköstä, he ovat vähän vertailukelpoisia.

La Pearsonin lineaarinen korrelaatio Ratkaise ongelma standardoimalla keskihajonnan mukaan: kerroin r vaihtelee välillä -1 ja 1, jolloin arvoksi saadaan ±1. lineaarinen vahva yhteys (positiivinen tai negatiivinen) ja 0 viittaa assenza di linearità. Huomaa: r = 0 ei sulje pois epälineaarisia relaatioita.

Korrelaatiolaskut R-kielellä:

# Coefficiente di Pearson e test di significatività
cor(dati$GASTEDU, dati$GASAUDE, method = "pearson")
cor.test(dati$GASTEDU, dati$GASAUDE, method = "pearson")

Kun yhteys on olemassa monotoninen ja epälineaarinen tai kun en nuku normaalisti (tai pidättelen poikkeavaa henkilöä), on järkevää käyttää Spearman (ranghi; vankka ja sovitettu keskisuurten ja grandi campionien kanssa) Kendall τ (basato su concordanze/discordanze; mieluummin su pienet mestarit (tai monilla pareggeilla):

# Correlazioni non parametriche
cor.test(dati$GASTEDU, dati$GASAUDE, method = "spearman")

# Su un sottoinsieme più piccolo, meglio Kendall
dati2 <- head(dati, 20)
cor.test(dati2$IDADE, dati2$GASAUDE, method = "kendall")

Hyödyllinen idea: määrityskerroin R² di un yksinkertainen lineaarinen malli palauttaa Y:n spiegata-muuttujan osuuden lineaarisesti X:stä. R:ssä:

summary(lm(GASAUDE ~ ESTCIVIL, data = dati))$r.squared

Muuttujakohtainen dikotomia vs. kvantitatiivinen, kerroin piste-biseriaalinen osuu yhteen Pearsonin laskennan kanssa, jossa on koodattu muuttuja 0/1; käytännössä väri (dikotominen, kvantitatiivinen) con-metodi = “pearson”.

Vaihtelevat luokat: indipendenza, assosiaatiovahvuus ja piccoli campioni

Kun unen vaihtelu tulee esiin nimellis- tai järjestysluvut, studion rentouttava tunnelma joukkotaulukot (usein doppia-luokituksen kanssa). Tyypillinen ipotesi on: H0 = indipendenza (tarpeellinen assosiaatio), kontrolli H1 = dipendenza.

Vertailutesti on se itsenäisen nelijalkaisenSe ci sono taajuus attese troppo basse (yleensä < 5), jos käytät sitä Yatesin korjaus per 2×2 o si passa al Fisherin tekemä testi, erityisesti campioni piccolin kanssa.

# Tabella incrociata e chi-quadro
xtabs(~ PROFI + ESTCIVIL, data = dati) -> tab1
chisq.test(dati$PROFI, dati$ESTCIVIL)  # p-value non significativo => indipendenza plausibile

# Campioni piccoli: test di Fisher
chisq.test(dati$PROFI, dati$RENDA)
fisher.test(dati2$PROFI, dati2$RENDA)

Per quantcare l'intensità dell'associazione taulukossa I×J, jos käytetään: V di Cramér (0-1), kontingenttikertoimet (0–1, rajoitus) ja 2×2 il:ssä phi (φ), joka on muodollisesti Pearson applicato alla tabella binaria.

# Misure di associazione per tabelle
library(vcd)
xtabs(~ PROFI + RENDA, data = dati) -> tab2
assocstats(tab2)  # riporta V di Cramér, coeff. di contingenza e test

# Attenzione: cor() su codifiche numeriche di categorie non è equivalente a φ in generale

Se, että kohtaaminen on vastakkainasettelua gruppi sen määrällinen vaihtelu (es. reddito per professione), jos valutano t-testi, ANOVA e le rispettive vaihtoehto ei parametriche, no intervalli di confidenza. Yleensä, vaihtelevuuden tyypin ja menetelmän koherenssi on kriittinen.

liittyvät:  Mihin numeroita käytetään? Kuusi pääkäyttöä

Accordo tra valutator: Kappa di Cohen

Kun due (tai più) giudici luokittele no gli stessi oggetti luokkaan, ei riitä, että sekoitetaan hyväksymisprosentti, perché a quota può essere dovuta al tapaus. se Kappa di Cohen kvantifioi oikean yksimielisyyden satunnaiselle sopimukselle: Arvostin edelleen nollaan osoittaen yksimielisyyden kussakin tapauksessa, arvostin maggiori suggeriscono kasvava sopimus (interpretazioni comuni: scarso, hillitty, moderato, buono, molto buono).

In R è possibile stimare Kappa anche in version ponderata (tavallisissa luokissa):

set.seed(1)
val1 <- sample(0:1, 10, replace = TRUE)
val2 <- sample(0:1, 10, replace = TRUE)

# Kappa non ponderato
fmsb::Kappa.test(val1, val2)

Jos kategoria ei ole luonnollinen järjestys (ad empio, lieve/moderata/severa), Kappa ponderato penalizza minor erimielisyyksissä "vicini" ja più quelli "lontani", tuloksena on spesso più informatiivinen.

Relazioni and variabili di confusione: la correlazione parziale

Può capitare che due variabili X e Y sembrino molto korreloi, mutta realtà la vahvuus dell'associazione sia dovuta a una epäselvä muuttuja Z korreloi entraben kanssa. Kyseenalaista, jos napsautat sitä osittainen korrelaatio X:n ja Y:n ohjaus Z:n mukaan.

R:ssä ggm::pcor si ottiene la correlazione parziale di primo ordine e si può testne la significatività. On hyödyllistä vertailla klassinen r e r parziale per capire nimellä Z “spiega” del legam grezzo.

library(ggm)
# Correlazione parziale tra GASLAZER e GASAUDE controllando GASTEDU
rp <- pcor(c("GASLAZER", "GASAUDE", "GASTEDU"), var(dati))

# Correlazione grezza
r  <- cor(dati$GASLAZER, dati$GASAUDE)

# Test della correlazione parziale (1 variabile di controllo)
pcor.test(rp, 1, length(dati$GASAUDE))

# Confronto R^2 grezzo vs parziale
data.frame("Senza_controllo" = r^2, "Con_controllo" = rp^2)

Jos spiegata-kiintiö "crollas" dopo il controllo, nyt Z oli tärkeä konfederaation jäsenKun kontrollimuuttuja on kategoria (esim. professione), en voi käyttää vastaavia lähestymistapoja tai malleja, jotka sisältävät kategorian tekijänä.

Korrelaation käytön raja ja hyvä käytäntö

Pearsonin kertoimen seos vain lineaarisuusJos suhde on epälineaarinen (neliöllinen, sponensiaalinen, logaritminen), se voi johtaa arvoon 0 vahvan riippuvuuden läsnä ollessa. Kyseisessä tapauksessa arvot Spearman, muuttaen sen epälineaariseksi malliksi.

gli poikkeama En voi vääristää tulosta. Tästä syystä on ensinnäkin kätevää tarkistaa kuvaaja ja tarvittaessa suorittaa robusti analyysi tai tarkistaa tulosten herkkyys samanaikaisesti.

Toinen klassikko: korrelaatio ≠ syy-seuraussuhde. Vaihtelun vuoksi en pysty korreloimaan perché uni-influenzaattia antaa kolmannen rasvan, pelkkä sattuma tai käänteisen mekanismin vaikutus. Servono disegni sperimentali, strumenti causali o modeli appropriati per parlare di causa-effetto.

Suhteen tyyppi: lineaarinen, monotoninen, nolla, kategorinen

Nei casi misti (kvantitatiivinen vs dichotomica/nominale/ordinata) se läpäisee ryhmien, correlazioni biseriali/point-biserial oa vastakkainasettelun testin MODELLI (mainosesimerkki regressiosta ennustettujen tekijöiden avulla). Vaihtelevuudella luokittelematon, ci si affida a chi-quadro/Fisher e all misure di force dell'associazione già viste.

Funzioni syö erityisiä suhteita

Una toiminto Se on suhde, joka yhden toimialueen elementin osalta yhdistää täsmälleen yksi elementti osakehuoneistosta. Yhteenvetona voidaan todeta, että se on A×B-kertomuksen sottoinsieme, joka ogni a:ssa A vertaa sola voltaa ensimmäiseen komponenttiin. Muita tärkeitä laskutoimituksia uneen liittyvässä algebrassa: liitto (R1 ∪ R2), leikkauspiste (R1 ∩ R2), koostumus (R2 ∘ R1) ja käänteinen (R^{-1}, che scambia ciascuna coppia (a, b) kohdassa (b, a)).

nämä käsitteellinen matto tornano käyttää häntä nellassa puhdasta matematiikkaa (equivalenze, ordini, classi di equivalenza) sia sovelluksissa betonikyhky palvelee formalizzare suhteita entità.

Annoin suhteiden ja luonnontieteiden algebran

Tietokannan maailmassarelaatioalgebra Tämä on SQL:n teoreettinen rakenne: miten sitä käytetään valitse, proiezione, join, unione ja intersezione sono versioni pratiche di operazioni su relazioni-insiemi. Tämä formalisointi on tehokas ase asioiden nopeaan kuvaamiseen, optimointiin ja manipulointiin.

liittyvät:  Murtolukujen yhteen- ja vähennyslasku eri nimittäjillä (LCM selitettynä)

Sisällä keinotekoinen äly ja koneoppiminen, kyky mallintaa suhteita mahdollistaa konossenssigraafien, kilpailevien järjestelmien ja integrointiputken rakentamisen; Tämä arvo pätee taloustieteessä, biostatistiikassa ja yhteiskuntatieteissä, se on lähes aina "chi on legato chi ja che-tilassa".

Klassisia esimerkkejä insiemi-teorian suhteista

Relaziones di ekvivalenssi: uni riflessiivinen, symmetrinen ja transitiivinen. Esimerkit, kuten "on tämä arvo ratkaisuna", ovat todella todellisia tai olemassa kongruenssi modulo n Ehdotin sisäisesti. Ogni-ekvivalenssisuhde indusoi vastaavat luokat che ripartiscono l'insieme in blocchi disgiunti.

Relaziones d'järjestys: riflessive, antisimmetriche ja transitiivinen. Esempi: ≤ sui numeri naturali, l'inclusione ⊆ sull'insieme delle parti P(X), o "jakaa" (|) sui naturali. Fundamentaalinen uni määritelmän mukaan kokonaismääräisesti tai osittain ja alueittain ovat sen massimi, minimi, kateeni ja antiketjut.

järjestys lesikografinen: juuri niin sanoin. Se on järjestys sekvenssissä (merkkijono, sekvenssiin kirjoitettu numero), joka vertailee elementti elementiltä; Tässä rakenteessa on tärkeä kohina, ja laiminlyön algoritmit.

Tämä osio on hyödyllinen sen ymmärtämiseksi, että ”relazione” on matematiikan käsite più ampio della sole correlazione: sisältää uguaglianze, ordini, kokoonpano ja paljon muuta, kaikki välttämättömiä Modelare System complessille.

Käytännön työnkulku: hallitse tuloksia

Mahdollinen työvirta joten et menetä sitä, jos instrumentoit ja missä:

  • Graafinen tarkastus: sirontakuvaaja, tasoitus, istogrammi, QQ-kuvaaja. Occhio a outlier e forma non lineaari.
  • TarkistaJos se toimii, testaa normaalius; Tarkista omaskedastisyyden taso, jos lineaarinen malli on odotettavissa.
  • Kertoimen skaala: Pearson (lineaarinen, circa normaali), Spearman/Kendall (monotoninen/ei normaali/piccoli campioni).
  • Luokittelu: chi-quadro/Fisher + misure d'associazione (V di Cramér, coeff. di contingenza, φ). Ryhmävertailua varten t-testi/ANOVA tai vaihtoehto.
  • Luottamus: korreloi parziale- tai monimuuttujamallia (mukaan lukien luokka fattori).

Qualunque sia la scelta, tulkita asiayhteydessä Se on chiave: grandezza dell'effetto, merkitsevä tilasto, ampiezza del campione e qualità dei dati contano como (ellei più) del numero finale.

R-koodin tallentamien esimerkkien

Riassumendo alcune chiamate utili mikä tekee siitä tarkemman muuttujien välisen suhteen analysoinnissa ja jota voidaan mukauttaa omaan tietojoukkoosi:

# 1) Correlazioni
cor(x, y, method = "pearson")
cor.test(x, y, method = "spearman")
cor.test(x_small, y_small, method = "kendall")

# 2) Grafici (base e ggplot2)
plot(x, y)
# ggplot2: geom_point() + geom_smooth(method = "lm" o se = FALSE)

# 3) Normalità
shapiro.test(x)
nortest::ad.test(x)

# 4) Tabelle e test
xtabs(~ a + b, data = dati) -> tab
chisq.test(tab)
fisher.test(tab)  # campioni piccoli o celle con attesi < 5
vcd::assocstats(tab)  # V di Cramér e coeff. di contingenza

# 5) Kappa
afmsb::Kappa.test(giudice1, giudice2)

# 6) Correlazione parziale
ggm::pcor(c("x", "y", "z"), var(dati))

Käytännön huomautus: tietojen perusteella "suurin" scelte. Hypoteesin validointi, menetelmän vertailu ja, jos se toimii, pikolo-skriptin laatiminen kysymyksen nopeaksi ja luotettavaksi diagnosoimiseksi kannattaa.

Abbiamo näki, että "relazione" voi tarkoittaa useammin kuin ei: lineaarista muotoa Pearsonin kanssa, yksitoikkoisuutta Spearmanin/Kendallin kanssa, ohutta all'assosiaatiota kategoriassa chi-quadro/Fisherin kanssa ja misurea V di Cramérin ja φ:n kanssa; senza dimenticare sopimus giudicin (Kappa) ja johdon välillä Annoin confondenti parziale-korrelaatioon. Siksi relaatioalgebra fornisce i mattoni concettuali per definee dominio, inversa e composizione, mentre the relaatioalgebra ohjaa tilaa, jossa arkistointi ja interroghiamo i dati nei tietokanta. Chiave idea on scegliere lo strumento in base al type di variabili, alla forma del legam e agli obiettivi dell'analisi, ricordandoci che nessun coefficiente, da solo, può raccontare tutta la storia.

Aiheeseen liittyvä artikkeli:
13 matemaattisten funktioiden tyyppiä (ja niiden ominaisuudet)