Medtem ko uporabljate Google Preglednice za delo z dvema nizoma podatkov, boste morda želeli oba primerjati tako, da določite stopnjo vpliva enega na drugega.
Korelacije lahko ponudijo vpogled v to, ali obstaja napovedna povezava med ravninama x in y, vendar ne kažejo nujno na vzročnost. Tukaj je opisano, kako lahko uporabite Google Preglednice za prepoznavanje korelacije v svojih podatkih.
Kaj je korelacija in za kaj jo lahko uporabite?
Ko sta dve spremenljivki povezani, lahko ena ugotovi, kako spremenljivka vpliva na drugo. Vendar si je ključnega pomena zapomniti, da korelacija v tem primeru ne pomeni zanašanja; samo kaže, kako tesno in hitro se dve spremenljivki primerjata ali povezujeta.
Statistične meritve pomagajo pri razumevanju osnovnih trendov v analizi podatkov. Korelacija je med najpogosteje uporabljenimi statističnimi meritvami in določa, kako tesno povezani ali odvisni sta dve spremenljivki.
Razumevanje korelacijskega koeficienta v Google Preglednicah
V Google Preglednicah se korelacijski koeficient izračuna s funkcijo CORREL. Korelacijski koeficient služi kot merilo, kako tesno so povezani nizi podatkov. Uporabite ga lahko za pridobitev Pearsonovega korelacijskega koeficienta produkt-moment (r), če imate dva spremenljiva niza podatkov. Če želite izvedeti več o tem koeficientu, lahko preberete več v tem vodniku od
Statistika pri Leardu.Lahko bi naleteli na eno od treh korelacijskih metrik. Vsaka meritev drugače opredeljuje razmerja med spremenljivkami. Njegova vrednost je med -1 in +1:
- -1 označuje popolno negativno korelacijo: Če ima korelacija korelacijski koeficient, ki je enak ali nižji od -0,9, velja, da je močno negativna. To je znak, da so podatki povezani. Vendar pa spremenljivka x še naprej narašča, spremenljivka y pa pada.
- 0 pomeni, da ni povezave: Šteje se, da spremenljivke ne korelirajo, če je korelacijski koeficient večji od 0,01, vendar manjši od 0,1, saj med vsako spremenljivko ni opazne povezave. Neodvisni so drug od drugega.
- +1 označuje popolno pozitivno korelacijo: Ko korelacijski koeficient pade med 0,9 in 1, se šteje za zelo pozitivnega. Kaže, da je prišlo do povečanja dveh nizov spremenljivk.
Najvišja vrednost koeficienta je lahko korelacijski koeficient 1. Ko je vrednost korelacije 1, to pomeni, da bi bili podatki popolnoma poravnani, da bi ustvarili ravno črto, če bi podatke prikazali v grafu.
Če ste še vedno malo izgubljeni, ne skrbite. Razložili vam bomo sintakso funkcije CORREL in se nato poglobili v nekaj primerov iz resničnega sveta, da jo boste bolje razumeli. Razumevanje linij, ki se najbolje prilegajo in kako narediti trendne črte v Google Preglednicah vam bo pomagal pri tem.
Sintaksa funkcije CORREL v Google Preglednicah
=CORREL(podatki_y, podatki_x)
Razčlenimo to na dele in bolje razumemo, kaj pomeni vsaka fraza:
- =CORREL: To je funkcija Google Sheet, ki določa r (Pearsonov korelacijski koeficient produkt-moment nabora podatkov).
- podatek_y: To se nanaša na skupino celic, ki vsebujejo odvisne podatke ali obseg vrednosti za te celice.
- podatki x: To je sklic na niz celic z neodvisnimi podatki ali obseg vrednosti za te celice.
Če bi grafično prikazali podatkovne točke, bi bil podatek_y os Y, podatek_x pa os X. Opazili boste, da obstajata dva različna načina za vnos obsega podatkov. Možnosti so obseg referenčnih celic ali neposredni vnos podatkov v funkcijo.
V večini primerov je boljša uporaba obsega referenčnih celic. To je zato, ker preglednica najverjetneje že vsebuje vaše podatke. Z uporabo obsega referenčnih celic se lahko izognete pretiranemu vnosu, ki lahko povzroči napako uporabnika.
Primeri funkcij CORREL v Google Preglednicah
Oglejmo si nekaj primerov, da razumemo, kako uporabljati funkcijo CORREL v Google Preglednicah.
Primer 1: Močna pozitivna korelacija
Za ta prvi primer se pretvarjajmo, da delamo v nepremičninski industriji. V spodnji preglednici imamo razdelitve hektarjev zemljišč, ki jih prodajate, in število prodanih enot podatkov o teh različnih zemljiščih v vaši Google Preglednici.
- Če sledite na listu, boste začeli z vnosom podatkov spremenljivk v vašo preglednico, kot je prikazano spodaj:
- Kliknite celico C2
- Vrsta =CORREL(
- Nato boste nadaljevali z vnosom data_y, ki je v našem primeru obseg celic, na katerega se sklicujete A2:A6, nato vnesite vejico.
- Nadaljujte z vnosom data_x, ki je v našem primeru označen kot B2:B6.
- Končajte z oklepajem, kot je prikazano spodaj:
- Nazadnje pritisnite Vnesite za vrnitev korelacijskega koeficienta dveh podatkov v celici C2.
Z uporabo zgoraj prikazanega primera ste dobili korelacijski koeficient 0,90, kar je močna pozitivna korelacija, saj njegova vrednost pade med 0,9 in 1. Zato to kaže, da se s spreminjanjem y spreminja tudi x na bistveno primerljiv način.
Spodaj je predstavitev naših primerov vzorčnih podatkov na XY razpršenem grafu. Kot lahko vidite, je črta najboljšega prileganja blizu podatkovnih točk na grafu, kar podpira idejo, da sta številki močno povezani.
Izvedete lahko več o ustvarjanje XY razpršenih grafov v Google Preglednicah v našem drugem članku.
Primer 2: Šibka negativna korelacija
Tokrat bomo v naši preglednici uporabili bolj splošen primer »spremenljivke x in y«. Namenoma smo vključili številke za prikaz negativne korelacije, ki jo prikazuje funkcija CORREL spodaj:
Med spremenljivkama y in x ni močne povezave, zato je rezultat, ki ga dobimo, manj pomemben korelacijski koeficient kot v prejšnjem primeru. Rezultat, ki smo ga dosegli, je -0,47. Vendar to ne pomeni, da korelacije sploh ni. Ponovno poglejmo linijo, ki se najbolje prilega, da jo razumemo.
Kot lahko vidite na grafu razpršenosti, so podatkovne točke dlje od črte najboljšega prileganja. Korelacije je torej manj kot v prvem primeru, ne pa nobene. Opazili boste tudi, da se linija najboljšega prileganja zmanjšuje. To kaže negativno korelacijo, ena vrednost se zmanjšuje, druga pa narašča.
Primer 3: Brez povezave
Tukaj imamo nabor popolnoma naključnih števil. Na hitro se znova dotaknimo uporabe funkcije CORREL:
- Vnesite celico C2 formulo CORREL
- Naši argumenti so A2:A10 in B2:B10
- Pritisnite Enter
Vrednost, vrnjena na C2, je 0,02. Če korelacijski koeficient pade med 0,01 in 0,1, se ugotovi, da zadevni spremenljivki nista v korelaciji, ker med njima ni opazne povezave. Razmerja med spremenljivkami so popolnoma neodvisna.
Spodaj je predstavitev istega na razpršenem grafu. Črta najboljšega prileganja je skoraj ravna, kar kaže na majhno korelacijo med obema nizoma podatkov.
Preprosto povežite svoje podatke v Google Preglednicah
Korelacija bi lahko bila zahtevna tema, če se z njo v srednji šoli niste veliko ukvarjali. Ta vodnik je zajemal vse osnove, vendar boste morali še naprej uporabljati funkcijo CORREL v Google Preglednicah, da jo boste ohranili v spominu.
To je zmogljiva funkcija, saj pomaga preprečiti ustvarjanje razpršenih grafov in lahko hitro najde trende v vaših podatkih. Kljub temu naj vas ne bo strah dodati grafikone, da bi drugim uporabnikom pomagali bolje razumeti podatke v vaših preglednicah.