Tukaj je opisano, kako uporabljati Excelova vgrajena orodja za lažjo statistično analizo.
Grafi ostankov igrajo bistveno vlogo v regresijski analizi. Povedo vam, kako natančno vaša regresijska črta predstavlja razmerje med dvema spremenljivkama. Naslednji vodnik pojasnjuje, kako izračunati in narisati Excelove reziduale z uporabo dveh metod.
Toda preden preidemo na dobre stvari, na kratko razumemo ostanke in njihov pomen v regresijski analizi.
Kaj so ostanki in zakaj so pomembni?
Rezidual je razlika med opazovano (dejansko) vrednostjo in napovedano vrednostjo. Preprosteje rečeno, ostanek je napaka. Na primer, če je opažena vrednost 10 in je vaš model dal vrednost 8, bi bila preostala vrednost 2.
Po drugi strani pa je graf ostankov razpršeni graf, pri katerem je neodvisna spremenljivka (starost) narisana na vodoravni osi, ostanki (napake) pa na navpični osi.
Ok, veste, kaj so reziduali, ampak zakaj so pomembni? Če želite to razumeti, razmislite o naslednjem primeru:
Želimo razumeti razmerje med starostjo in stopnjo varčevanja. Za to bomo narisali regresijsko črto. Vendar nismo prepričani, ali regresijska črta natančno predstavlja razmerje med obema spremenljivkama. Tu pridejo na vrsto ostanki. Za preverjanje točnosti regresijske črte uporabljamo graf ostankov.
Zdaj, ko veste, kaj so ostanki, se naučimo, kako ustvariti izris ostankov v Excelu:
Kako ustvariti graf ostankov z enačbo črte trenda
Prva metoda risanja ostankov v Excelu uporablja enačbo črte trenda za izračun predvidenih vrednosti za naše podatke. Ko to imamo, lahko izračunamo ostanke tako, da od opazovanih vrednosti odštejemo predvidene vrednosti. Nazadnje ustvarimo raztreseni graf s prediktorji na vodoravni osi in ostanki na navpični osi.
Čeprav ta metoda zahteva več korakov kot druga metoda, je odličen način za razumevanje koncepta. Ko boste dobro razumeli, lahko uporabite drugo metodo, ki zahteva manj časa in truda.
Vodimo vas skozi postopek, korak za korakom:
1. korak: Vnesite podatke
Začnemo z vnosom vrednosti za napovedovalec (pod X stolpec) in opazovane vrednosti (pod Y stolpec):
2. korak: Ustvarite raztreseni grafikon podatkov
Zdaj ustvarimo razpršeni graf podatkov tako, da sledimo spodnjim korakom:
Če niste seznanjeni z razpršenimi grafi, je tukaj obsežen članek o tem ustvarjanje razpršenega grafa v Excelu in predstavitev vaših podatkov. Lahko se tudi naučite uporabite razpršeni grafikon v Excelu za predvidevanje vedenja podatkov.
- Izberite podatke (pod X in Y stolpci).
- Pojdi na Excelov trak in kliknite Vstavi.
- V Grafikoni kliknite puščico pod Graf raztrosa možnost.
- Izberite prvo raztreseno ploskev (Razpršite samo z markerji).
- Dobili boste razpršeni graf, podoben naslednjemu grafikonu:
3. korak: dodajte trendno črto in prikažite enačbo trendne črte na raztreseni ploskvi
Sledite spodnjim korakom, da dodate linijo trenda na razpršeni grafikon:
- Kliknite na razpršeni graf.
- Pojdi na Excelov trak in kliknite Postavitev.
- V Ozadje kliknite puščico pod Linija trenda ikona.
- Izberite Linearna linija trenda možnost.
Zdaj boste videli črto (trendno črto), ki seka pike na vašem razpršenem grafu. Za prikaz enačbe trendne črte na raztreseni grafu sledite spodnjim korakom:
- Pojdite znova na Linija trenda ikono in kliknite puščico pod njo.
- Kliknite Več možnosti Trendline.
- A Format Trendline pojavilo se bo pogovorno okno.
- Preverite Prikažite enačbo na grafikonu možnost na dnu Format Trendline pogovorno okno. Enačba trendne črte bo prikazana na grafu.
4. korak: Izračunajte predvidene vrednosti
Če želite izračunati predvidene vrednosti, ustvarite še en stolpec (Z) poleg svojih podatkov in sledite spodnjim korakom:
- Vnesite formulo črte trenda, prikazano na grafu, in jo prilepite pod stolpec Z (celica C2). Spremenite x v formuli z vrednostmi pod stolpcem X.
- Torej bi bila za prvo predvideno vrednost formula podana takole:
=1,5115*A2+23,133
- Zamenjati A2 z A3 v formuli trendne črte za drugo predvideno vrednost.
- Za tretjo predvideno vrednost zamenjajte A3 z A4in tako naprej, dokler ne dobite vseh predvidenih vrednosti za njihove ustrezne napovednike.
5. korak: Poiščite preostale vrednosti
Zdaj, ko imamo predvidene vrednosti, lahko poiščemo preostale vrednosti tako, da odštejemo predvidene vrednosti od opazovanih (dejanskih) vrednosti pod stolpcem Y. Formula za prvo preostalo vrednost bi bila =B2-C2. Za drugo bi bila formula =B3-C3, in tako naprej.
6. korak: Ustvarite rezidualni izris
Za ustvarjanje rezidualne ploskve potrebujemo napovedovalec in rezidualne vrednosti. Zdaj, ko imamo oboje, sledite spodnjim korakom:
- Izberite stolpce Y in Z.
- Desni klik in izberite Skrij se.
- Zdaj izberite X in Ostanki stolpce.
- Pojdi na Vstavi na Excelovem traku.
- Kliknite puščico pod Razpršenost ikona.
- Izberite Raztresite samo z markerji možnost.
- Dobili boste svojo rezidualno ploskev, kot je prikazano spodaj.
Pri drugi metodi je vse, kar morate storiti, to, da Excelu posredujete podatke in ta opravi vse delo. Graf ostankov lahko ustvarite v samo nekaj klikih. Za to pa boste morali naložiti Excelov Analysis Toolpak. Začnimo:
- Pojdi na mapa zavihek in kliknite Opcije.
- The Excelove možnosti pojavilo se bo pogovorno okno.
- Pojdi na Upravljaj polje (na dnu), izberite Excelovi dodatkiin kliknite pojdi.
- An Dodatki pojavilo se bo pogovorno okno.
- Preverite Paket orodij za analizo polje in kliknite v redu.
- Zdaj pa pojdi na Excelov trak in kliknite podatki.
- Boste našli Analiza podatkov ikona v Analiza razdelek.
2. korak: Vnesite podatke
- Izberite stolpce A in D, in kliknite z desno tipko miške. Kliknite Razkrij.
- Zdaj kopirajte X in Y stolpce.
Opazili boste, da se je graf spremenil, ko ste razkrili stolpce. Če ga želimo spremeniti nazaj na prvotni preostali izris, bomo morali skriti Y in Z stolpce (z izbiro Y in Z stolpce, z desnim klikom miške in izbiro Skrij se).
- Odprite nov Excelov list in prilepite X in Y stolpce.
- Kliknite na novo prikazano Analiza podatkov možnost v Analiza del od podatki zavihek.
- A Analiza podatkov pojavilo se bo pogovorno okno.
- Poiščite in izberite Regresija Spodaj Orodja za analizo.
- Kliknite V REDU. The Regresija pojavilo se bo pogovorno okno.
- Vnesite vrednosti v Y stolpec (napovedovalci, B2:B11) v Vnesite območje Y polje.
- Vnesite obseg celic v X stolpec (neodvisne spremenljivke, A2:A11) v Vnos obsega X polje.
3. korak: Ustvarite rezidualni izris
V Regresija pogovorno okno pod Izhodne možnosti, preveri Nov delovni list Plyin kliknite v redu.
Excel bo samodejno ustvaril graf ostankov skupaj z naslednjimi rezultati, ki jih lahko uporabite za preverjanje zanesljivosti vašega regresijskega modela:
- Regresijska statistika
- Tabela ANOVA
- Tabela koeficientov
- Preostali izhod
Excelov paket orodij Analysis ToolPak ponuja vrsto dragocenih statističnih funkcij, ki jih lahko uporabite za analizo naborov podatkov. Ko ustvarite rezidualni izris z Excelovim orodjem Analysis ToolPak, se boste morda začeli praskati po glavi, ko boste gledali vse zapletene tabele. Toda ko se enkrat naučite izvajati temeljno analizo podatkov v Excelu, številke ne izgledajo več tako strašljivo.