Sådan beregnes Covariance

Covariance er en statistisk beregning, som kan hjælpe dig med at forstå, hvordan to sæt data er relateret til hinanden. Lad os f.eks. Sige, at der er antropologer, der studerer højderne og vægten af ​​befolkningen på et givet sted. For hver person i undersøgelsen kan højde og vægt være repræsenteret af et terning (x, y). Disse værdier kan bruges med en standard formel til at beregne kovariansforholdet. Denne artikel vil først forklare de beregninger, der fører til opdagelsen af ​​kovariansen i et givet sæt. Så vil han håndtere to mere automatiserede måder at få resultatet på.

trin

Metode 1
Beregning af kovarians for hånd med standardformlen

Billedbetegnelse Beregn Covariance Trin 1
1
Lær standardformlen for kovarians og hvad dens dele er. Standardformlen til beregning af kovarians er Σ(xjeg-xwith)(yjeg-ywith)/(n-1){ displaystyle Sigma (xi-x med)} (yi -y med)} / (n-1)}.For at bruge det skal du forstå betydningen af ​​følgende variabler og symboler:
  • Σ{ displaystyle sigma}: Dette symbol repræsenterer det græske bogstav "sigma". I matematiske funktioner repræsenterer det summen af ​​den række af værdier, der ledsager den. I denne formel indikerer Σ-tegnet, at du beregner følgende værdier i fraktionstælleren og tilføjer dem, før de deles af nævneren.
  • xjeg{ displaystyle x_ {i}}: I dette tilfælde repræsenterer `i`-abonnementet en tæller eller et indeks. Det indikerer, at du vil udføre beregningen af ​​hver af de x-værdier, der er til stede i datasættet.
  • xwith{ displaystyle x med}: "med" angiver, at x (med) repræsenterer middelværdien af ​​alle punkter ved x. Dette betyder også, at man kan skrive som en x med en lille vandret linie over det. I dette tilfælde kaldes variablen "x bar", men repræsenterer stadig gennemsnittet af datasættet.
  • yjeg{ displaystyle y_ {i}}: igen, repræsenterer `i`-abonnementet en tæller eller et indeks. Det indikerer, at du vil beregne hver af de y-værdier, der er til stede i datasættet.
  • ywith{ displaystyle og med}: "med" angiver, at y (med) repræsenterer middelværdien af ​​alle punkter i y. Dette betyder også, at du kan skrive som en y med en lille vandret linje over det. I dette tilfælde kaldes variablen "y", men den repræsenterer stadig gennemsnittet af datasættet.
  • n{ displaystyle n}: Denne variabel repræsenterer antallet af elementer, der er til stede i datasættet. Husk at i et kovariansproblem består et enkelt "element" af både en værdi i x og en værdi i y. Værdien n er et par datasæt, ikke et enkelt nummer.
  • Billedbetegnelse Beregn Covariance Trin 2
    2
    Forbered din datatabel. Før du begynder beregningerne, skal du først indsamle dine data. Lav et bord med fem kolonner og giv hver af dem følgende navne:
    • x{ displaystyle x}: I denne kolonne indtastes værdierne for datapunkterne i x.
    • y{ displaystyle og}: I denne kolonne indtastes værdierne for datapunkterne i y. Pas på at justere værdierne ved y med de tilsvarende værdier ved x. I et kovariansproblem er rækkefølgen af ​​datapunkterne og parringen mellem x og y vigtige.
    • (xjeg-xwith){ displaystyle (x_ {i-x-med}}}: Lad denne kolonne være tom i starten. Efter gennemsnittet af datapunkterne ved x bliver den udfyldt.
    • (yjeg-ywith){ displaystyle (y_ {i} -y}}}}: Lad denne kolonne være tom i starten. Når du har gennemsnittet datapunkterne i y, bliver den udfyldt.
    • Prdendutden{ displaystyle produkt}: Lad også denne sidste kolonne stå tom. Du vil udfylde det som du går i opløsning.
  • Billedbetegnelse Beregn Covariance Trin 3
    3
    Beregn gennemsnittet af datapunkterne ved x. Dette datasæt indeholder ni tal. At beregne gennemsnittet mellem dem, lægge dem sammen og dividere med 9. Som følge heraf får man 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Ved at dividere denne værdi med 9 bliver gennemsnittet 4,89. Dette er værdien, der skal bruges som x (med) i de følgende beregninger.
  • Billedbetegnelse Beregn Covariance Trin 4
    4
    Beregn gennemsnittet af datapunkterne i y. På samme måde vil kolonne y bestå af ni datapunkter, der svarer til værdierne ved x. Beregn middelværdien af ​​disse værdier. I dette datasæt har vi det 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Opdele dette resultat med 9 for at få et gennemsnit på 5,44 til at bruge det som y (med) i de følgende beregninger.
  • Billedbetegnelse Beregn Covariance Trin 5
    5
    Beregn værdierne for (xjeg-xwith){ displaystyle (x_ {i-x-med}}}. For hvert emne i kolonne x skal du beregne forskellen mellem tallet og middelværdien. I dette problem skal du trække 4,89 fra hvert datapunkt i x. Hvis den oprindelige værdi er under gennemsnittet, bliver resultatet negativt. Hvis det på den anden side er over gennemsnittet, vil resultatet være positivt. Vær opmærksom på negative tegn.
    • For eksempel er de første datapunkter i x-kolonnen lig med 1. Den værdi, der skal indsættes i kolonneens første række (xjeg-xwith){ displaystyle (x_ {i-x-med}}}vil være lig med 1-4,89 eller -3,89.
    • Gentag processen med hvert datapunkt. Så den anden linje vil ligge 3-4,89, eller -1,89. Den tredje linje svarer til 2-4,89 eller -2,89. Fortsæt processen med alle datapunkter. I dette tilfælde, at de ni numre af kolonnen svare -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89 og -0,89 .
  • Billedbetegnelse Beregn Covariance Trin 6

    Video: Kovarians och korrelation

    6
    Beregn værdierne for (yjeg-ywith){ displaystyle (y_ {i} -y}}}}. I denne kolonne vil du lave lignende subtraktioner ved hjælp af datapunkterne i y og middelværdierne i y. Hvis det oprindelige datapunkt er mindre end gennemsnittet, bliver resultatet negativt. Hvis det på den anden side er højere end gennemsnittet, vil resultatet være positivt. Vær opmærksom på negative tegn.
    • I første linie vil beregningen være 8-5.44 eller 2.56.
    • Den anden linje svarer til 6-5,44 eller 0,56.
    • Fortsæt med at gøre subtraktionerne til slutningen af ​​datalisten. Når de er færdige, vil de ni værdier være lig med 2,56, 0,56, 3,56, -1,44, -2,44, -2,44, -3,44, 1,56 og 1,56.
  • Billedbetegnelse Beregn Covariance Trin 7
    7
    Beregn produkterne i hver linje. Du vil udfylde rækkerne i den endelige kolonne ved at gange de beregnede tal i de forrige kolonner af (xjeg-xwith){ displaystyle (x_ {i-x-med}}}og (yjeg-ywith){ displaystyle (y_ {i} -y}}}}.Arbejd altid linie for linje, multiplicere de to tal med de tilsvarende datapunkter. Vær altid opmærksom på eventuelle negative signaler.
    • I den første linje, den (xjeg-xwith){ displaystyle (x_ {i-x-med}}}beregnet er lig med -3,89, og værdien af (yjeg-ywith){ displaystyle (y_ {i} -y}}}}skal svare til 2,56. Produktet af begge værdier er -3,89 * 2,56 = -9,96.
    • I den anden linje skal du multiplicere de to tal: -1.88 * 0.56 = -1.06.
    • Fortsæt med at multiplicere række for række til slutningen af ​​datasættet. Når du er færdig, de ni værdier i kolonnen er lig med -9,96, -1,06, -10,29, -0,16, -7,59, -5,15, -24,46, -4,51 og -1,39.
  • Billedbetegnelse Beregn Covariance Trin 8
    8
    Beregn summen af ​​værdierne i den sidste kolonne. Det er her, hvor Σ symbolet kommer i spil. Når du har lavet alle de beregninger du har gjort indtil videre, skal du tilføje resultaterne. Med hensyn til stikprøvedatasættet har du ni værdier i den endelige kolonne. Derefter dæmpe dem. Vær opmærksom på, om hvert tal er positivt eller negativt.
    • For dette datasæt bliver summen -64,57. Skriv denne total i rummet nederst i kolonnen. Det repræsenterer tællerværdien i standardkovariansformlen.
  • Billedbetegnelse Beregn Covariance Trin 9
    9
    Beregn nævneren af ​​kovariansformlen. Tælleren for standardformlen er repræsenteret af det tal, du netop har beregnet. Nævneren er igen repræsenteret af (n-1), det vil sige en værdi en enhed mindre end antallet af par i datasættet.
    • I dette eksempel er der ni par data, således at n er lig med 9. Således er værdien af ​​(n-1) lig med 8.
  • Billedbetegnelse Beregn Covariance Trin 10
    10
    Opdel tælleren af ​​nævneren. Det sidste trin i beregning af kovarians er at opdele tælleren, Σ(xjeg-xwith)(yjeg-ywith){ displaystyle Sigma (xi-x-med)} (y_i -y-med)}},ved nævneren (n-1){ displaystyle (n-1)}.Kvoten vil være lig med dataernes kovarians.
    • I dette eksempel vil beregningen resultere i -64,57 / 8, hvilket svarer til -8,07.
  • Metode 2
    Brug et Excel-regneark til at beregne Covariance

    Billedbetegnelse Beregn Covariance Trin 11
    1
    Overhold de gentagne beregninger. Covariance er en beregning, som nogle gange skal gøres for hånden, så du forstår hvad resultatet betyder. Men hvis du skal bruge covarians værdier rutinemæssigt at fortolke data, er det vigtigt at finde en hurtigere, mere automatiseret måde at få resultater. På dette tidspunkt, vil du have bemærket, at der for den relativt lille datasæt, med ni par, inkluderet beregninger opdage to midler, behøver 18 enkeltværelser subtraktioner, multiplikationer ni separat, en sum og en endelig division. Der var 31 små beregninger for at nå frem til en enkelt løsning. Undervejs du risikerer at glemme negative tegn eller kopiere resultaterne forkert, ødelægger resultatet.
  • Billedbetegnelse Beregn Covariance Trin 12
    2
    Opret et regneark til beregning af kovarians. Hvis du er trygge ved at bruge Excel (eller andre regneark stand til at arbejde med beregninger), er det nemt at oprette et regneark, der tjener til at beregne kovariansen. Giv titlerne på de fem søjler i henhold til, hvad der blev gjort i beregningerne i hånden: x, y, (x (i) -x (with)), (y (i) -y (med)) og produkt.
    • For at forenkle mærkningen, kan du give den tredje kolonne et navn som "forskel x", og den fjerde, noget i retning af "y forskel," da de kan huske hvad er disse data.
    • Hvis du starter tabellen i det øverste venstre hjørne af regnearket, repræsenterer celle A1 etiketten x, ledsaget af alle de andre, indtil du kommer til E1.
  • Billedbetegnelse Beregn Covariance Trin 13
    3
    Indtast datapunkterne. Indtast dataværdierne i de to kolonner, der er mærket x og y. Husk at rækkefølgen af ​​datapunkter betyder noget, så det er vigtigt at parre hver værdi med y med den tilsvarende x-værdi.
    • Værdierne i x vil begynde i celle A2 og fortsætte nedad, der indeholder så mange datapunkter som nødvendigt.
    • Værdierne i y vil begynde i celle B2 og fortsætte nedad, der indeholder så mange datapunkter som nødvendigt.
  • Billedbetegnelse Beregn Covariance Trin 14
    4
    Beregn gennemsnittet af værdierne ved x og y. Excel er i stand til at beregne gennemsnittet meget hurtigt. Indtast formlen = MED (A2: A ___) i den første bølge celle under hver datakolonne. Udfyld blanket med cellepositionen svarende til det sidste datapunkt.
    • Hvis du for eksempel har 100 datapunkter, fylder de pladsen fra celle A2 til celle A101. I dette tilfælde vil du skrive = MED (A2: A101).
    • For værdierne i y, indtast formlen = MED (B2: B101).
    • Husk at du starter formlen i Excel med et = tegn.


  • Billedbetegnelse Beregn Covariance Trin 15
    5
    Indtast formlen for kolonnen (x (i) -x (med)). I celle C2 skal du indtaste formlen for at beregne den første subtraktion. Det vil være = A2 -___. Det hvide rum skal fyldes med cellepositionen, der indeholder middelværdien af ​​værdierne ved x.
    • For eksemplet på de 100 datapunkter vil gennemsnittet være i celle A103, således at formlen ville være = A2-A103.
  • Billedbetegnelse Beregn Covariance Trin 16
    6
    Gentag formlen for datapunkterne (y (i) -y (med)). Efter samme eksempel vil det være i celle D2. Denne formel vil blive skrevet som = B2-B103.
  • Billedbetegnelse Beregn Covariance Trin 17

    Video: Pearson's correlation coefficient in Stata®

    7
    Indtast formlen for kolonnen "Produkt". I den femte kolonne, i celle E2, bliver du nødt til at sætte formlen ansvarlig for beregning af produktet fra de to tidligere celler. For at gøre dette skal du bare skrive = C2 * D2.
  • Billedbetegnelse Beregn Covariance Trin 18
    8
    Kopier formlerne for at udfylde bordet. Indtil videre har du netop programmeret det første par data i række 2. Brug en mus, vælg cellerne C2, D2 og E2. Placer derefter markøren på den lille boks i nederste højre hjørne, indtil et plustegn vises på det. Klik på museknappen og hold den nede ved at trække markøren ned og udvide den markerede celle, indtil den fylder hele bordet. Dette trin kopierer automatisk de tre formler til stede i cellerne C2, D2 og E2 til hele tabellen. Dernæst vil du se, at den bliver udfyldt automatisk med alle beregninger.
  • Billedbetegnelse Beregn Covariance Trin 19
    9
    Program summen af ​​den sidste kolonne. Det er vigtigt at finde summen af ​​emnerne i kolonnen "Produkt". Indtast formlen = SUM (E2: E ___) i den tomme celle under det sidste datapunkt i denne kolonne. Udfyld blanket med positionen for den pågældende celle til det sidste datapunkt.
    • I eksemplet på 100 datapunkter, går denne formel til celle E103. I dette tilfælde vil du skrive = SUM (E2: E102).
  • Billedbetegnelse Beregn Covariance Trin 20
    10
    Find kovarians. Du kan også have Excel gøre de endelige beregninger. Den sidste operation, i celle E103 i vores eksempel, repræsenterer tælleren af ​​kovariansformlen. Umiddelbart under det kan du indtaste formlen = E103 / ___. Udfyld blanket med mængden af ​​eksisterende datapunkter. I eksemplet er denne værdi lig med 100. Resultatet vil repræsentere kovariansen af ​​dine data.
  • Metode 3
    Brug af online kovarians regnemaskiner

    Billedbetegnelse Beregn Covariance Trin 21
    1
    Søg efter kovarians regnemaskiner på internettet. Flere skoler, programmeringsvirksomheder eller andre institutioner har lavet sider, der kan beregne kovariansen mellem dataværdier. For at finde dem skal du skrive vilkårene "covariance calculator" i en online søgemaskine.
  • Billedbetegnelse Beregn Covariance Trin 22
    2
    Indtast dataene. Læs omhyggeligt vejledningen på siden for at indtaste dataene korrekt. Det er vigtigt, at parrene er velordnede, eller du får ukorrekte kovariansresultater. Forskellige sider har forskellige stilarter til indsættelse af data.
    • For eksempel på side https://rcalculators.com/statistics/covariance-calculator.htm (på engelsk), er der en vandret boks til at indsætte værdierne i x og en anden vandret boks for at indsætte værdierne i y. Du skal indtaste betingelser, der er adskilt af kommaer. Således vil datasættet i x, der tidligere blev beregnet, indtastes som 1,3,2,5,8,7,12,2,4. Tilsvarende vil datasættet i y indsættes som 8,6,9,4,3,3,2,7,7.
    • På en anden side, https://thecalculator.co/math/Covariance-Calculator-705.html (på engelsk), skal du indtaste dataene vedrørende x-aksen i den første boks. De vil blive indsat lodret med et element pr. Linje. Så indsætningen på denne side ville se sådan ud:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  • Billedbetegnelse Beregn Covariance Trin 23
    3
    Beregn resultaterne. Fordelen ved disse online-regnemaskiner er, at når du først indtaster dataene, skal du bare klikke på knappen "Beregn" og resultaterne vises automatisk. De fleste sider viser allerede mellemliggende beregninger af variablerne x (med), y (med) og n.
  • Metode 4
    Fortolkning af resultaterne af kovarians

    Billedbetegnelse Beregn Covariance Trin 24
    1
    Se efter et positivt eller negativt forhold. Covariance er en unik statistisk værdi, der repræsenterer, hvordan to sæt data vedrører hinanden. I eksemplet nævnt i indledningen måles højde og vægt. Det kan forventes, at når højderne vokser, øges deres højder, hvilket resulterer i en positiv kovarians. I et andet eksempel antage være indsamlet tal for det antal timer, hvor man praktiserer golf og scoren, at denne person er i stand til at vinde. I dette tilfælde vil der være en negativ kovarians, hvilket indikerer, at, som det antal timer stiger, scoren i golf fald (i golf, jo lavere score, jo bedre).
    • Bemærk det beregnede datasæt ovenfor. Den resulterende kovarians vil være -8,07. Det negative tegn her indikerer, at værdierne ved y øges, da værdierne ved x øges. Faktisk kan man bekræfte denne sandhed ved at observere nogle af værdierne. For eksempel værdierne x 1 og 2 svarer til værdierne y 7, 8 og 9. Værdierne x 08:12 henholdsvis matches med værdierne 2 og 3 og.
  • Billedbetegnelse Beregn Covariance Trin 25
    2
    Fortolk størrelsen af ​​kovarians. Hvis kovariansværdien er høj, være positiv eller negativ, kan du fortolke det som en indikation på, at de to dataelementer er stærkt forbundet positivt eller negativt.
    • I datasættet i eksemplet er kovariansen på -7,07 ret høj. Bemærk, at dataværdierne er fra 1 til 12, så at 8 er et betydeligt højt tal. Dette indikerer en stærk forbindelse mellem datasætene i x og y.
  • Billedbetegnelse Beregn Covariance Trin 26
    3
    Forstå en mulig mangel på forhold. Hvis du overholder en kovarians, der er lig med eller meget tæt på 0, kan du konkludere, at datapunkterne ikke er relaterede. Således kan stigningen i en værdi måske eller ikke føre til en stigning i den anden. De to udtryk er næsten tilfældigt forbundet.
    • Antag for eksempel, at du sammenligner skoestørrelser med college karakterer. Da der er flere faktorer, der påvirker kollegiumgrader, er det naturligt at forvente en kovarians tæt på 0. Dette ville tyde på, at der næsten ikke er nogen sammenhæng mellem de to værdier.
  • Billedbetegnelse Beregn Covariance Trin 27
    4
    Visualiser forholdet grafisk. For at forstå kovarians visuelt kan du indsætte datapunkterne i det kartesiske plan. Så vil det være let at se, at de punkter, men ikke præcist følger en lige linje, har tendens til at danne en gruppe, der nærmer sig en diagonal linje går fra øverste venstre til nederste højre hjørne. Dette er beskrivelsen af ​​en negativ kovarians. Bemærk også, at den endelige kovariansværdi er -8,07, et forholdsvis højt tal i forhold til datapunkterne. Den høje værdi tyder på, at kovariansen er stærk, hvilket kan verificeres ved datapunkternes lineære udseende.
  • tips

    • Covariance har begrænsede anvendelser i statistik. Generelt er det et skridt i retning af beregning af korrelationskoefficienter eller andre udtryk. Vær forsigtig, når du foretager dristige fortolkninger baseret på en kovariansværdi.

    Kilder og citater

    Se mere ... (17)
    Del på sociale netværk:

    Relaterede
    © 2024 HodTari.com