1
Forstå terminologien. Ordet "gennemsnit" kastes mange gange, når statistiske data bliver diskuteret. Ved første øjekast forekommer udtrykket ligefrem: gennemsnittet er den mængde, der passer nøjagtigt i midten. Der er dog nogle forskellige typer af gennemsnit, som kan være meget vildledende, hvis de ikke forstås korrekt.
- den aritmetisk middelværdi Det opnås ved at tilføje alle numrene i datasættet og dividere summen med antallet af elementer i mængden. Med andre ord, hvis du har numrene 3, 3, 5, 4 og 7, det aritmetiske gennemsnit kan opnås ved at sammenlægge de numre (med 22 som et resultat), og derefter dividere denne sum med 5 (som der er 5 tal i sættet) .
- I dette eksempel er det aritmetiske gennemsnit 4,4.
- den median er tallet i datasættet, der vises nøjagtigt i midten mellem de mindre tal og de større tal. Med samme data som før (3, 3, 5, 4 og 7) er medianen 4, da 2 af tallene er mindre og 2 er større.
- den mode er den mest almindelige talrepræsentation i datasættet. Ved hjælp af vores eksempel sæt er mode 3, da det vises to gange.
2
Minta bruger det aritmetiske gennemsnit. Det aritmetiske gennemsnit kan virke som den mest fejlfri form af alle de ovenfor beskrevne metoder, men det er faktisk ikke tilfældet. Dette skyldes, at unormalt høje tal eller nedgang i datasættet kan ændre betyget betydeligt. At ligge ved hjælp af det aritmetiske middel, saml dataene og brug i din ligning.
- For eksempel forestil dig at du interviewer 50 boliger for at finde ud af, hvor meget folk får. De fleste boliger får omkring $ 40.000 og $ 60.000 om året, men en enkelt boligregning $ 5 millioner årligt. Når du gør det aritmetiske gennemsnit, vil tallet være betydeligt højere end det "reelle" gennemsnit af lønninger i dette område, fordi $ 5 millioner tallet er meget højere end de andre.
- Tilsvarende, hvis du havde data, der viste, at 9 personer havde $ 1000 i deres bankkonti, men en tiendedel person havde $ 1, ville det aritmetiske gennemsnit være $ 900,10 - næsten 10% mindre end det almindelige beløb.
- Kendte søgninger tager normalt de største og mindste tal, før de beregner det aritmetiske gennemsnit. Men hver undersøgelse, du ser på fjernsyn, er ikke kendt. Medmindre du har adgang til hele datasættet, eller se en underskrevet garantierklæring om at marginerne af datasættet er fjernet, er det mere sikkert at antage, at de ikke var.
3
Minta bruger medianen. Medianen er faktisk det sværeste nummer til at "ligge", fordi den aldrig kan være for høj eller for lav i forhold til resten af dataene. Han burde være lige downtown, uden behov. Du kan dog bruge medianen til at skjule et meget højt eller lavt tal. Hvis dit datasæt f.eks. Er 1, 1, 2, 3, 4, 5, 3000, er medianen 3.
- Når du har et ulige antal data, kan du finde medianen ved at finde middelværdien af de to tal i midten. Dette betyder også ikke, at sættets ekstremer er.
- Vær forsigtig, når du bruger medianer til at beskrive ændringer over tid. Et selskab, der hæver prisen på sine tjenester med 3% hvert år, kan øge dem med 20% i år og skjule dette ved at præsentere medianen på 3% i de sidste 9 år.
4
Stop med at bruge mode. I nogle tilfælde er mode næsten umulig at ligge: Det gennemsnitlige antal købte billetter pr. Person til fodboldkamp, vil for eksempel næsten altid blive nøjagtigt reflekteret af mode. Ellers kan mode også udelukke vigtige data, især i et mindre datasæt.
- Hvis du f.eks. Har et datasæt med tal fra 1 til 100, men nummer 1 er inkluderet 3 gange, vil 1 være mode af sættet, selv om gennemsnittet (og i dette tilfælde mere følsomt) er meget tættere på 50 .
- Enhver forskning, der har muligheder i vid udstrækning, kan manipuleres for at understrege mode. Hvis du interviewet 100 mennesker, der bruger en skala fra 1 til 10 om deres følelser omkring et bestemt emne, og flere mennesker klassificere det som "10" mere end nogen anden antallet eller endog antallet af mennesker, der er klassificeret det som " 10 "var et større antal end antallet af personer, der klassificerede det som" 1 ", ville mode være 10.
5
Minta bruger figurnumre. Hvis du har et datasæt defineres af abstrakte tal, i stedet for beton (fx en forbruger tilfredshedsundersøgelse), er det næsten skræmmende let at ligge ved hjælp af dette sæt. Hvis man spørger folk til at bedømme deres tilfredshed på en skala fra 1 til 3, betyder det ikke nødvendigvis godtgøre, at kunder, som har valgt 3 er tre gange mere indhold end dem, der valgte at 1. Dette faktum bruges til at forvride særligt aritmetikorgan , men kan også anvendes til medianen og undertiden endog stilfuld.