top of page

EXCELeaza: Cuartile

Funcții Excel: operații matematice și funcții Excel, sortare, filtrare


Cuantilele reprezintă conceptul general din spatele medianei. Acestea sunt puncte în seria de date față de care un anumit procent din date sunt mai mici, iar restul mai mari. Există diferite tipuri de cuantile, în funcție de granularitatea dorită în analiză, porinind de la cele cu finețe mai mare, cum ar fi percentilele (100 de segmente, fiecare reprezentând 1% din date), sau mai mică, ca de exemplu mediana (2 segmente, 50% din date fiecare) sau cuartilele (4 segmente a câte 25% din date).

Folosind aceeași logică la fel ca pentru determinarea medianei, se pot determina și cuartilele 1 (Q1) și 3 (Q3), mediana fiind aceeași cu cuartila 2 (Q2 sau Me). Având trei puncte de reper în date, se pot crea 4 segmente. Când aceste segmente sunt egale ca număr de observații, fiecare va conține 25% dintre datele analizate. Astfel, în loc să ne orientăm după poziția din mijloc, vom căuta pozițiile pentru primul și ultimul sfert din date, adică acele pozișii care se află la 1/4, respectiv 3/4 din totalul observațiilor. Valorile corespunzătoare acelor poziții (sau media valorilor de pe pozițiile adiacente) vor reprezenta cuartilele 1 și 3 în datele analizate.



Interpretarea cuartilelor se face ținând cont de modul de determinare, astfel:

  • Pentru Q1 (cele mai mici 25% din date): 25% dintre valori sunt cel mult egale cu Q1, iar 75% sunt mai mari;

  • Pentru Q3 (cele mai mari 25% din date): 75% dintre valori sunt cel mult egale cu Q3, iar 25% sunt mai mici.

Valorile extreme sunt acele valori care diferă foarte mult de majoritatea datelor. Aceste se situează fie în intervalul delimitat la dreapta de prima cuartilă (cei 25% sub), fie în intervalul delimitat la stânga de a treia cuartilă (25% peste). Pentru a determina cât de mare poate să fie o deviație acceptabilă, se pornește de la intervalul intercuartilic (IQR), care conține restul de 50% din date.

Așa cum sugerează și denumirea, acesta este intervalul dintre cuartile și se determină scăzând Q1 din Q3. Se consideră acceptabil ca datele să varieze față de cuartile cu cel mult 1,5 valoarea IQR. Astfel, dacă valoarea minimă din serie nu este mai mică decât diferența dintre Q1 si 1,5 x IQR, atunci nu există valori extreme mici. Similar, dacă maximul nu depășeste valoarea lui Q3 + 1,5 x IQR, nu există valori extreme mari. În caz contrar, este necesar ca analiza datelor folosind media și metode bazate pe aceasta să fie făcută cu precauție, deoarece prezența acestor valori o influențează.

 

Acest proiect este sprijinit financiar de Consliliul Județean Maramureș și de Muncipiul Baia Mare.

Comments


bottom of page