matematica |
Le distribuzioni statistiche
Distribuzioni per unità
Distribuzioni di quantità
Distribuzioni di frequenza
Le distribuzioni di quantità sono simili a quelle di frequenza ma ad ogni modalità associano un 'ammontare' (Kg, dollari, litri) piuttosto che una frequenza
Es.
Redditi da lavoro dipendente in Italia secondo i rami dell'economia (in miliardi di lire)
Rami |
Amm. Assoluto |
Amm. relativo |
Agricoltura |
|
|
Industria |
|
|
Servizi |
|
|
Pubb. Ammin. |
|
|
Totale |
|
|
Si utilizzano in presenza di caratteri trasferibili
Distribuzioni di frequenza
Rappresentazione tabellare in cui, accanto ad ogni modalità del carattere viene riportato 'quante unità'
(frequenza assoluta) assumono quella specifica modalità.
Oltre alla frequenza assoluta si possono considerare le
Frequenze relative
Frequenze cumulate
Frequenze retrocumulate
Es. (Titolo di studio del padre di un collettivo di 326 studenti)
Modalità |
F. Ass. |
F. Rel. |
F. Cum. |
F. Retr. |
Lic.Elem. |
|
|
|
|
Lic. Med. |
|
|
|
|
Maturità |
|
|
|
|
Laurea |
|
|
|
|
Totale |
|
|
|
|
La distribuzione di frequenza può essere determinata per qualunque carattere statistico. Però le frequenze cumulate e quelle retrocumulate hanno senso soltanto per caratteri almeno ordinabili.
Le frequenze assolute e quelle relative forniscono la stessa informazione ma quelle relative
Consentono confronti tra due diverse distribuzioni
Fanno perdere l'informazione relativa al totale
Un po' di formalizzazione
Caratteri discreti (numero finito o numerabile di modalità)
Assumiamo di avere un collettivo di n individui e un carattere X con k modalità. La generica distribuzione di frequenza sarà
Modalità |
Freq. Ass. |
Freq. Rel. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Totale |
N |
|
Le quantità ni per i=1, . ,k sono le frequenze assolute delle modalità, rappresentate genericamente con il simbolo xi per i=1, . ,k
Note:
Ogni n è un numero intero compreso tra 0 e n
n1 + n2 + . + ni + . + nk = n
le frequenze relative si indicano spesso con il simbolo
fi = ni /n i=1, . ,k
Ovviamente, per ogni i=1, . ,k
0 < fi <1
f1 + f2 + . + fi + . + fk = 1
Rappresentazione grafica
Diagramma a barre separate (.62)
Caratteri continui
Non è possibile elencare tutte le modalità
Esigenza di raggruppare in classi
In questo caso la generica modalità del carattere verrà indicata col termine classe e rappresentata dai simboli
(xi, xi+1] per i=1, . ,k
chiuso a destra e aperto a sinistra
oppure
[xi , xi+1) per i=1, . ,k
chiuso a sinistra e aperto a destra
Convenzione: xk+1 = infinito .
Esempio (. 65)
Distribuzione delle durate di1192 brani musicali.
Poiché la durata minima osservata è 30 secondi e quella massima osservata è 1022 secondi ma i dati sono perlopiù concentrati su valori medio-bassi, adottiamo il seguente raggruppamento
Criteri per la scelta delle classi
Non ne esistono di univoci
Quando ha senso, si considerano classi della stessa ampiezza e tali da avere una frequenza 'significativa' (classi equiampie)
In alternativa si costruiscono classi in modo da avere approssimativamente, frequenze simili.
Questo secondo criterio è più complesso perché va elaborato dopo aver osservato tutti i dati
Rappresentazioni grafiche
Istogramma.
L'istogramma è formato da k rettangoli adiacenti (uno per ogni classe) che indicano la frequenza delle classi.
La costruzione dell'istogramma nasconde qualche insidia, soprattutto quando le classi non hanno la stessa ampiezza.
In questo caso la base dei rettangoli sarà proporzionale alla ampiezza della classe e la frequenza verrà indicata dall'area del rettangolo e non dalla sua altezza.
Frequenze cumulate e Funzione di ripartizione empirica. ( solo per caratteri qualitativi ordinabili o quantitativi)
Consideriamo un collettivo di n unità su cui osserviamo un carattere X ordinabile ed elenchiamo in ordine crescente le n modalità assunte
x1< x2< x3< . < xi< . < xn
Attribuiamo ad ogni unità un peso pari a 1/n; possiamo dire che la frazione di unità che assume valori minori o uguali a x1 è pari a 1/n, che la frazione di unità che assume valori minori o uguali a xi è pari a i/n.
Quando X è quantitativo si ha la seguente
Definizione: Si chiama Funzione di ripartizione empirica della variabile X, la funzione che associa ad ogni valore x di X il valore
F(x)=(# di osservazioni minori o uguali di x)/n
Note:
La funzione F(x) è non decrescente
La funzione F(x) è compresa tra 0 e 1
Lim[x ¥ F(x)=1, Lim[x ¥ F(x)=0,
Nel caso di distribuzione di frequenze la funzione di ripartizione corrisponde (logicamente) alle frequenze cumulate
Privacy
|
© ePerTutti.com : tutti i diritti riservati
:::::
Condizioni Generali - Invia - Contatta