ePerTutti
Appunti, Tesina di, appunto matematica

Le distribuzioni statistiche

Scrivere la parola
Seleziona una categoria

Le distribuzioni statistiche

·      Distribuzioni per unità

·      Distribuzioni di quantità

·      Distribuzioni di frequenza

Le distribuzioni di quantità sono simili a quelle di frequenza ma ad ogni modalità associano un 'ammontare' (Kg, dollari, litri) piuttosto che una frequenza



Es.

Redditi  da lavoro dipendente in Italia secondo i rami dell'economia (in miliardi di lire)

Rami

Amm. Assoluto

Amm. relativo

Agricoltura

15.043

2,2

Industria

227.765

33,0

Servizi

235.016

34,3

Pubb. Ammin.

209.339

30,5

Totale

687.136

100,0

Si utilizzano in presenza di caratteri trasferibili

Distribuzioni di frequenza

Rappresentazione tabellare in cui, accanto ad ogni modalità del carattere viene riportato 'quante unità'

(frequenza assoluta) assumono quella specifica modalità.

Oltre alla frequenza assoluta si possono considerare le

1.  Frequenze relative

2.  Frequenze cumulate

3.  Frequenze retrocumulate

Es. (Titolo di studio del padre di un collettivo di 326 studenti)

Modalità

F. Ass.

F. Rel.

F. Cum.

F. Retr.

Lic.Elem.

88

0.270

0.270

1.000

Lic. Med.

77

0.236

0.506

0.730

Maturità

130

0.399

0.905

0.494

Laurea

31

0.095

1,000

0.095

Totale

326

1.000

La distribuzione di frequenza può essere determinata per qualunque carattere statistico. Però le frequenze cumulate e quelle retrocumulate hanno senso soltanto per caratteri almeno ordinabili.

Le frequenze assolute e quelle relative forniscono la stessa informazione ma quelle relative

·      Consentono confronti tra due diverse distribuzioni

·      Fanno perdere l'informazione relativa al totale

Un po' di formalizzazione

Caratteri discreti (numero finito o numerabile di modalità)

Assumiamo di avere un collettivo di n individui e un carattere X con  k modalità. La generica distribuzione di frequenza sarà

Modalità

Freq. Ass.

Freq. Rel.




Totale

N

1

Le quantità  ni  per i=1,…,k sono le frequenze assolute delle modalità, rappresentate genericamente con il simbolo xi  per i=1,…,k

Note:

·      Ogni n è un numero intero compreso tra 0 e n

·       n1 + n2 + … + ni +…+ nk =  n

·      le frequenze relative si indicano spesso con il simbolo

fi = ni /n     i=1,…,k

Ovviamente, per ogni i=1,…,k

0 < fi <1

f1 + f2 + … + fi +…+ fk =  1

·      Rappresentazione grafica

       Diagramma a barre separate (.62)

Caratteri continui

Non è possibile elencare tutte le modalità

Esigenza di raggruppare in classi

In questo caso la generica modalità del carattere verrà indicata col termine classe e rappresentata dai simboli

(xi, xi+1]              per i=1,…,k

chiuso a destra e aperto a sinistra

oppure

[xi , xi+1)             per i=1,…,k

chiuso a sinistra e aperto a destra

Convenzione:  xk+1 = infinito…

Esempio (. 65)

Distribuzione delle durate di1192 brani musicali.

Poiché la durata minima osservata è 30 secondi e quella massima osservata è 1022 secondi ma i dati sono perlopiù concentrati su valori medio-bassi, adottiamo  il seguente raggruppamento

Criteri per la scelta delle classi

·      Non ne esistono di univoci

·      Quando ha senso, si considerano classi della stessa ampiezza e tali da avere una frequenza 'significativa' (classi equiampie)

·      In alternativa si costruiscono classi in modo da avere approssimativamente, frequenze simili.

Questo secondo criterio è più complesso perché va  elaborato dopo aver osservato tutti i dati

Rappresentazioni grafiche

Istogramma.

L'istogramma è formato da k rettangoli adiacenti (uno per ogni classe) che indicano la frequenza delle classi.

La costruzione dell'istogramma nasconde qualche insidia, soprattutto  quando le classi non hanno la stessa ampiezza.

In questo caso la base dei rettangoli sarà proporzionale alla ampiezza della classe e la frequenza verrà indicata dall'area del rettangolo e non dalla sua altezza.

Frequenze cumulate e Funzione di ripartizione empirica. ( solo per caratteri qualitativi ordinabili o quantitativi)

Consideriamo un collettivo di n unità su cui osserviamo un  carattere X ordinabile  ed elenchiamo in ordine crescente le n  modalità assunte

x1< x2< x3<…< xi<…< xn

Attribuiamo ad ogni unità un peso pari a 1/n; possiamo dire che la frazione di unità che assume valori minori o uguali a x1 è  pari a 1/n, che la frazione di unità che assume valori minori o uguali a xi è  pari a i/n.

Quando X è quantitativo si ha la seguente

Definizione: Si chiama Funzione di ripartizione empirica della variabile X, la funzione che associa ad ogni valore x di X il valore

F(x)=(# di osservazioni minori o uguali di x)/n

 Note:

·      La funzione F(x) è non decrescente

·      La funzione F(x) è compresa tra 0 e 1

·      Lim[x®¥] F(x)=1, Lim[x®-¥] F(x)=0,

·      Nel caso di distribuzione di frequenze la funzione di ripartizione corrisponde (logicamente) alle frequenze cumulate






Privacy

© ePerTutti.com : tutti i diritti riservati
:::::
Condizioni Generali - Invia - Contatta