TEST DI IPOTESI CON LA DISTRIBUZIONE BINOMIALE

PARTE I

 

Da un campione casuale semplice di cento uova, nascono 37 maschi e 63 femmine.

C’è veramente un’uguale probabilità che un uovo diA vita ad un maschio o ad una femmina?

Probabilmente abbiamo scelto 37 maschi e 63 femmine solo per caso. Allo stesso modo di come è possibile avere tre teste in TRE LANCI DI SEGUITO anche se la moneta lanciata fosse EQUA.

Se c’è uguale probabilità che un uovo fecondo si sviluppi in un maschio o in una femmina, il numero dei maschi e delle femmine in un numero infinito di campioni di cento uova ciascun campione dovrebbe avere la distribuzione BINOMIALE MOSTRATA NEL GRAFICO:


 

 

 


FORMULIAMO ORA UN’IPOTESI NULLA

Questa è l’ipotesi di cui ci occuperemo e che chiamiamo IPOTESI NULLA perché assumiamo che non c’è nessuna differenza “reale” tra il valore vero della probabilità di avere maschi o femmine dalla popolazione da cui abbiamo campionato e il nostro valore ipotizzato di 0.5.

In altre parolE assumiamo che il nostro campione è stato selezionATO da una popolazione di uova in cui metà dei componenti erano maschi e metà erano femmine.

Che cosa si intende per nessuna differenza “reale”?

Ciò che si intende è che, come nel caso in cui abbiamo duE teste su due lanci di una moneta EQUA, la differenza tra ciò che ci aspettiamo (una testa e una croce) e ciò che otteniamo è dovuto al caso e a nessun bias (sistematicita’) nella moneta.

Nella nostra ipotesi nulla assumiamo che la differenza tra ciò che idealmente ci aspettiamo (50 maschi e 50 femmine) e ciò che abbiamo ottenuto (37 maschi e 63 femmine)  è dovuto soltanto al caso e non riflette una vera differenza di proporzioni nella popolazione.

L’IPOTESI ALTERNATIVA stabilirebbe che non c’è un numero uguale di uova maschi e femmine nella popolazione.

E’ soltanto possibile verificare direttamente l’ipotesi nulla.    

Perché?

Perché abbiamo un

modello matematico noto

con cui lavorare – una distribuzione BINOMIALE in cui la grandezza del campione è 100 e la probabilità di ciascun evento è 0.5.

 

Qual è il nostro specifico modello matematico noto per l’ipotesi alternativa?

 

Se lo conoscessimo conosceremmo già le vere proporzioni di uova maschi e femmina nella popolazione!

 

avendo formulato un’ipotesi nulla e avendo un modello per verificarla – abbiamo bisogno di una regola per decidere se accettare o rigettare l’ipotesi nulla.

 

In altre parole – dobbiamo stabilire di quanto possiamo  scostarci dal previsto 50 maschi e 50 femmine per rigettare l’ipotesi nulla.

E’ convenzione comune di scegliere un livello significativo del 5%

 

vediamo cosa significa:

analizziamo il grafico della probabilità cumulativa  della nostra distribuzione BINOMIALE.

 

 


 

 


Qui aggiungiamo probabilità man mano che andiamo da 0 a 100 maschi – la probabilità totale e’ uguale a 1.

 

La prima e l’ultima parte del grafico sembrano piatte perché i livelli di probabilità sono o molto bassi(prima parte) o molto alti(seconda parte)

 

cerchiamo dove la probabilità cumulativa assume un valore uguale a  0.025 o prossimo a questo valore limite senza superarlo.

 

35

0.00176

 

36

0.00332

 

37

0.00602

 

38

0.01049

 

39

0.01760

 

40

0.02844

 

41

0.04431

 

42

0.06661

 

43

0.09667

 

44

0.013563

 

 

dalla tabella in corrispondenza di 39 maschi si ha che p=0.01760

sul grafico della distribuzione BINOMIALE sono indicati i limiti corrispondenti a P £0.025 e per  p=0.01760 < 0.025 si ha che i corrispondenti valori limite sono 39 e 61

 

 


 

 

 


La probabilità cumulativa di entrambe le zone fuori le due verticali del grafico, linee verticali incluse, ammonta a

0.0176 ´ 2 = 0.0352 e la probabilità cumulativa delle zone delimitata dalle due verticali e’  

p=1 – 0.0352 =0.9648.

 

Quindi secondo la nostra regola di decisione

(stabilita prima che avessimo i dati) nel caso in cui abbiamo 39 maschi o meno o se abbiamo 61 o più maschi, rigettiamo l’ipotesi nulla secondo cui la popolazione ha 50% maschi e 50% femmine mentre accettiamo l’ipotesi alternativa secondo cui la popolazione non ha queste proporzioni.

 

La zona di accettazione dell’ipotesi nulla si trova dentro le linee verticali, mentre la zona di rigetto o zona critica si trova fuori (ed include) le verticali.

 

La probabilità usata come criterio per il rigetto dell’ipotesi nulla viene indicata con la lettera greca a

 

Il livello di significativita’ è semplicemente la probabilità espressa come una percentuale.

 

Il valore o valori del TEST STATISTIC che corrisponde a a – in questo caso 39 o 61 – vengono chiamati Valori Critici.

 

E’ possibile commettere un errore nel rigettare l’ipotesi nulla? Certamente – proprio come è possibile che si abbiano 100 teste su 100 lanci di una moneta equa.

 

Ma la probabilità di avere 39 o meno – 61 o più maschi per caso in una popolazione dove il rapporto è 1:1 è 3.52% o meno. Sulla base di ciò siamo disposti a rigettare l’ipotesi nulla.

 

Ovviamente in questo modo non è possibile provare che un’ipotesi è vera

 è soltanto possibile affermare che e’ poco probabile

l’ipotesi alternativa o contraria entro i limiti della regola di decisione che abbiamo usato

 

 

 

Cosa succede se la nostra scelta di zona critica non piace ad altri? Sta a loro giustificare perché e sta a noi accettare o rifiutare le loro giustificazioni.

 

Ciò che bisogna fare è essere assolutamente onesti nel presentare i dati e assolutamente chiari nel dimostrare il modo in cui abbiamo preso la nostra decisione per giungere ad una conclusione.

 

Poiché prima di fare l’esperimento non avevamo alcuna idea di quali sarebbero stati i dati – abbiamo usato entrambi i lati o code della distribuzione BINOMIALE con una probabilità totale del valore di 0.0352 : abbiamo eseguito Un

 

test a due code

 

Cosa diremmo se queste osservazioni ci portassero a credere che ci fossero meno maschi? Potremmo trovarci di fronte ad un caso in cui lo sperma con un cromosoma y era meno vitale in queste specie.

In questo caso possiamo formulare la nostra ipotesi nulla e alternativa come segue:

 

IPOTESI NULLA

Ci sarà un numero uguale di maschi e femmine

 

IPOTESI ALTERNATIVA:

Ci saranno meno maschi che femmine.

 

La nostra ipotesi nulla non può cambiare perché stiamo ancora usando lo stesso modello matematico basato su un’uguale probabilità di avere un maschio o una femmina.

 

Ora possiamo usare un

 

test ad una coda.

 

Questo va deciso prima di raccogliere i dati.

Se si è deciso per un test ad una coda non è possibile cambiare idea ed optare per un test a due code (una volta che i dati sono stati acquisiti).

 

 

38

0.01049

39

0.01760

40

0.02844

41

0.04431

42

0.06661

43

0.09667

44

0.013563

 

Da questa  distribuzione di probabilita’ cumulativa è chiaro che la nostra ipotesi nulla viene rigettata nel caso in cui si hanno 41 o meno maschi piuttosto che i 39 o meno usati con il test a due code.

 

Il valore critico del nostro test è ora 41 maschi e a è ancora quanto più prossimo possibile  a 0.05 senza oltrepassarlo.

La probabilità di avere 41 maschi (o meno) è 6.661%

Il vantaggio del test a una coda è che questo ci consente di rigettare l’ipotesi nulla con un risultato meno estremo (41 piuttosto che 39) rispetto a quello richiesto dal test a due code.

Quali sono gli svantaggi del

test a una coda?

 

Cosa accadrebbe se i risultati fossero 90 maschi e 10 femmine?

 

Dovremmo accettare l’ipotesi nulla invece della alternativa:

 

Così come è poco probabile che si verifichi un tale evento, sarebbe inaccettabile a questo punto cambiare idea e ritornare ad un test a due code.

 

Quando siete in dubbio optate direttamente per un test a duecode

La validità della nostre conclusioni TRATTE da un test statistico dipende daL verificaRSI DELle IPOTESI SU CUI E’ BASATO Il test.

 

IPOTESI PER UN TEST BASATO SULLA DISTRIBUZIONE BINOMIALE

 

1.  Le prove  nel nostro campione sono indipendenti. Nel caso di lanci di monete, una prova sarà il lancio di una moneta e il risultato del lancio di una moneta non ha alcuna influenza sul risultato di un altro lancio.

Nel nostro caso, una prova è un organismo scelto tra la popolazione.

Il sesso dell’organismo scelto non ha alcuna influenza sul sesso di un altro.

Un esperimento consiste in un numero n di prove  (100 lanci di monete o un campione di 100 organismi nel nostro caso).

2.  Ci sono soltanto due risultati su ogni prova – testa o croce, maschio o femmina.

 

 

 

 

 

 

Supponiamo che da un incrocio genetico ci si aspetti un rapporto di 3:1 piante di piselli con fiori porpora su bianchi.

 

Si hanno 109 piante con fiori porpora e 37 con fiori bianchi su un totale di 146 piante.

 

E’ possibile accettare l’ipotesi nulla secondo cui le piante mostrano un rapporto di 3:1  :

 

la distribuzione BINOMIALE per il numero di piante con fiori bianchi basato sul rapporto previsto di 3:1.

e’  ricavata per una probabilità di ¾ di avere una pianta con fiori porpora e una probabilità di ¼ di avere una pianta con fiori bianchi.

 

 

 

 

 

 


 

 

 

 


Ecco parti della tabella della distribuzione di probabilità cumulativa:

 

23

0.00483

44

0.093454

24

0.00873

45

0.095478

25

0.01507

46

0.096960

26

0.02491

47

0.098011

27

0.03948

48

0.098734

 

 

 

 

Sulla base di un test A DUE CODE, 26 o meno piante con fiori bianchi e 47 o più piante con fiori bianchi porteranno al rigetto dell’ipotesi del rapporto di 3:1

 

quanto più CI possiamo avvicinarE al LIVELLO DI SIGNIFICATIVITA’ DEL 5% senza oltrepassarlo

 

0.02491 + (1 – 0.98011) = 0.0448 oppure 4.48%

 

poiché abbiamo 37 piante con fiori bianchi Accettiamo l’ipotesi nulla.

 

 

le caratteristiche basilari sul TEST DI ipotesi sono RIASSunte NELLA TABELLA CHE SEGUE

 (ci RIPROMETTiamo DI AMPLIARE ALCUNI CONCETTI NEL SEGUITO):

 

 

 

1. IPOTESI NULLA

E’ basata su un modello matematico noto ed è accettata finché i dati non indicano diversamente.

2.   IPOTESI ALTERNATIVA O DI RICERCA

Questa viene accettata nel caso in cui siamo obbligati a rigettare l’ipotesi nulla

3.   TEST STATISTIC

Un campione statistico (in uno dei nostri esempi il numero di maschi su un campione di 100) che usiamo per decidere se accettare o rifiutare l’ipotesi nulla.

4.   ZONA DI RIGETTO

Valori numerici del test statistico che ci consentono di rigettare l’ipotesi nulla.

5.IPOTESI

I dati e le procedure di esperimenti SODDISFANO le IPOTESI del vostro modello matematico?

6.   CERTEZZE

Il test statistico non dirà mai se l’ipotesi è “vera” o “falsa” – ma DA soltanto la probabilità di rigettare un’ipotesi “vera” o “falsa” con la IPOTESI che il modello matematico (come la distribuzione BINOMIALE) sia quello valido da usare

 

 

 

 

COMPITI:

 

1) Ecco alcuni dati di un esperimento di comportamento dove moscerini della frutta femmine hanno la possibilità di scegliere tra due tipi di maschi per accoppiarsi: maschi con ali normali e con ali vestigiali.

 

scelta DI ACCOPPIAMENTO DI FEMMINE CON ALI NORMALI

 

maschi con ali normali

13

Maschi con ali vestigiali

5

 

FORMULATE UN’IPOTESI NULLA

 

FORMULATE DUE IPOTESI ALTERNATIVE

 

a)          PER UN TEST a due code

 

b)          PER UN TEST ad una coda

 

rispettate la condizione di avvicinarvi il più possibile al livello di significativita’ del 5% senza oltrepassarlo.

 

 

2.  si e’ eseguito un test a due code per il seguente esperimento:

 

supponiamo che da un incrocio genetico ci aspettiamo un rapporto 3:1 di piante di piselli con fiori porpora e bianchi. Disponiamo di 109 piante con fiori porpora e 37 con fiori bianchi su un totale di 146 piante. E’ possibile accettare l’ipotesi nulla secondo cui la piante hanno un rapporto di 3:1?

Ora eseguite un test ad una coda al 5%  di livello di significativita’ senza oltrepassarlo.

Formulate sia l’ipotesi nulla che quella alternativa nel vostro test ad una coda.

 

 

3.  Quali caratteristiche dovrebbe avere un esperimento biologico per poter essere analizzato usando la distribuzione BINOMIALE?

 Quali tipi di esperimenti non sarebbero adatti a questo tipo di analisi?