<?xml version="1.0" encoding="utf-8" standalone="no"?>
<!DOCTYPE document PUBLIC "-//CNX//DTD CNXML 0.5 plus MathML//EN" "http://cnx.rice.edu/technology/cnxml/schema/dtd/0.5/cnxml_mathml.dtd">
<document xmlns="http://cnx.rice.edu/cnxml" xmlns:md="http://cnx.rice.edu/mdml/0.4" xmlns:bib="http://bibtexml.sf.net/" xmlns:m="http://www.w3.org/1998/Math/MathML" id="new">
  <name>Design e Analisi di Esperimenti (per l'Interaction Design)</name>
  <metadata>
  <md:version>1.10</md:version>
  <md:created>2006/01/25 04:14:02 US/Central</md:created>
  <md:revised>2007/02/05 02:08:58.363 US/Central</md:revised>
  <md:authorlist>
      <md:author id="drocchesso">
      <md:firstname>Davide</md:firstname>
      
      <md:surname>Rocchesso</md:surname>
      <md:email>Davide.Rocchesso@univr.it</md:email>
    </md:author>
  </md:authorlist>

  <md:maintainerlist>
    <md:maintainer id="drocchesso">
      <md:firstname>Davide</md:firstname>
      
      <md:surname>Rocchesso</md:surname>
      <md:email>Davide.Rocchesso@univr.it</md:email>
    </md:maintainer>
  </md:maintainerlist>
  
  <md:keywordlist>
    <md:keyword>Experimental Design</md:keyword>
    <md:keyword>Statistics</md:keyword>
  </md:keywordlist>

  <md:abstract>Una guida rapida alla sperimentazione con soggetti e all'analisi statistica dei dati, nel contesto del design di oggetti interattivi.</md:abstract>
</metadata>
  <content>
    <para id="introduzione">
      Per la valutazione di interfacce e sistemi interattivi esiste
      una pletora di paradigmi e tecniche, le quali forniscono per lo
      più informazioni di tipo qualitativo, oppure informazioni
      quantitative ma di incerta affidabilità statistica. Invece, se
      l'elemento di interfaccia da analizzare non è troppo complesso e
      se si possiedono sufficienti risorse, è possibile adattare alla
      valutazione di interfacce le tecniche usate nella psicologia
      sperimentale. In altre parole, si può cercare di fare
      sperimentazione scientifica con soggetti umani.
    </para>
    <para id="scopop">
      <definition id="scopo">
	<term>Scopo</term> <meaning>verificare una
	<emphasis>ipotesi</emphasis> che predice una relazione tra due
	o più <emphasis>variabili</emphasis>.</meaning>
      </definition>
    </para>
    <example id="ipotesi_ex">
      <name>Ipotesi</name> <para id="ipotesi_exp">La velocità di
      lettura di un testo su un display è diversa per il font
      Helvetica rispetto al font Times.</para>
    </example>
    <para id="variabili">
      Il ricercatore manipola le <emphasis>variabili
      indipendenti</emphasis> (es. font) e misura le
      <emphasis>variabili dipendenti</emphasis> (es. tempo di
      lettura).
    </para>
    <para id="condizionip">
      <definition id="condizionid">
	<term>Condizioni</term>
	<meaning><list id="condizionil">
	<item>
	  Condizioni sperimentali: Per esempio, la condizione 1 può
	  essere "leggi in Helvetica" e la condizione 2 può essere
	  "leggi in Times"
	</item>
	<item>
	  Condizioni di controllo (o gruppi di controllo): sono
	  condizioni molto vicine a quelle sperimentali ma non esposte
	  alle variabili indipendenti oggetto di indagine. Ad esempio,
	  un gruppo di controllo può leggere un testo uguale a quello
	  della condizione 1 ma stampato su carta e sovrapposto al
	  display.
	</item>
	</list>
	</meaning>
      </definition>
    </para>
    <para id="disegnip">
      <definition id="disegnid">
	<term>Disegni sperimentali</term>
	<meaning>I disegni sperimentali sono
	  caratterizzati dallo spazio
	  <m:math>
	    <m:apply>
	      <m:cartesianproduct/>
	      <m:csymbol>x</m:csymbol>
	      <m:csymbol>y</m:csymbol>
	      <m:csymbol>...</m:csymbol>
	      <m:csymbol>z</m:csymbol>
	    </m:apply>
	  </m:math>
	  delle condizioni sperimentali. 
	</meaning>
      </definition>
    </para>
    <example>
      <name>Disegno 2 x 2</name> 
      <para id="excondp">Effetto sull'efficienza di
      svolgimento di un task dell'introduzione di una nuova versione
      di software su soggetti esperti e soggetti inesperti.
      </para>
    </example>
    <para id="soggetti">
      <name>Allocazione dei soggetti</name>
      <definition id="betweend">
	<term>Between-subjects design</term>
	<meaning>
	  Differenti gruppi di soggetti sono usati per le diverse condizioni. 
	  <list id="betweenvant">
	    <item>Vantaggi: non ci sono effetti di ordinamento</item>
	    <item>Svantaggi: servono molti soggetti</item>
	  </list>
	</meaning>
      </definition>
      <definition id="withind">
	<term>Within-subjects design</term>
	<meaning>
	  Ogni soggetto si presta a tutte le condizioni
	  <list id="withinvant">
	    <item>Vantaggi: bastano pochi soggetti e c'è un minore
	    impatto delle differenze individuali</item>
	    <item>Svantaggi: possono facilmente emergere effetti
	    dovuti all'ordinamento delle prove. Bisogna quindi
	    applicare <emphasis>counterbalancing</emphasis>.</item>
	  </list>
	</meaning>
      </definition>
      <definition id="matchedd">
	<term>Matched-group procedure</term>
	<meaning>
	  Si fa il match dei gruppi di soggetti sulla base di
	  variabili che non sono direttamente sotto osservazione. Ad
	  esempio, soggetti con grado paragonabile di esperienza sono
	  assegnati ciascuno ad una condizione della variabile
	  indipendente oggetto di indagine.
	</meaning>
      </definition>
    </para>

    <example>
      <name>Sperimentazione in Interazione Uomo-Macchina</name>
      <para id="larson">
	Esperimento teso a trovare il compromesso ottimo breadth vs. depth negli hyperlink del web. <link src="http://research.microsoft.com/~marycz/p25-larson.pdf">(Larson and Czerwinski, Microsoft, 1998) </link>. 
	<list id="larson_car">
	  <item>Condizioni (rami ad ogni livello): (1) 8 x 8 x 8; (2) 16 x 32; (3) 32 x 16</item>
	  <item>Soggetti: 16 utenti esperti del web.</item>
	  <item>Task: ogni soggetto fa 8 ricerche per ogni condizione, per un totale di 24 ricerche.</item>
	  <item>Variabile dipendente: Tempo di ricerca </item>
	</list>
<table frame="all" id="larson_table">
  <tgroup cols="4" align="left" colsep="1" rowsep="1">
	  <colspec colnum="2" colname="c2"/>
	  <colspec colnum="3" colname="c3"/>
	  <colspec colnum="4" colname="c4"/>
    <thead valign="top">
      <row>
	<entry> </entry>
        <entry namest="c2" nameend="c4" align="center"> 
	  Condizioni
        </entry>
      </row>
	    <row>
	      <entry align="center">Risultati</entry>
	      <entry>
		1
	      </entry>
	      <entry>
		2
	      </entry>
	      <entry>
		3
	      </entry>
	    </row>
    </thead>
    <tbody valign="top">
       <row>
        <entry>
		<emphasis>Media </emphasis>
        </entry>
        <entry>
	  58
        </entry>
        <entry>
	  36
        </entry>
        <entry>
	  46
        </entry>
      </row>
      <row>
        <entry>
		<emphasis>SD</emphasis>
        </entry>
        <entry>
	  23
        </entry>
        <entry>
	  16
        </entry>
        <entry>
	  26
        </entry>
      </row>
    </tbody>
  </tgroup>
</table>

	Conclusione: Breadth è meglio di Depth, ma troppi link possono peggiorare la performance.

      </para>
    </example>

    <section id="statistica">
      <name>Statistica per esperimenti</name>
      <note>
	Queste note di statistica e gli esempi riportati sono basati sui libri 
	<cite src="#caudek">Statistica per psicologi</cite>, di Caudek e Luccio, e 
	<cite src="#crawley">Statistics: an introduction using R</cite> di Crawley.
      </note>
      <definition id="ipotesi_nulla">
	<term>Ipotesi Nulla <m:math>
	    <m:ci> <m:msub>
	      <m:mi>H</m:mi>
	      <m:mn>0</m:mn>
	    </m:msub></m:ci>
	  </m:math>
	</term>
	<meaning>La manipolazione della variabile indipendente non ha
	alcun effetto sulla variabile dipendente.</meaning>
      </definition>
      <definition id="ipotesi_sostantiva">
	<term>Ipotesi Sostantiva <m:math>
	    <m:ci> <m:msub>
	      <m:mi>H</m:mi>
	      <m:mn>1</m:mn>
	    </m:msub></m:ci>
	  </m:math>
	</term>
	<meaning>La manipolazione della variabile indipendente ha
	 effetto sulla variabile dipendente. In medicina, si afferma
	 l'efficacia di un trattamento.</meaning>
      </definition>
      <para id="probp">Se, per via sperimentale, si accerta che la
      probabilità associata agli eventi è troppo bassa, l'ipotesi
      nulla viene respinta e si dimostra l'efficacia del trattamento,
      o l'esistenza di un effetto della variabile dipendente su quella
      indipendente.</para>
      <definition id="significativita">
	<term>Livello di significatività α</term> <meaning>E' la
	soglia di probabilità al di sopra della quale accetto
	l'ipotesi nulla. E' la probabilità di commettere un errore del
	primo tipo.</meaning>
      </definition>
      <definition id="primotipo">
	<term>Errore del primo tipo</term> <meaning>Dice che il
	trattamento è efficace (o è presente l'effetto) quando in
	realtà non lo è.</meaning>
      </definition>
      <definition id="significativitab">
	<term>Livello di significatività β</term> <meaning>E' la
	probabilità di accettare l'ipotesi nulla, laddove essa sia
	effettivamente falsa. E' la probabilità di commettere un errore
	del secondo tipo.</meaning>
      </definition>
      <definition id="secondotipo">
	<term>Errore del secondo tipo</term> <meaning>Dice che il
	trattamento è inefficace (o non è presente l'effetto) quando in
	realtà l'efficacia c'è.</meaning>
      </definition>
      <definition id="pvalue">
	<term>valore <emphasis>p</emphasis></term> <meaning>E' una
	stima della probabilità che un certo risultato, o uno ancora
	più estremo, si sia verificato per caso, in caso di validità
	dell'ipotesi nulla. Un valore piccolo di p significa che
	l'ipotesi nulla è difficile da sostenere e che l'effetto
	  misurato è significativo. Piccolo significa usualmente <m:math>
	    <m:apply>
	      <m:mo>&lt;</m:mo>
	      <m:cn>0.05</m:cn>
	    </m:apply>
	  </m:math>
</meaning>
      </definition>
      <!-- This CALS table template is generated by emacs 21.3.50.1 -->
<table frame="all" id="ipotesi_errori">
  <tgroup cols="3" align="left" colsep="1" rowsep="1">
	  <colspec colnum="2" colname="c2"/>
	  <colspec colnum="3" colname="c3"/>
    <thead valign="top">
      <row>
	<entry> </entry>
        <entry namest="c2" nameend="c3" align="center"> 
	  Situazione Effettiva
        </entry>
      </row>
	    <row>
	      <entry align="center">Ipotesi Nulla</entry>
	      <entry>
		vera
	      </entry>
	      <entry>
		falsa
	      </entry>
	    </row>
    </thead>
    <tbody valign="top">
       <row>
        <entry>
		<emphasis>accetta </emphasis>
        </entry>
        <entry>
	  corretto
        </entry>
        <entry>
	  tipo II
        </entry>
      </row>
      <row>
        <entry>
		<emphasis>respingi</emphasis>
        </entry>
        <entry>
	  tipo I
        </entry>
        <entry>
	  corretto
        </entry>
      </row>
    </tbody>
  </tgroup>
</table>
      <definition id="potenzad">
	<term>Potenza di un test statistico</term>
	<meaning>E' la probabilità <m:math>
	    <m:apply>
	      <m:minus/>
		<m:cn>1</m:cn>
		<m:ci>β</m:ci>
	    </m:apply>
	  </m:math> di rigettare l'ipotesi nulla quando essa è
	  falsa. Se si vuole rilevare una variazione, dovuta a un
	  trattamento, pari a <m:math> <m:ci>δ</m:ci> </m:math>
	  e ci si può ragionevolmente aspettare una variabilità nei
	  dati misurata da una varianza <m:math>
	    <m:apply>
	      <m:power/>
	      <m:ci>s</m:ci>
	      <m:cn>2</m:cn>
	    </m:apply>
	  </m:math>, allora si può dimensionare la numerosità del
	  campione secondo la regola <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:ci>n</m:ci>
	      <m:apply>
		<m:divide/>
		<m:apply>
		  <m:times/>
		  <m:ci>potenza </m:ci>
		  <m:apply>
		    <m:power/>
		    <m:ci>s</m:ci>
		    <m:cn>2</m:cn>
		  </m:apply>
		  <m:cn>10</m:cn>
		</m:apply>
		  <m:apply>
		    <m:power/>
		    <m:ci>δ</m:ci>
		    <m:cn>2</m:cn>
		  </m:apply>
	      </m:apply>
	    </m:apply>
	  </m:math>. Un valore considerato adeguato per la potenza
	    statistica è <m:math> <m:cn>0.8</m:cn> </m:math>.  Ad
	    esempio, se la media è circa <m:math> <m:cn>20</m:cn>
	    </m:math> e la varianza è circa <m:math> <m:cn>10</m:cn>
	    </m:math>, allora per rilevare una variazione del <m:math>
	    <m:cn>10</m:cn> </m:math> % con potenza <m:math>
	    <m:cn>0.8</m:cn> </m:math>  bisogna usare <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:ci>n</m:ci>
	      <m:cn>20</m:cn>
	    </m:apply>
	  </m:math>.
	</meaning>
      </definition>
      <example>
	<list id="ipotesilex">
	  <item>Ipotesi nulla: nascere maschio o nascere femmina non ha
	    influenza sul fatto di diventare programmatori. <m:math>
		<m:ci> <m:msub>
		  <m:mi>H</m:mi>
		  <m:mn>0</m:mn>
		</m:msub></m:ci>
	      </m:math>:
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci> <m:msub>
		  <m:mi>p</m:mi>
		  <m:mi>m</m:mi>
		</m:msub></m:ci>
		<m:ci> <m:msub>
		  <m:mi>p</m:mi>
		  <m:mi>f</m:mi>
		</m:msub></m:ci>
		<m:ci>0.5</m:ci>
	      </m:apply>
	    </m:math>
	  </item>
	  <item>
	    Ipotesi sostantiva: <m:math>
		<m:ci> <m:msub>
		  <m:mi>H</m:mi>
		  <m:mn>1</m:mn>
		</m:msub></m:ci>
	      </m:math>:	    
	    <m:math>
	      <m:apply>
		<m:gt/>
		<m:ci> <m:msub>
		  <m:mi>p</m:mi>
		  <m:mi>m</m:mi>
		</m:msub></m:ci>
		<m:ci> <m:msub>
		  <m:mi>p</m:mi>
		  <m:mi>f</m:mi>
		</m:msub></m:ci>
	      </m:apply>
	    </m:math>
	  </item>
	  <item>Livello di significatività: <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci>α</m:ci>
		<m:cn>0.05</m:cn>
	      </m:apply>
	    </m:math>
</item>
	</list>
	<para id="masfemp">
	  Se prendiamo un campione di 10 programmatori e, di questi, 2
	  sono donne, cosa possiamo concludere? La probabilità di
	  ottenere il caso osservato e tutti quelli altrettanto o
	  più sfavorevoli all'ipotesi nulla è pari a <code>probabilità
	  di tutte le sequenze con 2 femmine + probabilità di tutte le
	  sequenze con 1 femmina + probabilità di tutte le sequenze
	  con 0 femmine</code>. La prima di queste tre probabilità, ad
	  esempio, si trova come <m:math>
	    <m:apply>
	      <m:times/>
	      <m:apply>
		<m:power/>
		 <m:ci> <m:msub>
		  <m:mi>p</m:mi>
		  <m:mi>m</m:mi>
		</m:msub></m:ci>
		<m:cn>8</m:cn>
	      </m:apply>
	      <m:apply>
		<m:power/>
		 <m:ci> <m:msub>
		  <m:mi>p</m:mi>
		  <m:mi>f</m:mi>
		</m:msub></m:ci>
		<m:cn>2</m:cn>
	      </m:apply>
	    </m:apply>
	  </m:math> moltiplicata per il numero di possibili sequenze
	    con due femmine, cioè per le combinazioni di 10 su 8
	    elementi. La somma delle tre probabilità risulta essere
	    complessivamente pari a <m:math> <m:cn>0.0547</m:cn>
	    </m:math> e quindi, con il livello di significatività
	    adottato, si accetta l'ipotesi nulla. In altri termini
	    l'evento osservato e quelli altrettanto o più sfavorevoli
	    sono troppo poco improbabili per poter accettare l'ipotesi
	    sostantiva.
	</para>
      </example>
      <section id="diffmedie">
	<name>Verifica di ipotesi sulla differenza tra due medie
	(between-subjects design)</name>
	<para id="diffmediep">
	  Si supponga di avere un campione di numerosità <m:math>
	    <m:ci>n</m:ci>
	  </m:math> estratto da una popolazione normale di media <m:math>
	    <m:ci>μ</m:ci>
	  </m:math> e varianza <m:math>
	    <m:apply>
	      <m:power/>
	      <m:ci>σ</m:ci>
	      <m:cn>2</m:cn>
	    </m:apply>
	  </m:math>. La media di tale campione è anch'essa una
	    variabile aleatoria normale, con media <m:math>
	    <m:ci>μ</m:ci> </m:math> e varianza <m:math>
	    <m:apply>
	      <m:divide/>
	       <m:apply>
	      <m:power/>
	      <m:ci>σ</m:ci>
	      <m:cn>2</m:cn>
	    </m:apply>
	      <m:ci>n</m:ci>
	    </m:apply>
	  </m:math>. Presi invece due campioni da due popolazioni, il
	  valore atteso della differenza tra le medie di due campioni
	  è <equation id="mediadiff">
	  <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:apply> 
		<m:ci type="fn">E</m:ci> 
		<m:apply>
		  <m:minus/>
		  <m:ci>
		    <m:mover accent="true">
		      <m:msub>
			<m:mi>Y</m:mi>
			<m:mn>1</m:mn>
		      </m:msub>
		      <m:mi>_</m:mi>
		    </m:mover>
		  </m:ci>
		  <m:ci>
		    <m:mover accent="true">
		      <m:msub>
			<m:mi>Y</m:mi>
			<m:mn>2</m:mn>
		      </m:msub>
		      <m:mi>_</m:mi>
		    </m:mover>
		  </m:ci>
		</m:apply>
	      </m:apply>
	      <m:apply>
		<m:minus/>
		<m:apply>
		  <m:ci type="fn">E</m:ci>
		  <m:ci>
		    <m:mover accent="true">
		      <m:msub>
			<m:mi>Y</m:mi>
			<m:mn>1</m:mn>
		      </m:msub>
		      <m:mi>_</m:mi>
		    </m:mover>
		  </m:ci>
		</m:apply>
		<m:apply>
		  <m:ci type="fn">E</m:ci>
		  <m:ci>
		    <m:mover accent="true">
		      <m:msub>
			<m:mi>Y</m:mi>
			<m:mn>2</m:mn>
		      </m:msub>
		      <m:mi>_</m:mi>
		    </m:mover>
		  </m:ci>
		</m:apply>
	      </m:apply>
	      <m:apply>
		<m:minus/>
		<m:ci><m:msub>
		    <m:mi>μ</m:mi>
		    <m:mn>1</m:mn>
		  </m:msub>
		</m:ci>
		<m:ci><m:msub>
		    <m:mi>μ</m:mi>
		    <m:mn>2</m:mn>
		  </m:msub>
		</m:ci>
	      </m:apply>
	    </m:apply>
	  </m:math>
	  </equation> Se le medie dei due campioni sono indipendenti,
	  allora la varianza della differenza delle medie campionarie
	  è 
	  <equation id="variadiff">
	     <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:apply> 
		<m:ci type="fn"><m:msup>
		    <m:mi>σ</m:mi>
		    <m:mn>2</m:mn>
		  </m:msup>
		</m:ci> 
		<m:apply>
		  <m:minus/>
		  <m:ci>
		    <m:mover accent="true">
		      <m:msub>
			<m:mi>Y</m:mi>
			<m:mn>1</m:mn>
		      </m:msub>
		      <m:mi>_</m:mi>
		    </m:mover>
		  </m:ci>
		  <m:ci>
		    <m:mover accent="true">
		      <m:msub>
			<m:mi>Y</m:mi>
			<m:mn>2</m:mn>
		      </m:msub>
		      <m:mi>_</m:mi>
		    </m:mover>
		  </m:ci>
		</m:apply>
	      </m:apply>

	      <m:apply>
		<m:plus/>
		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:power/>
		    <m:ci><m:msub>
		      <m:mi>σ</m:mi>
		      <m:mn>1</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:cn>2</m:cn>
		  </m:apply>
		  <m:ci><m:msub>
		      <m:mi>n</m:mi>
		      <m:mn>1</m:mn>
		    </m:msub>
		  </m:ci>
		</m:apply>		
		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:power/>
		    <m:ci><m:msub>
		      <m:mi>σ</m:mi>
		      <m:mn>2</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:cn>2</m:cn>
		  </m:apply>
		 <m:ci><m:msub>
		      <m:mi>n</m:mi>
		      <m:mn>2</m:mn>
		    </m:msub>
		  </m:ci>
		</m:apply>
	      </m:apply>

	    <m:apply>
	      <m:times/>
	      <m:apply>
		<m:power/>
		<m:ci>σ</m:ci>
		<m:cn>2</m:cn>
	      </m:apply>
	      <m:apply>
		<m:plus/>
		  <m:apply>
		    <m:divide/>
		    <m:cn>1</m:cn>
		    <m:ci><m:msub>
			<m:mi>n</m:mi>
			<m:mn>1</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		  <m:apply>
		    <m:divide/>
		    <m:cn>1</m:cn>
		    <m:ci><m:msub>
			<m:mi>n</m:mi>
			<m:mn>2</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		</m:apply>
	      </m:apply>
	    </m:apply>
	  </m:math>
	  </equation>
	  dove l'ultima uguaglianza assume che la varianza nei due
	  campioni sia la stessa.  A partire da un campione, lo
	  stimatore privo di bias della varianza della popolazione è
	  <m:math>
	    <m:apply>
	      <m:eq/>

	      <m:apply>
		<m:power/>
		<m:mi>s</m:mi>
		<m:mn>2</m:mn>
	      </m:apply>

	      <m:apply>
		<m:divide/>

		<m:apply>
		<m:sum/>
		  <m:bvar>
		    <m:ci>i</m:ci>
		  </m:bvar>
		  <m:lowlimit>
		    <m:cn>1</m:cn>
		  </m:lowlimit>
		  <m:uplimit>
		    <m:ci>n</m:ci>
		  </m:uplimit>

		  <m:apply>
		    <m:power/>

		    <m:apply>
		      <m:minus/>
		      <m:ci><m:msub>
			  <m:mi>x</m:mi>
			  <m:mi>i</m:mi>
			</m:msub>
		      </m:ci>
		      <m:ci><m:mover accent="true">
			  <m:mi>x</m:mi>
			  <m:mi>_</m:mi>
			</m:mover>
		      </m:ci>
		    </m:apply>

		    <m:mn>2</m:mn>
		  </m:apply>

		</m:apply>
		  <m:apply>
		    <m:minus/>
		    <m:mi>n</m:mi>
		    <m:mn>1</m:mn>
		  </m:apply>

	      </m:apply>
	    </m:apply>
	  </m:math>. Questo perché, una volta conosciuta la media, i
	    gradi di libertà associati ad un campione di numerosità
	    <m:math> <m:mi>n</m:mi> </m:math> sono <m:math>
	    <m:apply>
	      <m:minus/>
	      <m:mi>n</m:mi>
	      <m:mn>1</m:mn>
	    </m:apply>
	  </m:math> e nel calcolo della varianza campionaria bisogna
	  dividere per il numero di gradi di libertà.
	</para>
	<para id="tdist">
	  Dati due campioni di <m:math>
	    <m:ci><m:msub>
		<m:mi>n</m:mi>
		<m:mn>1</m:mn>
	      </m:msub>
	    </m:ci>
	  </m:math> e <m:math>
	    <m:ci><m:msub>
		<m:mi>n</m:mi>
		<m:mn>2</m:mn>
	      </m:msub>
	    </m:ci>
	  </m:math> elementi uno stimatore della varianza della
	  popolazione è
	  <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:apply>
		<m:power/>
		<m:ci><m:mover accent="true">
		    <m:mi>σ</m:mi>
		    <m:mi>̂</m:mi>
		    </m:mover>
		 </m:ci>
		<m:ci>2</m:ci>
	      </m:apply>
	      <m:apply>
		<m:divide/>
		<m:apply>
		  <m:plus/>
		  <m:apply>
		    <m:times/>
		    <m:apply>
		      <m:minus/>
		      <m:ci><m:msub>
			  <m:mi>n</m:mi>
			  <m:mn>1</m:mn>
			</m:msub>
		      </m:ci>
		      <m:cn>1</m:cn>
		    </m:apply>
		    <m:apply>
		      <m:power/>
		      <m:ci><m:msub>
			  <m:mi>s</m:mi>
			  <m:mn>1</m:mn>
			</m:msub>
		      </m:ci>
		      <m:cn>2</m:cn>
		    </m:apply>
		  </m:apply>
		    <m:apply>
		      <m:times/>
		      <m:apply>
			<m:minus/>
			<m:ci><m:msub>
			    <m:mi>n</m:mi>
			    <m:mn>2</m:mn>
			  </m:msub>
			</m:ci>
			<m:cn>1</m:cn>
		      </m:apply>
		      <m:apply>
			<m:power/>
			<m:ci><m:msub>
			    <m:mi>s</m:mi>
			    <m:mn>2</m:mn>
			  </m:msub>
			</m:ci>
			<m:cn>2</m:cn>
		      </m:apply>
		    </m:apply>
		  </m:apply>
		  <m:apply>
		    <m:plus/>
		    <m:ci><m:msub>
			<m:mi>n</m:mi>
			<m:mn>1</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:ci><m:msub>
			<m:mi>n</m:mi>
			<m:mn>2</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:cn>-2</m:cn>
		  </m:apply>
		</m:apply>
	      </m:apply>
	  </m:math>.
	  Le ipotesi sulla differenza tra le medie si verificano con
	  la statistica 
	  <equation id="tstud">
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:mi>t</m:mi>
		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:minus/>
		    <m:apply>
		      <m:minus/>
		      <m:ci>
			<m:mover accent="true">
			  <m:msub>
			    <m:mi>Y</m:mi>
			    <m:mn>1</m:mn>
			  </m:msub>
			  <m:mi>_</m:mi>
			</m:mover>
		      </m:ci>
		      <m:ci>
			<m:mover accent="true">
			  <m:msub>
			    <m:mi>Y</m:mi>
			    <m:mn>2</m:mn>
			  </m:msub>
			  <m:mi>_</m:mi>
			</m:mover>
		      </m:ci>
		    </m:apply>
		    <m:apply>
		      <m:minus/>
		      <m:ci><m:msub>
			  <m:mi>μ</m:mi>
			  <m:mn>1</m:mn>
			</m:msub>
		      </m:ci>
		      <m:ci><m:msub>
			  <m:mi>μ</m:mi>
			  <m:mn>2</m:mn>
			</m:msub>
		      </m:ci>
		    </m:apply>
		  </m:apply>
		  <m:apply>
		    <m:times/>
		    <m:ci><m:mover accent="true">
			<m:mi>σ</m:mi>
			<m:mi>̂</m:mi>
		      </m:mover>
		    </m:ci>
		   
		      <m:msqrt>
			<m:apply>
			  <m:plus/>
			  <m:apply>
			    <m:divide/>
			    <m:cn>1</m:cn>
			    <m:ci><m:msub>
				<m:mi>n</m:mi>
				<m:mn>1</m:mn>
			      </m:msub>
			    </m:ci>
			  </m:apply>
			  <m:apply>
			    <m:divide/>
			    <m:cn>1</m:cn>
			    <m:ci><m:msub>
				<m:mi>n</m:mi>
				<m:mn>2</m:mn>
			      </m:msub>
			    </m:ci>
			  </m:apply>
			</m:apply>
		      </m:msqrt>

		  </m:apply>

		</m:apply>

		<m:apply>
		  <m:divide/>
		  <m:mtext>differenza tra le medie</m:mtext>
		  <m:mtext>deviazione standard della differenza tra le medie</m:mtext>
		</m:apply>
	      </m:apply>
	    </m:math>
	  </equation>
	  la quale è distribuita come una t di Student con <m:math>
	    <m:apply>
	      <m:plus/>
	      <m:ci><m:msub>
		  <m:mi>n</m:mi>
		  <m:mn>1</m:mn>
		</m:msub>
	      </m:ci>
	      <m:ci><m:msub>
		  <m:mi>n</m:mi>
		  <m:mn>2</m:mn>
		</m:msub>
	      </m:ci>
	      <m:cn>-2</m:cn>
	    </m:apply>
	  </m:math> gradi di libertà. Maggiore è la differenza tra le
	  medie e più siamo convinti dell'efficacia di un
	  trattamento. Maggiore è la varianza dei campioni, e meno ne
	  siamo convinti.
	</para>
	<example id="tclassi">
	  <para id="tclassiques">
	  Due software didattici (A e B) vengono confrontati
	  esaminando i voti dei test di due classi di studenti. Ci si
	  chiede se i due software siano diversamente efficaci.
	  </para>
	  <para id="tclassiris">
	    Usiamo il software libero <link src="http://www.r-project.org/">R</link> per analizzare i
	  risultati dei test e rispondere alla domanda. La sequenza di istruzioni
	    <code type="block">
	      <![CDATA[
	      > classeA
	      [1] 3 4 4 3 2 3 1 3 5 2
	      > classeB
	      [1] 5 5 6 7 4 4 3 5 6 5
	      > profitto <- c(classeA, classeB)
	      > label <- factor(c(rep("A", 10), rep("B", 10)))
	      > boxplot(profitto~label, notch=T, xlab="classi", ylab="profitto")
	      ]]>
	    </code>
	    mostra i risultati dei test nelle due classi e disegna il
	    boxplot di <cnxn target="tboxplot"/>. Poiché i
	    solchi dei due plot non si sovrappongono, si può
	    concludere che le medie sono significativamente diverse,
	    con un livello di significatività al 5%. La variabilità è
	    simile in entrambe le classi, e pertanto ha senso
	    procedere con un t-test.
	    <figure id="tboxplot">
	      <name>Boxplot</name>
	      <media type="image/png" src="bpclassi.png"/>
	      <caption>Boxplot.</caption>
	    </figure>
	    Possiamo calcolare esplicitamente le varianze campionarie
	    per le due classi e, da queste, il valore della variabile
	    t di Student:
	    <code type="block">
	      <![CDATA[
	      > s2A <-  var(classeA)
	      > s2B <-  var(classeB)
	      > (mean(classeA) - mean(classeB))/sqrt(s2A/10 + s2B/10)
	      [1] -3.872983
	      ]]>
	    </code>
	    Il valore ottenuto va considerato in modulo, e confrontato
	    con il valore critico per la significatività scelta, il
	    quale è
	    <code type="block">
	      <![CDATA[ 
	      > qt(0.975, 18) 
	      [1] 2.100922 
	      ]]> 
	    </code> 	    
	    Nel primo parametro della chiamata a <code>qt()</code>, si
	      noti come il test vada condotto a <emphasis>due
	      code</emphasis>, e quindi α divisa per due, perché
	      non c'è una direzione preferenziale di confronto: ci
	      interessa solo la diversità tra le due classi e non una
	      relazione d'ordine. Il secondo parametro è il numero
	      complessivo di gradi di libertà. Poiché il valore
	      calcolato è più grande del valore critico l'ipotesi
	      nulla può essere respinta. Rovesciando il ragionamento,
	      possiamo attribuire un valore di probabilità
	      all'osservazione, supponendo che valga l'ipotesi
	      nulla. Questa probabilità è
	    <code type="block">
	      <![CDATA[
	      > 2*pt(-3.872983, 18)
	      [1] 0.001114540  
	      ]]>
	    </code>
	    ed è molto inferiore al 5% che ci eravamo posti come
	    soglia. In <code>R</code>, il t-test si può condurre con
	    una sola istruzione
	    <code type="block">
	    <![CDATA[
	      > t.test(classeA, classeB)

	      Welch Two Sample t-test

	      data:  classeA and classeB 
	      t = -3.873, df = 18, p-value = 0.001115
	      alternative hypothesis: true difference in means is not equal to 0 
	      95 percent confidence interval:
	      -3.0849115 -0.9150885 
	      sample estimates:
	      mean of x mean of y 
	      3         5 
	      ]]>
	    </code>
	    In un rapporto di ricerca, il risultato dell'analisi si
	    può presentare come "il profitto della classe B (<m:math>
	      <m:apply>
		<m:eq/>
		<m:mtext>media</m:mtext>
		<m:cn>5</m:cn>
	      </m:apply>
	    </m:math>) è significativamente diverso da quello della classe A (<m:math>
	      <m:apply>
		<m:eq/>
		<m:mtext>media</m:mtext>
		<m:cn>3</m:cn>
	      </m:apply>
	    </m:math>; <m:math>
	      <m:apply>
		<m:eq/>
		<m:mtext>t</m:mtext>
		<m:cn>3.873</m:cn>
	      </m:apply>
	    </m:math>, <m:math>
	      <m:apply>
		<m:eq/>
		<m:mtext>p</m:mtext>
		<m:cn>0.0011</m:cn>
	      </m:apply>
	    </m:math> (two-tailed), <m:math>
	      <m:apply>
		<m:eq/>
		<m:mtext>d.f.</m:mtext>
		<m:cn>18</m:cn>
	      </m:apply>
	    </m:math>)". 
	  </para>
	  <para id="tclassioctave">
	    Con il software libero <link src="http://www.octave.org">Octave</link>, la
	    stessa analisi si svolgerebbe con il comando
	  <code type="block">
	    <![CDATA[
	    octave> classeA = [3 4 4 3 2 3 1 3 5 2];
	    octave> classeB = [5 5 6 7 4 4 3 5 6 5];
	    octave> [p, t, df] = t_test_2(classeA, classeB, "<>")
	    p = 0.0011145
	    t = -3.8730
	    df = 18
	    ]]>
	  </code>
	</para>
	</example>
	<para id="withint">
	  L'ipotesi fondante per la verifica di ipotesi sulle medie è
	  che la popolazione sia normale, e di varianza omogenea tra i
	  campioni. Il metodo è robusto a variazioni dalla
	  normalità. Però deve valere l'ipotesi di indipendenza tra le
	  medie, e questo non si può avere con test di tipo "within
	  subjects". Per ovviare a questo problema si può però
	  riformulare il test considerando i dati come provenienti da
	  un unico campione di differenze di punteggi <m:math>
	    <m:ci>D</m:ci>
	  </m:math>.
	  L'ipotesi nulla
	  diventa <m:math>
	    <m:ci> <m:msub>
		  <m:mi>H</m:mi>
		  <m:mn>0</m:mn>
		</m:msub></m:ci>
	  </m:math>: <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:apply>
		<m:ci type="fn">E</m:ci> 
		<m:ci>
		  <m:mover accent="true">
		    <m:mi>D</m:mi>
		    <m:mi>_</m:mi>
		  </m:mover>
		</m:ci>
	      </m:apply>
	      <m:cn>0</m:cn>
	    </m:apply>
	  </m:math>, e si verifica con 
	  <equation id="tstudwithin">
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:mi>t</m:mi>
		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:minus/>
		    <m:ci>
		      <m:mover accent="true">
			<m:mi>D</m:mi>
			<m:mi>_</m:mi>
		      </m:mover>
		    </m:ci>
		    <m:apply>
		      <m:ci type="fn">E</m:ci> 
		      <m:ci>
			<m:mover accent="true">
			  <m:mi>D</m:mi>
			  <m:mi>_</m:mi>
			</m:mover>
		      </m:ci>
		    </m:apply>
		  </m:apply>
		  <m:apply>
		    <m:divide/>
		    <m:ci><m:msub>
			<m:mi>s</m:mi>
			<m:mi>D</m:mi>
		      </m:msub>
		    </m:ci>
		    <m:msqrt>
		      <m:ci>n</m:ci>
		    </m:msqrt>
		  </m:apply>
		</m:apply>
	      </m:apply>
	    </m:math>
	    </equation>
	  con <m:math>
	    <m:apply>
	      <m:minus/>
	      <m:ci>n</m:ci>
	      <m:cn>1</m:cn>
	    </m:apply>
	  </m:math> gradi di libertà.
	</para>
      </section>
      <section id="regressiones">
	<name>Regressione multipla</name>
	<para id="regressionep">
	  Si abbiano <m:math><m:ci>k</m:ci></m:math> variabili
	  indipendenti quantitative. Il modello di regressione lineare
	  si esprime come
	  <equation id="regressionelinmod">
	    <m:math>
	    <m:apply>
		<m:eq/>
		<m:ci>
		  <m:msub>
		    <m:mi>y</m:mi>
		    <m:mi>i</m:mi>
		  </m:msub>
		</m:ci>
		<m:apply>
		  <m:plus/>
		  <m:ci>
		    <m:msub>
		      <m:mi>β</m:mi>
		      <m:mn>0</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:apply>
		    <m:times/>
		    <m:ci>
		      <m:msub>
			<m:mi>β</m:mi>
			<m:mn>1</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mi>x</m:mi>
			<m:mn>1, i</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply> 
		  <m:apply>
		    <m:times/>
		    <m:ci>
		      <m:msub>
			<m:mi>β</m:mi>
			<m:mn>2</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mi>x</m:mi>
			<m:mn>2, i</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply> 
		  <m:mtext>...</m:mtext>
		  <m:apply>
		    <m:times/>
		    <m:ci>
		      <m:msub>
			<m:mi>β</m:mi>
			<m:mn>k</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mi>x</m:mi>
			<m:mn>k, i</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		  <m:ci><m:msub><m:mi>ɛ</m:mi><m:mi>i</m:mi></m:msub></m:ci>
		</m:apply>
	    </m:apply>
	    </m:math>
	  </equation>
	  Con <m:math><m:ci>n</m:ci></m:math> osservazioni il modello
	  si può esprimere in forma matriciale
	  <equation id="regressionelinmodm">
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci type="vector">y</m:ci>
		<m:apply>
		  <m:plus/>
		  <m:apply>
		    <m:times/>
		    <m:ci type="matrix">X</m:ci>
		    <m:ci type="vector">b</m:ci>
		  </m:apply>
		  <m:ci type="vector">ɛ</m:ci>
		</m:apply>
	      </m:apply>
	    </m:math>
	  </equation>
	  Tipicamente il numero di osservazioni è superiore al numero
	  di variabili indipendenti, e pertanto il sistema <cnxn target="regressionelinmodm"/> risulta
	  sovradeterminato. Esso si può risolvere ai <cnxn document="m10371">minimi quadrati</cnxn> ottenendo
	  <equation id="mssol">
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci type="vector">b</m:ci>
		<m:apply>
		  <m:times/>
		  <m:apply>
		    <m:power/>
		    <m:apply>
		      <m:times/>
		      <m:apply>
			<m:power/>
			<m:ci type="matrix">X</m:ci>
			<m:mtext>'</m:mtext>
		      </m:apply>
		      <m:ci type="matrix">X</m:ci>
		    </m:apply>
		    <m:mn>-1</m:mn>
		  </m:apply>
		  <m:apply>
		    <m:power/>
		    <m:ci type="matrix">X</m:ci>
		    <m:mtext>'</m:mtext>
		  </m:apply>
		  <m:ci type="vector">y</m:ci>
		</m:apply>
	      </m:apply>
	    </m:math>
	    </equation>
	  La <cnxn target="mssol"/> è la soluzione che minimizza
	  la <term>Somma quadratica degli errori</term>
	  <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:ci>SSE</m:ci>
	      <m:apply>
		<m:sum/>
		<m:bvar>
		  <m:ci>i</m:ci>
		</m:bvar>
		<m:lowlimit>
		  <m:ci>1</m:ci>
		</m:lowlimit>
		<m:uplimit>
		  <m:ci>n</m:ci>
		</m:uplimit>
		<m:apply>
		  <m:power/>
		  <m:apply>
		    <m:minus/>
		    <m:ci>
		      <m:msub>
			<m:mi>y</m:mi>
			<m:mi>i</m:mi>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mover accent="true">
			  <m:mi>y</m:mi>
			  <m:mi>̂</m:mi>
			</m:mover>
			<m:ci>i</m:ci>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		  <m:mn>2</m:mn>
		</m:apply>
	      </m:apply>
	    </m:apply>
	  </m:math>, dove <m:math><m:msub>
			<m:mover accent="true">
			  <m:mi>y</m:mi>
			  <m:mi>̂</m:mi>
			</m:mover>
			<m:ci>i</m:ci>
		      </m:msub>
	  </m:math> è la stima dell'i-esimo campione fornita dal modello lineare. 
	 </para>
	<para id="regressionequantiquali">
	  Se si hanno <m:math>
	    <m:ci>k</m:ci>
	  </m:math>
	  variabili quantitative e una variabile qualitativa il
	  modello di regressione è
	  
	  <equation id="regressionelinmodq">
	    <m:math>
	    <m:apply>
		<m:eq/>
		<m:ci>
		  <m:msub>
		    <m:mi>y</m:mi>
		    <m:mi>i</m:mi>
		  </m:msub>
		</m:ci>
		<m:apply>
		  <m:plus/>
		  <m:ci>
		    <m:msub>
		      <m:mi>β</m:mi>
		      <m:mn>0</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:apply>
		    <m:times/>
		    <m:ci>
		      γ
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mi>D</m:mi>
			<m:mi>i</m:mi>
		      </m:msub>
		    </m:ci>
		  </m:apply> 
		  <m:apply>
		    <m:times/>
		    <m:ci>
		      <m:msub>
			<m:mi>β</m:mi>
			<m:mn>1</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mi>x</m:mi>
			<m:mn>1, i</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply> 
		  <m:apply>
		    <m:times/>
		    <m:ci>
		      <m:msub>
			<m:mi>β</m:mi>
			<m:mn>2</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mi>x</m:mi>
			<m:mn>2, i</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply> 
		  <m:mtext>...</m:mtext>
		  <m:apply>
		    <m:times/>
		    <m:ci>
		      <m:msub>
			<m:mi>β</m:mi>
			<m:mn>k</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:msub>
			<m:mi>x</m:mi>
			<m:mn>k, i</m:mn>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		  <m:ci><m:msub><m:mi>ɛ</m:mi><m:mi>i</m:mi></m:msub></m:ci>
		</m:apply>
	    </m:apply>
	    </m:math>
	  </equation>
	  dove <m:math><m:ci>
		      <m:msub>
			<m:mi>D</m:mi>
			<m:mi>i</m:mi>
		      </m:msub>
		    </m:ci>
	  </m:math>
	  è una variabile dicotomica, cioè assume solo i valori <m:math>
	    <m:cn>0</m:cn>
	  </m:math> o <m:math>
	    <m:cn>1</m:cn>
	  </m:math>.
	</para>
	<example id="helpex">
	  <para id="helpp">
	    Si studi la relazione tra la prestazione in un test di
	      apprendimento di un software (variabile <m:math>
	      <m:ci>y</m:ci> </m:math>) e il numero di volte in cui i
	      soggetti hanno fatto ricorso all'help durante
	      l'apprendimento dello stesso (variabile <m:math>
	      <m:ci>x</m:ci> </m:math>). La variabile qualitativa
	      <m:math> <m:ci>D</m:ci> </m:math> discrimina tra utenti
	      esperti e novizi.
	  </para>
	  <para id="sessionqp">
	    Ecco una sessione in <code>R</code> che produce la
	      regressione ai minimi quadrati (funzione
	      <code>lm()</code>, per linear model) e traccia il
	      grafico di <cnxn target="regressioneqf"/>.
	  <code type="block">
	    <![CDATA[
	    > risp_corrette
	    [1] 80 88 89 62 67 37 62 78 62 77 81 41 26 41 37 57 35 58 22 25 46 18 56 26 38 21
	    > help
	    [1] 16 25 21 13 17  2 11 14  8 12 17  7  6 16 17 21 14 25  7 12 19  9 17 14 16  6
	    > esperienza
	    [1] 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
	    > rce <- split(risp_corrette, esperienza)
	    > he <- split(help, esperienza)
	    > plot(help, risp_corrette, type="n", ylab="Risposte corrette", 
	    + xlab="invocazioni help")
	    > points(he[[1]], rce[[1]], pch=16) 
	    > points(he[[2]], rce[[2]])
	    > lm(risp_corrette ~ help + esperienza)
	    
	    Call:
	    lm(formula = risp_corrette ~ help + esperienza)
	    
	    Coefficients:
	    (Intercept)         help   esperienza  
	    3.738        2.280       33.962  
	    
	    > abline(3.738, 2.28)
	    > abline(3.738 + 33.962, 2.28, lty=2)
	    ]]>
	  </code>
	    <figure id="regressioneqf">
	      <name>Regressione multipla</name> <media type="image/png" src="regrq.png"/> <caption>Regressione
	      con una variabile qualitativa e una variabile
	      quantitativa.</caption>
	    </figure>
	    Una domanda che è naturale porsi è se e quanto sia
	    significativo il livello di esperienza.
	  </para>
	</example>
      </section>
      <section id="regressionean">
	<name>Analisi della Regressione</name>
	<para id="sommedefp">
	  Indicata con <m:math><m:mover accent="true">
			<m:mi>y</m:mi>
			<m:mi>_</m:mi>
		      </m:mover>
	  </m:math> la media delle osservazioni, e definite la
<term>Somma totale dei quadrati</term>
	  <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:ci>SSY</m:ci>
	      <m:apply>
		<m:sum/>
		<m:bvar>
		  <m:ci>i</m:ci>
		</m:bvar>
		<m:lowlimit>
		  <m:ci>1</m:ci>
		</m:lowlimit>
		<m:uplimit>
		  <m:ci>n</m:ci>
		</m:uplimit>
		<m:apply>
		  <m:power/>
		  <m:apply>
		    <m:minus/>
		    <m:ci>
		      <m:msub>
			<m:mi>y</m:mi>
			<m:mi>i</m:mi>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:mover accent="true">
			<m:mi>y</m:mi>
			<m:mi>_</m:mi>
		      </m:mover>
		    </m:ci>
		  </m:apply>
		  <m:mn>2</m:mn>
		</m:apply>
	      </m:apply>
	    </m:apply>
	  </m:math>
	  e la <term>Somma dei quadrati di regressione</term>
	  <m:math>
	    <m:apply>
	      <m:eq/>
	      <m:ci>SSR</m:ci>
	      <m:apply>
		<m:sum/>
		<m:bvar>
		  <m:ci>i</m:ci>
		</m:bvar>
		<m:lowlimit>
		  <m:ci>1</m:ci>
		</m:lowlimit>
		<m:uplimit>
		  <m:ci>n</m:ci>
		</m:uplimit>
		<m:apply>
		  <m:power/>
		  <m:apply>
		    <m:minus/>
		    <m:ci>
		      <m:msub>
			<m:mover accent="true">
			  <m:mi>y</m:mi>
			  <m:mi>̂</m:mi>
			</m:mover>
			<m:ci>i</m:ci>
		      </m:msub>
		    </m:ci>
		    <m:ci>
		      <m:mover accent="true">
			<m:mi>y</m:mi>
			<m:mi>_</m:mi>
		      </m:mover>
		    </m:ci>
		  </m:apply>
		  <m:mn>2</m:mn>
		</m:apply>
	      </m:apply>
	    </m:apply>
	  </m:math>
	  si dimostra che vale l'ortogonalità tra la variabilità dei
	  dati rispetto al modello lineare e la variabilità del
	  modello rispetto alla media dei dati. Cioè 
	  <equation id="sommeq">
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci>SSY</m:ci>
		<m:apply>
		  <m:plus/>
		  <m:ci>SSR</m:ci>
		  <m:ci>SSE</m:ci>		  
		</m:apply>
	      </m:apply>
	    </m:math>
	  </equation>
	  Si usa anche dire che la varianza totale è data dalla somma
	    della varianza entro i gruppi (<m:math> <m:ci>SSE</m:ci>
	  </m:math>) e tra i gruppi (<m:math> <m:ci>SSR</m:ci> </m:math>).
	  Il <term>Coefficiente di determinazione</term> è definito come 
	  <equation id="determcoeff">
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:apply>
		  <m:power/>
		  <m:ci>
		    <m:msub>
		      <m:mi>r</m:mi>
		      <m:mn>xy</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
		<m:apply>
		  <m:divide/>
		  <m:ci>SSR</m:ci>
		  <m:ci>SSY</m:ci>
		</m:apply>
	      </m:apply>
	    </m:math>
	  </equation>
	  Questo è un numero compreso tra <m:math> <m:mn>0</m:mn>
	    </m:math> e <m:math> <m:mn>1</m:mn> </m:math>, e vale
	    <m:math> <m:mn>1</m:mn> </m:math> se non c'è errore
	    residuo, cioè se la regressione fa un fit perfetto. Si
	    dimostra che <m:math><m:apply> <m:power/>
		  <m:ci>
		    <m:msub>
		      <m:mi>r</m:mi>
		      <m:mn>xy</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
	  </m:math> è il quadrato del <term>Coefficiente di
	    correlazione</term>, definito come il rapporto tra la
	    covarianza e le deviazioni standard campionarie di
	    <m:math> <m:ci>x</m:ci> </m:math> e <m:math>
	    <m:ci>y</m:ci> </m:math>.
	  <equation id="corrcoeff">
	    <m:math>
	      <m:apply>
		<m:eq/>
		  <m:ci>
		    <m:msub>
		      <m:mi>r</m:mi>
		      <m:mn>xy</m:mn>
		    </m:msub>
		  </m:ci>
		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:times/>
		    <m:apply>
		      <m:sum/>
		      <m:bvar>
			<m:ci>i</m:ci>
		      </m:bvar>
		      <m:lowlimit>
			<m:cn>1</m:cn>
		      </m:lowlimit>
		      <m:uplimit>
			<m:ci>n</m:ci>
		      </m:uplimit>
		      <m:apply>
			<m:minus/>
			<m:ci>
			  <m:msub>
			    <m:mi>x</m:mi>
			    <m:mi>i</m:mi>
			  </m:msub>
			</m:ci>
			<m:ci>
			  <m:mover accent="true">
			    <m:mi>x</m:mi>
			    <m:mi>_</m:mi>
			  </m:mover>
			</m:ci>
		      </m:apply>
		    </m:apply>
		    <m:apply>
		      <m:sum/>
		      <m:bvar>
			<m:ci>i</m:ci>
		      </m:bvar>
		      <m:lowlimit>
			<m:cn>1</m:cn>
		      </m:lowlimit>
		      <m:uplimit>
			<m:ci>n</m:ci>
		      </m:uplimit>
		      <m:apply>
			<m:minus/>
			<m:ci>
			  <m:msub>
			    <m:mi>y</m:mi>
			    <m:mi>i</m:mi>
			  </m:msub>
			</m:ci>
			<m:ci>
			  <m:mover accent="true">
			    <m:mi>y</m:mi>
			    <m:mi>_</m:mi>
			  </m:mover>
			</m:ci>
		      </m:apply>
		    </m:apply>
		  </m:apply>
		  <m:apply>
		    <m:times/>
		    <m:ci>n</m:ci>
		    <m:ci><m:msub>
			<m:mi>S</m:mi>
			<m:mi>x</m:mi>
		      </m:msub>
		    </m:ci>
		    <m:ci><m:msub>
			<m:mi>S</m:mi>
			<m:mi>y</m:mi>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		</m:apply>
		<m:apply>
		  <m:divide/>
		  <m:ci><m:msub>
		      <m:mi>S</m:mi>
		      <m:mi>xy</m:mi>
		    </m:msub>
		  </m:ci>
		  <m:apply>
		    <m:ci><m:msub>
			<m:mi>S</m:mi>
			<m:mi>x</m:mi>
		      </m:msub>
		    </m:ci>
		    <m:ci><m:msub>
			<m:mi>S</m:mi>
			<m:mi>y</m:mi>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		</m:apply>
	      </m:apply>
	    </m:math>
	  </equation>
	</para>

	<list id="proprietal" type="enumerated">
	  <name>Proprietà dei coefficienti di regressione
	  multipla</name> 

	  <item>Il valore atteso del j-esimo elemento di <m:math><m:ci type="vector">b</m:ci></m:math> è <m:math><m:ci>
		      <m:msub>
			<m:mi>β</m:mi>
			<m:mn>j</m:mn>
		      </m:msub>
		    </m:ci></m:math> </item> 

	  <item>La varianza del j-esimo elemento di <m:math><m:ci type="vector">b</m:ci></m:math> è
	    <m:math>
	    <m:apply>
	      <m:times/>
		<m:ci>
		  <m:msub>
		    <m:mi>ν</m:mi>
		    <m:mi>jj</m:mi>
		  </m:msub>
		</m:ci>
		<m:apply>
		  <m:power/>
		  <m:ci>
		    <m:msub>
		      <m:mi>σ</m:mi>
		      <m:mn>ɛ</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
	    </m:apply>
	  </m:math>, dove <m:math><m:ci>
		  <m:msub>
		    <m:mi>ν</m:mi>
		    <m:mi>jj</m:mi>
		  </m:msub>
		</m:ci></m:math>
	  è il j-esimo elemento diagonale di 
	  <m:math>
	    <m:apply>
	      <m:times/>
	      <m:apply>
		<m:power/>
		<m:apply>
		  <m:times/>
		  <m:apply>
		    <m:power/>
		    <m:ci type="matrix">X</m:ci>
		    <m:mtext>'</m:mtext>
		  </m:apply>
		  <m:ci type="matrix">X</m:ci>
		</m:apply>
		<m:mn>-1</m:mn>
	      </m:apply>
	    </m:apply>
	  </m:math>
	    e <m:math><m:apply>
		  <m:power/>
		  <m:ci>
		    <m:msub>
		      <m:mi>σ</m:mi>
		      <m:mn>ɛ</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:mn>2</m:mn> </m:apply> </m:math> è la varianza
	      del rumore additivo
	      <m:math><m:ci>ɛ</m:ci></m:math>
	</item>

	  <item id="stimasigma">
	    <m:math>
	      <m:apply>
		<m:eq/>
		  <m:apply>
		    <m:power/>
		    <m:ci>
		      <m:msub>
			<m:mi>S</m:mi>
			<m:mn>E</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:mn>2</m:mn>
		  </m:apply>
		  <m:apply>
		    <m:divide/>
		    <m:ci>SSE</m:ci>
		    <m:apply>
		      <m:minus/>
		      <m:ci>n</m:ci>
		      <m:apply>
			<m:plus/>
			  <m:ci>k</m:ci>
			  <m:cn>1</m:cn>
		      </m:apply>
		    </m:apply>
		  </m:apply>
	      </m:apply>
	    </m:math>	  
	    è uno stimatore unbiased di <m:math><m:ci>
		    <m:msub>
		      <m:mi>σ</m:mi>
		      <m:mn>ɛ</m:mn>
		    </m:msub>
		  </m:ci></m:math>.
	  </item>

	  <item>
	    Le variabili di residuo
	  <m:math>
	      <m:ci>
		<m:msub>
		  <m:mi>ɛ</m:mi>
		  <m:mi>i</m:mi>
		</m:msub>
	      </m:ci>
	    </m:math>
	  sono normalmente distribuite.
	  </item>
	  
	  <item>
	    I coefficienti parziali di regressione (elementi di
	    <m:math><m:ci type="vector">b</m:ci></m:math>) sono
	    normalmente distribuiti.
	  </item>

	</list>

	<para id="subpropp">
	  <name>Ulteriori proprietà</name>
	sono associabili alla  3 di <cnxn target="proprietal"/>:
	<list type="enumerated" id="subpropl">
	  <item>
	    <m:math>
	      <m:apply>
		<m:divide/>
		<m:apply>
		  <m:times/>
		  <m:apply>
		    <m:power/>
		    <m:ci>
		      <m:msub>
			<m:mi>S</m:mi>
			<m:mn>E</m:mn>
		      </m:msub>
		    </m:ci>
		    <m:mn>2</m:mn>
		  </m:apply>
		  <m:ci>ν</m:ci>
		</m:apply>
		<m:apply>
		  <m:power/>
		  <m:ci>
		    <m:msub>
		      <m:mi>σ</m:mi>
		      <m:mn>ɛ</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
	      </m:apply>
	    </m:math> è distribuita come una variabile aleatoria 
	    <m:math>
	      <m:apply>
		  <m:power/>
		  <m:ci>
		    <m:msub>
		      <m:mi>χ</m:mi>
		      <m:mn>ν</m:mn>
		    </m:msub>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
	    </m:math> con <m:math><m:ci>ν</m:ci></m:math> gradi di libertà.
	  </item>

	    <item>La differenza di due variabili aleatorie <m:math>
	      <m:apply>
		  <m:power/>
		  <m:ci>
		      <m:mi>χ</m:mi>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
	      </m:math> con <m:math>
		<m:ci><m:msub><m:mi>ν</m:mi><m:mn>1</m:mn></m:msub></m:ci>
	      </m:math> e <m:math>
		<m:ci><m:msub><m:mi>ν</m:mi><m:mn>2</m:mn></m:msub></m:ci>
	      </m:math> gradi di libertà è ancora una variabile aleatoria 
	    <m:math>
	      <m:apply>
		  <m:power/>
		  <m:ci>
		      <m:mi>χ</m:mi>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
	      </m:math> con <m:math> <m:apply><m:minus/>
		  <m:ci><m:msub><m:mi>ν</m:mi><m:mn>1</m:mn></m:msub></m:ci>
		  <m:ci><m:msub><m:mi>ν</m:mi><m:mn>2</m:mn></m:msub></m:ci>
		</m:apply></m:math> gradi di libertà.
	    </item>
	    <item>
	      Il rapporto di due variabili aleatorie <m:math>
	      <m:apply>
		  <m:power/>
		  <m:ci>
		      <m:mi>χ</m:mi>
		  </m:ci>
		  <m:mn>2</m:mn>
		</m:apply>
	      </m:math> con <m:math>
		<m:ci><m:msub><m:mi>ν</m:mi><m:mn>1</m:mn></m:msub></m:ci>
		</m:math> e <m:math>
		<m:ci><m:msub><m:mi>ν</m:mi><m:mn>2</m:mn></m:msub></m:ci>
		</m:math> gradi di libertà è una variabile aleatoria
		di tipo <m:math><m:ci>F</m:ci></m:math>, secondo la relazione
	      <m:math>
		<m:apply>
		  <m:eq/>
		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:divide/>
		      <m:apply>
			<m:power/>
			<m:ci>
			  <m:msub>
			    <m:mi>χ</m:mi>
			    <m:ci><m:msub><m:mi>ν</m:mi><m:mn>1</m:mn></m:msub></m:ci>
			  </m:msub>
			</m:ci>
			<m:mn>2</m:mn>
		      </m:apply>
		      <m:ci><m:msub><m:mi>ν</m:mi><m:mn>1</m:mn></m:msub></m:ci>
		    </m:apply>
		    <m:apply>
		      <m:divide/>
		      <m:apply>
			<m:power/>
			<m:ci>
			  <m:msub>
			    <m:mi>χ</m:mi>
			    <m:ci><m:msub><m:mi>ν</m:mi><m:mn>2</m:mn></m:msub></m:ci>
			  </m:msub>
			</m:ci>
			<m:mn>2</m:mn>
		      </m:apply>
		      <m:ci><m:msub><m:mi>ν</m:mi><m:mn>2</m:mn></m:msub></m:ci>
		    </m:apply>
		  </m:apply>
		  <m:ci>
		    <m:msub>
		      <m:mi>F</m:mi>
		      <m:ci>
			<m:msub><m:mi>ν</m:mi><m:mn>1</m:mn></m:msub>
			<m:msub><m:mi>ν</m:mi><m:mn>2</m:mn></m:msub>
		      </m:ci>
		    </m:msub>
		  </m:ci>
		</m:apply>
	      </m:math>
	    </item>
	</list>
	</para>
	<section id="ipotesicoeffreg">
	  <name>Verifica di ipotesi sui coefficienti di regressione</name>
	  <para id="ipotesicoeffregp">
	    Se si deve verificare l'ipotesi nulla 
	    <m:math>
	      <m:ci> <m:msub>
		  <m:mi>H</m:mi>
		  <m:mn>0</m:mn>
		</m:msub></m:ci>
	    </m:math>:
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci> <m:msub>
		    <m:mi>b</m:mi>
		    <m:mi>j</m:mi>
		  </m:msub></m:ci>
		<m:ci> <m:msub>
		    <m:mi>β</m:mi>
		    <m:mi>j, 0</m:mi>
		  </m:msub></m:ci>
	      </m:apply>
	    </m:math> si può applicare, in virtù delle 2 e 3
	delle <cnxn target="proprietal"/>, il t-test con la
	statistica
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:mi>t</m:mi>
		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:minus/>
		    <m:ci>
		      <m:msub>
			<m:mi>b</m:mi>
			<m:mi>j</m:mi>
		      </m:msub>
		    </m:ci>
		    <m:ci> <m:msub>
			<m:mi>β</m:mi>
			<m:mi>j, 0</m:mi>
		      </m:msub>
		    </m:ci>
		  </m:apply>
		  <m:apply>
		    <m:root/>
		    <m:apply>
		      <m:times/>
		      <m:apply>
			<m:divide/>
			<m:mi>SSE</m:mi>
			<m:apply>
			  <m:minus/>
			  <m:ci>n</m:ci>
			  <m:apply>
			    <m:plus/>
			    <m:ci>k</m:ci>
			    <m:cn>1</m:cn>
			  </m:apply>
			</m:apply>
		      </m:apply>
		      <m:ci>
			<m:msub>
			  <m:mi>ν</m:mi>
			  <m:mi>jj</m:mi>
			</m:msub>
		      </m:ci>
		    </m:apply>
		  </m:apply>
		</m:apply>
	      </m:apply>
	    </m:math>	    
	  </para>
	</section>
	<section id="verificamodello">
	<name>Verifica di minimalità di un modello</name>
	<para id="verificamodellop">
	  Supponiamo di avere un modello con
		<m:math><m:ci>k</m:ci></m:math> regressori e di volere
		verificare l'ipotesi nulla <m:math> <m:ci> <m:msub>
		<m:mi>H</m:mi> <m:mn>0</m:mn> </m:msub></m:ci>
		</m:math>:
	    <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci> <m:msub>
		  <m:mi>β</m:mi>
		  <m:mn>1</m:mn>
		</m:msub></m:ci>
	      <m:ci>...</m:ci>
		<m:ci> <m:msub>
		  <m:mi>β</m:mi>
		  <m:mi>p</m:mi>
		</m:msub></m:ci>
		<m:ci>0</m:ci>
	      </m:apply>
	    </m:math>, cioè che esiste un sottomodello ugualmente
	  rappresentativo. Indichiamo con
	  <m:math>
	      <m:ci>
		<m:msub>
		  <m:mi>SSE</m:mi>
		  <m:mrow>
		    <m:mi> k </m:mi>
		    <m:mo> - </m:mo>
		    <m:mi> p </m:mi>
		  </m:mrow>
		</m:msub>
	      </m:ci>
	    </m:math>
	  lo scarto per la regressione con le
	  <m:math><m:apply><m:minus/>
	  <m:ci>k</m:ci><m:ci>p</m:ci></m:apply></m:math> variabili
	  rimaste. In virtù delle <cnxn target="subpropp"> proprietà
	  </cnxn> possiamo scrivere l'equivalenza nel senso della
	  distribuzione statistica
	    <equation id="feq">
	      <m:math>

		  <m:mrow>
		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:divide/>
		      <m:apply>
			<m:minus/>
			<m:ci><m:msub><m:mi>SSE</m:mi>
			    <m:mrow>
			      <m:mi> k </m:mi>
			      <m:mo> - </m:mo>
			      <m:mi> p </m:mi>
			    </m:mrow>
			  </m:msub>
			</m:ci>
			<m:ci>SSE</m:ci>
		      </m:apply>
		      <m:ci>p</m:ci>
		    </m:apply>
		    <m:apply>
		      <m:divide/>
		      <m:ci>SSE</m:ci>
		      <m:apply>
			<m:plus/>
			<m:ci>n</m:ci>
			<m:apply><m:minus/><m:ci>k</m:ci></m:apply>
			<m:cn>-1</m:cn>
		      </m:apply>
		    </m:apply>
		  </m:apply>

		    <m:mo>≈</m:mo>

		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:divide/>
		      <m:apply>
			<m:power/>		    
			<m:ci>
			  <m:msub>
			    <m:mi>χ</m:mi>
			    <m:mn>p</m:mn>
			  </m:msub>
			</m:ci>
			<m:mn>2</m:mn>
		      </m:apply>
		      <m:ci>p</m:ci>
		    </m:apply>

		    <m:apply>
		      <m:divide/>
		      <m:apply>
			<m:power/>		    
			<m:ci>
			  <m:msub>
			    <m:mi>χ</m:mi>
			    <m:mrow>
			      <m:mi> n </m:mi>
			      <m:mo> - </m:mo>
			      <m:mi> k </m:mi>
			      <m:mo> - </m:mo>
			      <m:mi> 1 </m:mi>
			    </m:mrow>
			  </m:msub>
			</m:ci>
			<m:mn>2</m:mn>
		      </m:apply>
		      <m:apply>
			<m:plus/>
			<m:ci>n</m:ci>
			<m:apply><m:minus/><m:ci>k</m:ci></m:apply>
			<m:cn>-1</m:cn>
		      </m:apply>
		    </m:apply>
		  </m:apply>
		
		  <m:mo>≈</m:mo>
		  
		  <m:ci>
		    <m:msub>
		      <m:mi>F</m:mi>
		      <m:ci>
			<m:mrow>
			  <m:mi>p,</m:mi>
			  <m:mi>n</m:mi>
			  <m:mo>-</m:mo>
			  <m:mi>k</m:mi>
			  <m:mo>-</m:mo>
			  <m:mn>1</m:mn>
			</m:mrow>
		      </m:ci>
		    </m:msub>
		  </m:ci>
		  
		</m:mrow>
	      </m:math>
	    </equation>
	</para>
	  <para id="ftest">
	    <name>F-test</name> Maggiore è l'incremento di errore
	    dovuto alla esclusione di <m:math><m:ci>p</m:ci></m:math>
	    regressori, minore è la probabilità che valga l'ipotesi
	    nulla. Dati i gradi di libertà di numeratore e
	    denominatore, si legge il valore tabulato per un dato
	    livello di significatività
	    <m:math><m:ci><m:msub><m:ci>F</m:ci><m:ci>α</m:ci></m:msub></m:ci></m:math>
	    e si rifiuta l'ipotesi nulla se <m:math>
	      <m:apply>
		<m:gt/>
		<m:ci>F</m:ci>
		<m:ci><m:msub><m:ci>F</m:ci><m:ci>α</m:ci></m:msub></m:ci>
	      </m:apply>
	    </m:math>. Oppure, il programma calcola la probabilità di
	    errore del primo tipo associata al valore di
	    <m:math><m:ci>F</m:ci></m:math> calcolato. Se
	    <m:math><m:ci>p</m:ci></m:math> è piccolo e <m:math>
	      <m:apply>
		<m:gt/>
		<m:ci>F</m:ci>
		<m:cn>1</m:cn>
	      </m:apply>
	    </m:math> si respinge l'ipotesi nulla.
	  </para>

	  <para id="f_r">
	    La <cnxn target="feq"/> può anche essere scritta in
	    termini di coefficiente di determinazione: 
	    <equation id="freq">

	    <m:math>
	      <m:apply>
		<m:eq/>
		
		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:minus/>			
		      <m:ci>SSR</m:ci>
		      <m:ci><m:msub><m:mi>SSR</m:mi>
			  <m:mrow>
			    <m:mi> k </m:mi>
			    <m:mo> - </m:mo>
			    <m:mi> p </m:mi>
			  </m:mrow>
			</m:msub>
		      </m:ci>
		    </m:apply>
		    <m:ci>p</m:ci>
		  </m:apply>
		  <m:apply>
		    <m:divide/>
		    <m:ci>SSE</m:ci>
		    <m:apply>
		      <m:plus/>
		      <m:ci>n</m:ci>
		      <m:apply><m:minus/><m:ci>k</m:ci></m:apply>
		      <m:cn>-1</m:cn>
		    </m:apply>
		  </m:apply>
		</m:apply>

		<m:apply>
		  <m:divide/>
		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:minus/>			
		      <m:apply>
			<m:power/>
			<m:ci>r</m:ci>
			<m:cn>2</m:cn>
		      </m:apply>
		      <m:msub>
			  <m:apply>
			    <m:power/>
			    <m:ci>r</m:ci>
			    <m:cn>2</m:cn>
			  </m:apply>
			  <m:mrow>
			    <m:mi> k </m:mi>
			    <m:mo> - </m:mo>
			    <m:mi> p </m:mi>
			  </m:mrow>
			</m:msub>
		      </m:apply>
		      <m:ci>p</m:ci>
		    </m:apply>
		    <m:apply>
		      <m:divide/>
		      <m:apply>
			<m:minus/>
			<m:cn>
			  1
			</m:cn>
			<m:apply>
			  <m:power/>
			  <m:ci>r</m:ci>
			  <m:cn>2</m:cn>
			</m:apply>
		      </m:apply>
		      <m:apply>
			<m:plus/>
			<m:ci>n</m:ci>
			<m:apply><m:minus/><m:ci>k</m:ci></m:apply>
			<m:cn>-1</m:cn>
		      </m:apply>
		    </m:apply>
		  </m:apply>
		  
		</m:apply>
	      </m:math>
	    </equation>
	    Un importante caso particolare si ha per <m:math>
	      <m:apply>
		<m:eq/>
		<m:ci>p</m:ci>
		<m:ci>k</m:ci>
	      </m:apply>
	    </m:math>, per il quale l'ipotesi nulla è: nessuna
	      variabile ha effetto su <m:math> <m:ci>y</m:ci>
	      </m:math>.  
	    In questo caso il test si fa con 
	    <equation id="ftesteq">
	      <m:math>
		<m:apply>
		  <m:eq/>
		  
		  <m:ci>F</m:ci>
		  
		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:divide/>
		      <m:ci>SSR</m:ci>
		      <m:ci>k</m:ci>
		    </m:apply>
		    <m:apply>
		      <m:divide/>
		      <m:ci>SSE</m:ci>
		      <m:apply>
			<m:plus/>
			<m:ci>n</m:ci>
			<m:apply><m:minus/><m:ci>k</m:ci></m:apply>
			<m:cn>-1</m:cn>
		      </m:apply>
		    </m:apply>
		  </m:apply>
		  <m:apply>
		    <m:apply>
		      <m:divide/>
		      <m:ci>between-groups   mean-square   variance</m:ci>
		      <m:ci>within-groups   mean-square   variance</m:ci>
		    </m:apply>
		  </m:apply>
		</m:apply>
	      </m:math>
	    </equation>	    
	  </para>

	  <example id="videogames">
	    <para id="videogamesp">
	      Si studi la relazione tra lo sviluppo di capacità
	      logiche nella adolescenza (misurate con un test
	      <code>logictest</code>) e il tempo speso settimanalmente
	      ai videogame (<code>vg</code>) o alla televisione
	      (<code>tv</code>). Lo studio è affrontato molto
	      semplicemente in <code>R</code>.
	    </para>
	    <para id="videogamescode">
	      <code type="block">
	      <![CDATA[
		> vg
		[1] 12  7 23  8 19 24  5 31  9 21 24 17 19  6 16 12 12 11 33 14  4  2 21 18 21
		> tv
		[1] 32  4 12 12 22 21 14  6  9 26 19 18 12 21 18 24 23 23 12 21 26  8 23 12 26
		> logictest
		[1] 34 12 67 46 43 78 56 69 23 67 89 73 26 41 52 19 83 38 56 43 11 21 54 56 87

		> summary(lm(logictest~tv+vg))
		
		Call:
		lm(formula = logictest ~ tv + vg)
		
		Residuals:
		    Min      1Q  Median      3Q     Max 
		-28.192 -14.089   1.308  11.183  36.416 
		
		Coefficients:
		             Estimate Std. Error t value Pr(>|t|)    
		(Intercept)  11.1431    12.4141   0.898 0.379108    
		tv            0.6083     0.5203   1.169 0.254910    
		vg            1.7875     0.4592   3.893 0.000783 ***
		---
		Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
		
		Residual standard error: 18.45 on 22 degrees of freedom
		Multiple R-Squared: 0.4249,	Adjusted R-squared: 0.3727 
		F-statistic: 8.129 on 2 and 22 DF,  p-value: 0.002274 		
	      ]]>
	    </code>
	    </para>
	    <para id="videogamesinterp">
	      Il prospetto fornito da <code>summary(lm())</code> si
	      può interpretare come segue
	      <list id="videogamesl">
		<item>I residui non presentano una distribuzione
		evidentemente asimmetrica, visti i valori minimo,
		massimo e mediano, e pertanto si può ragionevolmente
		assumere la gaussianità;</item> 
		<item>Il valore di
		<m:math> <m:ci>F</m:ci> </m:math> è alto ed
		accompagnato da un <m:math> <m:ci>p</m:ci> </m:math>
		piccolo, e pertanto si può falsificare l'ipotesi nulla
		secondo cui né i videogiochi né la televisione hanno
		effetto sullo sviluppo delle capacità logiche;
		</item>
		<item>
		Il coefficiente legato alle ore di videogiochi è
		significativamente (secondo il t-test) positivo,
		indicando un effetto.
		</item>
	      </list>
	      In <code>octave</code> lo stesso f-test si svolgerebbe con il comando
	      <code type="block">
		<![CDATA[
		octave> [p, f, df_num, df_den] = f_test_regression(logictest', 
		> [ones(1,25);tv;vg]',[[0 1 0];[0 0 1]])
		p = 0.0022740
		f = 8.1286
		df_num = 2
		df_den = 22
		]]>
	      </code> 
	    </para>
	  </example>

	  <example id="helpexreprise">
	    <para id="helpexrepp">
	      Si riprenda lo <cnxn target="helpex"/> e ci si chieda se
	      è significativo il grado di esperienza. In
	      <code>R</code>, da una <code type="block">summary(lm(risp_corrette~help+esperienza))</code>
	      si ricava il coefficiente di determinazione come primo
	      numero riportato nella linea 
	      <code type="block">
		Multiple R-Squared: 0.9051, Adjusted R-squared: 0.8969
	      </code>
	      Il secondo numero, se moltiplicato per
	      <m:math><m:mn>100</m:mn></m:math>, si interpreta come
	      riduzione percentuale della varianza apportata dal
	      modello lineare.  Trascurando la variabile dicotomica
	      relativa al grado di esperienza, il coefficiente di
	      determinazione risulta da
	      <code type="block">
		&gt; cor(risp_corrette, help) ^ 2
		[1] 0.3099675
	      </code>
	      o da
	      <code type="block">
		&gt; summary(lm(risp_corrette~help-esperienza))
		...
		Multiple R-Squared:  0.31,	Adjusted R-squared: 0.2812
	      </code>
	      e facendo il calcolo della <cnxn target="freq"/> si trova 
	      <m:math>
		<m:apply>
		  <m:eq/>
		  <m:msub>
		    <m:mi>F</m:mi>
		    <m:ci>
		      <m:mrow>
			<m:mn>1,</m:mn>
			<m:mn>23</m:mn>
		      </m:mrow>
		    </m:ci>
		  </m:msub>
		  <m:cn>144.27</m:cn>
		</m:apply>
	      </m:math>. Il valore di <m:math><m:ci>p</m:ci></m:math>
		associato a tale <m:math> <m:ci>F</m:ci> </m:math> è
		molto piccolo, e quindi si rigetta l'ipotesi nulla. In
		altri termini: il grado di esperienza conta.
	    </para>
	    <para id="helptp">
	      Inoltre, possiamo effettuare il t-test per verificare se
	      l'help-on-line è efficace per entrambi i gruppi. Anche
	      tale informazione si può estrarre dal prospetto di
	      <code type="block">summary(lm(risp_corrette~help+esperienza))</code>:
	      <code type="block">
		<![CDATA[
		Coefficients:
		              Estimate Std. Error t value Pr(>|t|)    
		(Intercept)   3.7382     3.9736   0.941    0.357    
		help          2.2797     0.2448   9.312 2.89e-09 ***
		esperienza   33.9622     2.8275  12.011 2.17e-11 ***
		]]>
	      </code> Poiché il valore <m:math>
		<m:apply>
		  <m:eq/>
		  <m:ci>t</m:ci>
		  <m:cn>9.312</m:cn>
		</m:apply>
	      </m:math>
	      è elevato e la corrispondente <m:math> <m:apply>
		  <m:eq/>
		  <m:ci>p</m:ci>
		  <m:cn>2.89e-09</m:cn>
		</m:apply>
		</m:math> è piccolissima, possiamo considerare provata
		l'efficacia dell'help.
	    </para>
	    <para id="helpoctavep">
	      In <code>octave</code>, f-test e t-test si conducono con le due chiamate
	      <code type="block">
		<![CDATA[
		octave> [p, f, dfn, dfd] = f_test_regression(risp_corrette, 
		> [ones(1,26); esperienza; help]', [0, 1, 0])
		p =  2.1692e-11
		f = 144.27
		dfn = 1
		dfd = 23
		octave> [p, t, dfn] = t_test_regression(risp_corrette, 
		> [ones(1,26); esperienza; help]', [0, 0, 1], 0, ">")
		p =  1.4428e-09
		t = 9.3115
		dfn = 23
		]]>
	      </code>
	      L'analisi andrebbe completata verificando la assenza di
	      interazioni tra <code>esperienza</code> e
	      <code>help</code>. Ciò si fa con un altro f-test,
	      aggiungendo il prodotto <code>esperienza.*help</code>, e
	      usando i coefficienti di determinazione con e senza il
	      prodotto delle due variabili. In <code>Octave</code>:
	      <code type="block">
		<![CDATA[
		octave>  [p, f, dfn, dfd] = f_test_regression(risp_corrette, 
		> [ones(1,26); esperienza; help; esperienza.*help]', [0, 0, 0, 1])
		p = 0.66901
		f = 0.18776
		dfn = 1
		dfd = 22
		]]>
	      </code>
	      In <code>R</code>, si fa
	      <code type="block">
		&gt; summary(lm(risp_corrette ~ help + esperienza + help:esperienza))
	      </code>
	      da cui si ottiene
	      <code type="block">
		Multiple R-Squared: 0.9059,	Adjusted R-squared: 0.8931 
	      </code>
	      che si può usare insieme al valore del coefficiente di
	      determinazione senza interazioni
	      (<m:math><m:cn>0.9051</m:cn></m:math>) all'interno della
	      <cnxn target="freq"/>, trovando così
	      <m:math>
		<m:apply>
		  <m:eq/>
		  <m:msub>
		    <m:mi>F</m:mi>
		    <m:ci>
		      <m:mrow>
			<m:mn>1,</m:mn>
			<m:mn>22</m:mn>
		      </m:mrow>
		    </m:ci>
		  </m:msub>
		  <m:cn>0.19</m:cn>
		</m:apply>
	      </m:math>, la cui probabilità associata è 
	      <code type="block">
		&gt; 2*pf(0.19, 1, 22)
		[1] 0.6656723
	      </code>
	      In questo caso non c'è evidenza di interazioni tra
	      <code>esperienza</code> e <code>help</code> e quindi i
	      loro effetti si possono studiare
	      separatamente. Viceversa, la presenza di interazione
	      significherebbe che gli effetti di ciascuna variabile
	      mutano a seconda dei valori assunti dall'altra.
	    </para>

	  </example>

	</section>

	<section id="anova">
	  <name>ANOVA</name>
	  <para id="anovap">
	    Con il termine ANOVA si indica usualmente una analisi
	    della regressione multipla in cui tutte le variabili
	    indipendenti sono qualitative. Lo scopo è quello di
	    stabilire se esistono differenze statisticamente
	    significative tra i gruppi corrispondenti alle variabili
	    indipendenti.

	    <definition id="onewayanova">
	      <term>One-way ANOVA</term> <meaning>E' una ANOVA con una
	      sola variabile indipendente qualitativa (o fattore) con
	      <m:math> <m:ci>m</m:ci> </m:math> categorie (o
	      livelli). Ci siano <m:math> <m:ci>n</m:ci> </m:math>
	      elementi misurati per ogni livello.
		<equation id="onewayanovamod">
		  <m:math>
		    <m:apply>
		      <m:eq/>
		      <m:ci>
			<m:msub>
			  <m:mi>y</m:mi>
			  <m:mi>i</m:mi>
			</m:msub>
		      </m:ci>
		      <m:apply>
			<m:plus/>
			<m:ci>α</m:ci>
			<m:apply>
			  <m:times/>
			  <m:ci>
			    <m:msub>
			      <m:mi>γ</m:mi>
			      <m:mn>1</m:mn>
			    </m:msub>
			  </m:ci>
			  <m:ci>
			    <m:msub>
			      <m:mi>D</m:mi>
			      <m:mn>1, i</m:mn>
			    </m:msub>
			  </m:ci>
			</m:apply> 
			<m:apply>
			  <m:times/>
			  <m:ci>
			    <m:msub>
			      <m:mi>γ</m:mi>
			      <m:mn>2</m:mn>
			    </m:msub>
			  </m:ci>
			  <m:ci>
			    <m:msub>
			      <m:mi>D</m:mi>
			      <m:mn>2, i</m:mn>
			    </m:msub>
			  </m:ci>
			</m:apply> 
			<m:mtext>...</m:mtext>
			<m:apply>
			  <m:times/>
			  <m:ci>
			    <m:msub>
			      <m:mi>γ</m:mi>
			      <m:mn>m-1</m:mn>
			    </m:msub>
			  </m:ci>
			  <m:ci>
			    <m:msub>
			      <m:mi>D</m:mi>
			      <m:mn>m-1, i</m:mn>
			    </m:msub>
			  </m:ci>
			</m:apply>
			<m:ci><m:msub><m:mi>ε</m:mi><m:mi>i</m:mi></m:msub></m:ci>
		      </m:apply>
		    </m:apply>
		  </m:math>
		</equation>
	      </meaning>
	    </definition>
	    <table id="codificaanova">
	      <tgroup cols="5" align="left" colsep="1" rowsep="1">
		<thead valign="top">
		  <row>
		    <entry/>
		    <entry><m:math>
			<m:msub>
			  <m:mi>D</m:mi>
			  <m:mn>1</m:mn>
			</m:msub>
		      </m:math>
		    </entry>
		    <entry><m:math>
			<m:msub>
			  <m:mi>D</m:mi>
			  <m:mn>2</m:mn>
			</m:msub>
		      </m:math>
		    </entry>
		    <entry><m:math>
			<m:ci>...</m:ci>
		      </m:math>
		    </entry>
		    <entry><m:math>
			<m:msub>
			  <m:mi>D</m:mi>
			  <m:mn>m-1</m:mn>
			</m:msub>
		      </m:math>
		    </entry>
		  </row>
		</thead>
		<tbody>
		  <row>
		    <entry>Group 1</entry>
		    <entry>1</entry>
		    <entry>0</entry>
		    <entry>...</entry>
		    <entry>0</entry>
		  </row>
		  <row>
		    <entry>Group 2</entry>
		    <entry>0</entry>
		    <entry>1</entry>
		    <entry>...</entry>
		    <entry>0</entry>
		  </row>
		  <row>
		    <entry>...</entry>
		    <entry>...</entry>
		    <entry>...</entry>
		    <entry>...</entry>
		    <entry>...</entry>
		  </row>
		  <row>
		    <entry>Group m-1</entry>
		    <entry>0</entry>
		    <entry>0</entry>
		    <entry>...</entry>
		    <entry>1</entry>
		  </row>
		  <row>
		    <entry>Group m</entry>
		    <entry>0</entry>
		    <entry>0</entry>
		    <entry>...</entry>
		    <entry>0</entry>
		  </row>
		</tbody>
	      </tgroup>
	    </table>
    	  </para>
	  <para id="codificap">
	    Con questa codifica la matrice <m:math><m:apply>
		      <m:times/>
		      <m:apply>
			<m:power/>
			<m:ci type="matrix">X</m:ci>
			<m:mtext>'</m:mtext>
		      </m:apply>
		      <m:ci type="matrix">X</m:ci>
		    </m:apply>
	    </m:math>
	    risulta invertibile. Ci sono <m:math>
	      <m:apply>
		<m:minus/>
		<m:ci>m</m:ci>
		<m:cn>1</m:cn>
	      </m:apply>
	    </m:math> gradi di libertà. 
	  </para>
	  <para id="fanovap">
	    Il test si effettua sulla statistica
	    <equation id="ftesteqanova">
	      <m:math>
		<m:apply>
		  <m:eq/>
		  <m:ci>F</m:ci>
		  <m:apply>
		    <m:apply>
		      <m:divide/>
		      <m:ci>between-groups   mean-square   variance</m:ci>
		      <m:ci>within-groups   mean-square   variance</m:ci>
		    </m:apply>
		  </m:apply>
		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:divide/>
			<m:ci>SSA</m:ci>
			<m:apply>
			  <m:minus/>
			  <m:ci>m</m:ci>
			  <m:mn>1</m:mn>
			</m:apply>
		    </m:apply>
		    <m:apply>
		      <m:divide/>
			<m:ci>SSE</m:ci>
			<m:apply>
			  <m:times/>
			    <m:ci>m</m:ci>
			    <m:apply>
			      <m:minus/>
			      <m:ci>n</m:ci>
			      <m:mn>1</m:mn>
			    </m:apply>
			</m:apply>
		    </m:apply>

		    <m:ci>SSE</m:ci>
		  </m:apply>
		  <m:apply>
		    <m:divide/>
		    <m:apply>
		      <m:times/>
		      <m:apply>
			<m:divide/>
			<m:ci>n</m:ci>
			<m:apply>
			  <m:minus/>
			  <m:ci>m</m:ci>
			  <m:mn>1</m:mn>
			</m:apply>
		      </m:apply>
		      <m:apply>
			<m:sum/>
			<m:bvar>
			  <m:ci>i</m:ci>
			</m:bvar>
			<m:lowlimit>
			  <m:cn>1</m:cn>
			</m:lowlimit>
			<m:uplimit>
			  <m:ci>m</m:ci>
			</m:uplimit>
			<m:apply>
			  <m:power/>
			  <m:apply>
			    <m:minus/>
			    <m:msub>
			      <m:mover accent="true">
				<m:mi>y</m:mi>
				<m:mi>_</m:mi>
			      </m:mover>
			      <m:ci>i</m:ci>
			    </m:msub>
			    <m:mover accent="true">
			      <m:mi>y</m:mi>
			      <m:mi>_</m:mi>
			    </m:mover>
			  </m:apply>
			  <m:cn>2</m:cn>
			</m:apply>
		      </m:apply>
		    </m:apply>
		    <m:apply>
		      <m:times/>
		      <m:apply>
			<m:divide/>
			<m:ci>1</m:ci>
			<m:apply>
			  <m:times/>
			  <m:ci>m</m:ci>
			  <m:apply>
			    <m:minus/>
			    <m:ci>n</m:ci>
			    <m:mn>1</m:mn>
			  </m:apply>
			</m:apply>
		      </m:apply>
		      <m:apply>
			<m:sum/>
			<m:bvar>
			  <m:ci>i</m:ci>
			</m:bvar>
			<m:lowlimit>
			  <m:cn>1</m:cn>
			</m:lowlimit>
			<m:uplimit>
			  <m:ci>m</m:ci>
			</m:uplimit>
			<m:apply>
			  <m:sum/>
			  <m:bvar>
			    <m:ci>j</m:ci>
			  </m:bvar>
			  <m:lowlimit>
			    <m:cn>1</m:cn>
			  </m:lowlimit>
			  <m:uplimit>
			    <m:msub>
			      <m:mi>n</m:mi>
			      <m:mi>i</m:mi>
			    </m:msub>
			  </m:uplimit>
			  <m:apply>
			    <m:power/>
			    <m:apply>
			      <m:minus/>
			      <m:msub>
				<m:mi>y</m:mi>
				<m:mi>i,j</m:mi>
			      </m:msub>
			      <m:msub>
				<m:mover accent="true">
				  <m:mi>y</m:mi>
				  <m:mi>_</m:mi>
				</m:mover>
				<m:ci>i</m:ci>
			      </m:msub>
			    </m:apply>
			    <m:cn>2</m:cn>
			  </m:apply>
			</m:apply>
		      </m:apply>
		    </m:apply>
		  </m:apply>
		</m:apply>
	      </m:math>
	    </equation> 
	    il cui valore si confronta con il valore tabulato di <m:math>
	      <m:msub>
		<m:mi>F</m:mi>
		<m:mn>m-1, n-m</m:mn>
	      </m:msub>
	    </m:math> per un dato valore di significatività <m:math>
	      <m:ci>α</m:ci> </m:math>.  Se <m:math>
	      <m:ci>F</m:ci> </m:math> è circa <m:math> <m:cn>1</m:cn>
	      </m:math>, ciò significa che le differenze tra le medie
	      dei gruppi sono casuali. Invece, se <m:math>
	      <m:ci>F</m:ci> </m:math> è significativamente maggiore
	      di <m:math> <m:cn>1</m:cn> </m:math> significa che c'è
	      più variazione tra che entro i gruppi, e quindi il
	      raggruppamento gioca un ruolo significativo. Se la
	      one-way ANOVA ha solo due livelli, essa equivale ad un
	      t-test. <m:math><m:ci>SSA</m:ci></m:math> è la
	      cosiddetta somma dei quadrati di trattamento, e
	      corrisponde alla <m:math><m:ci>SSR</m:ci></m:math> già
	      definita per la regressione con variabili quantitative.
	  </para>
	  <example id="onewayanovaex">
	    <para id="onewayexp1">
	    Si misuri mediante un test il profitto di tre gruppi di
	    studenti precedentemente sottoposti a tre programmi di
	    addestramento. Si intende verificare se il tipo di
	    addestramento è ininfluente sul risultato del test.
	    </para>
	    <para id="onewayexRp">
	      In <code>R</code> l'ANOVA si esegue nel seguente modo:
	      <code type="block">
		<![CDATA[
		> test <- c(9, 16, 12, 10,  8, 14,  8, 11,  7,  9, 20, 19, 14, 17, 12)
		> addestramento <- c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B", 
		+ "C", "C", "C", "C", "C")
		> summary(aov(test~factor(addestramento)))
		                      Df  Sum Sq Mean Sq F value  Pr(>F)  
		factor(addestramento)  2 123.600  61.800  6.3931 0.01288 *
		Residuals             12 116.000   9.667                  
		---
		Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
	      ]]>
	      </code>
	      mentre in <code>Octave</code> la stessa analisi si svolge con
	      <code type="block">
		<![CDATA[
		octave> y1 = [9 16 12 10  8 14  8 11  7  9 20 19 14 17 12];
		octave> g = [1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3];
		octave> anova(y1, g)
		
		One-way ANOVA Table:
		
		Source of Variation   Sum of Squares    df  Empirical Var
		*********************************************************
		Between Groups              123.6000     2        61.8000
		Within Groups               116.0000    12         9.6667
		---------------------------------------------------------
		Total                       239.6000    14
		
		Test Statistic f              6.3931
		p-value                       0.0129
		
		ans = 0.012877
		]]>
	      </code>
	      Per un valore di significatività a <m:math>
		<m:cn>0.05</m:cn> </m:math> è ragionevole rigettare
		l'ipotesi nulla e quindi stabilire un effetto del tipo
		di addestramento.
	    </para>
	  </example>
	  <para id="pairedcompanova">
	    Nell'analisi ANOVA l'ipotesi nulla <m:math> <m:ci>
	    <m:msub> <m:mi>H</m:mi> <m:mn>0</m:mn> </m:msub></m:ci>
	    </m:math> è che non esistano differenze statisticamente
	    significative tra i gruppi corrispondenti alle variabili
	    indipendenti. Se <m:math> <m:ci> <m:msub> <m:mi>H</m:mi>
	    <m:mn>0</m:mn> </m:msub></m:ci> </m:math> viene rifiutata,
	    tuttavia, si può procedere con una comparazione a coppie
	    per vedere quali coppie di gruppi sono significativamente
	    differenti. Bisogna fare attenzione, però, che il livello
	    di significatività  α scelto in queste comparazioni
	    deve diminuire con il numero delle stesse. Infatti,
	    supponendo di fare un t-test con <m:math><m:apply><m:eq/><m:ci>
	    α</m:ci><m:mn>0.05</m:mn></m:apply></m:math> su 100
	    coppie, si ottiene che mediamente 5 di questi confronti
	    sono affetti da errore del I tipo. La probabilità di
	    commettere almeno un errore del I tipo nei 100 confronti è

	    <m:math>
	      <m:apply>
	      <m:eq/>
		<m:apply>
		<m:minus/>
		  <m:mn>1</m:mn>
		  <m:apply>
		  <m:power/>
		    <m:apply>
		    <m:minus/><m:mn>1</m:mn><m:ci> α</m:ci>
		    </m:apply>
		    <m:mn>100</m:mn>
		  </m:apply>
		</m:apply>
		<m:mn>0.994</m:mn>
	      </m:apply>
	    </m:math>
	    La correzione di Bonferroni prevede che il livello α
	    per <m:math><m:ci>n</m:ci></m:math> test multipli debba
	    essere diviso per <m:math><m:ci>n</m:ci></m:math>.
	  </para>
	</section>

      </section>
    </section>
  </content>

<bib:file>
<bib:entry id="caudek">
<bib:book>
<bib:author>C. Caudek and R. Luccio</bib:author> <bib:title>Statistica
per Psicologi</bib:title> <bib:publisher>Editori
Laterza</bib:publisher> <bib:year>2001</bib:year>
</bib:book>
</bib:entry>

<bib:entry id="crawley">
<bib:book>
<bib:author>M. J. Crawley</bib:author> <bib:title>Statistics: an Introduction using R</bib:title> <bib:publisher>Wiley</bib:publisher> <bib:year>2005</bib:year>
</bib:book>
</bib:entry>
</bib:file>

</document>
