Scopo del corso è fornire agli studenti gli strumenti statistici, matematici e informatici necessari per raccogliere e analizzare dati sperimentali, sintetizzare le informazioni che essi contengono, effettuare confronti e previsioni (inferenza) valutando il rischio di errore.
Le esercitazioni prendono in esame fenomeni di interesse biologico anche prendendo spunto dalla realtà quotidiana.
Le lezioni teoriche (6 cfu) e le esercitazioni pratiche (3 cfu) descrivono:
- i principali strumenti di sintesi statistica: indici, tabelle di frequenza, istogrammi, grafici a disersione (x,y).
- i principi statistici che governano le osservazioni sperimentali e che determinano le incertezze associate alle misure e al trattamento dei dati.
- le nozioni di base sul calcolo delle probabilità e sulle funzioni di distribuzione modello: binomiale, poisson, uniforme, gauss.
- l’impiego dei "test di reiezione delle ipotesi" come strumento per l'interpretazione e il confronto di risultati sperimentali.
- l’impiego del teorema di bayes, in particolare nei test diagnostici.
Obiettivo del corso e’ fornire le seguenti abilita’:
- utilizzare i metodi della sintesi statistica per sintetizzare le informazioni quantitative contenute in un set di dati sperimentali;
- valutare l’incertezza nelle misure dirette e indirette e stimare un intervallo di confidenza;
- valutare i risultati ottenuti usando test statistici appropriati;
- effettuare previsioni sulle cause di un fenomeno (teorema di bayes) valutandone la probabilità
Le attività prevedono l’uso approfondito di programmi di base (fogli elettronici) per il calcolo statistico e l'elaborazione di dati sperimentali.
Le esercitazioni prendono in esame fenomeni di interesse biologico anche prendendo spunto dalla realtà quotidiana.
Le lezioni teoriche (6 cfu) e le esercitazioni pratiche (3 cfu) descrivono:
- i principali strumenti di sintesi statistica: indici, tabelle di frequenza, istogrammi, grafici a disersione (x,y).
- i principi statistici che governano le osservazioni sperimentali e che determinano le incertezze associate alle misure e al trattamento dei dati.
- le nozioni di base sul calcolo delle probabilità e sulle funzioni di distribuzione modello: binomiale, poisson, uniforme, gauss.
- l’impiego dei "test di reiezione delle ipotesi" come strumento per l'interpretazione e il confronto di risultati sperimentali.
- l’impiego del teorema di bayes, in particolare nei test diagnostici.
Obiettivo del corso e’ fornire le seguenti abilita’:
- utilizzare i metodi della sintesi statistica per sintetizzare le informazioni quantitative contenute in un set di dati sperimentali;
- valutare l’incertezza nelle misure dirette e indirette e stimare un intervallo di confidenza;
- valutare i risultati ottenuti usando test statistici appropriati;
- effettuare previsioni sulle cause di un fenomeno (teorema di bayes) valutandone la probabilità
Le attività prevedono l’uso approfondito di programmi di base (fogli elettronici) per il calcolo statistico e l'elaborazione di dati sperimentali.
scheda docente
materiale didattico
Il corso si propone di fornire allo studente le conoscenze di base (Competenze culturali) e gli strumenti (competenze metodologiche) statistici, matematici e informatici necessari per:
- condurre un esperimento,
- trattare, elaborare e sintetizzare dati sperimentali,
- valutare l'incertezza e intervalli di confidenza dei risultati di un'osservazione,
- valutare i parametri statistici di una popolazione a partire da un campione (inferenza),
- confrontare quantitativamente dati e modelli mediante test di reiezione delle ipotesi.
Programma dettagliato
1. Strumenti di un foglio elettronico (EXCEL, CALC) per la sintesi e la presentazione di dati sperimentali e il calcolo statistico.
0. importare i dati. configurazione del formato dei numeri. Configurazione del PC (lingua, impostazioni di visualizzazione delle estensioni dei files).
a. costruzione di tabelle,
b. funzioni, funzioni in forma di matrice,
c. istogrammi e diagrammi a Barre,
d. grafici a dispersione.
e. funzioni avanzate: tabelle, regressione lineare, strumenti avanzati per l'analisi dei dati.
2. Sintesi statistica:
a. i principali indici statistici per un set di dati anche in forma aggregata,
b. distribuzioni di frequenza per un set di dati,
c. istogrammi di frequenze,
d. presentare la relazione tra grandezze usando grafici a dispersione,
e. valutare la relazione lineare tra grandezze valutandone la correlazione e/o i parametri della regressione lineare.
3. Calcolo delle probabilità:
a. definizioni di probabilità di un evento e simbolismo per il calcolo delle probabilità,
b. eventi dipendenti/indipendenti, compatibili/incompatibili,
c. probabilità di eventi: and, or e probabilità condizionate,
d. teorema di Bayes,
e. distribuzioni di probabilità modello (binomiale, uniforme, Gauss).
4. Valutazione delle incertezze sperimentali
a. l’incertezza su grandezze sperimentali (dati, frequenze degli istogrammi, etc..)
b. incertezze sui parametri di rette di regressione,
c. l’incertezza sulla correlazione lineare
d. valutare le incertezze di misura su grandezze derivate
5. Inferenza statistica
a. Calcolare e interpretare gli intervalli di confidenza per: valori medi, distribuzioni, correlazione lineare, parametri della regressione lineare,
b. test di reiezione delle ipotesi (Z, T, e chi^2),
c. test chi^2 per tabelle di contingenza o distribuzioni,
d. Calcolare un p-value per un test di ipotesi,
e. Costruire e/o interpretare correttamente un test di screening (teorema di Bayes)
IL TESTO È INTEGRATO CON LE NOTE E GLI ESERCIZI DISPONIBILI SULLA PIATTAFORMA MOODLE e SUI SITI WEB:
https://scienze.el.uniroma3.it/course/view.php?id=2352
Programma
Programma dell'insegnamentoIl corso si propone di fornire allo studente le conoscenze di base (Competenze culturali) e gli strumenti (competenze metodologiche) statistici, matematici e informatici necessari per:
- condurre un esperimento,
- trattare, elaborare e sintetizzare dati sperimentali,
- valutare l'incertezza e intervalli di confidenza dei risultati di un'osservazione,
- valutare i parametri statistici di una popolazione a partire da un campione (inferenza),
- confrontare quantitativamente dati e modelli mediante test di reiezione delle ipotesi.
Programma dettagliato
1. Strumenti di un foglio elettronico (EXCEL, CALC) per la sintesi e la presentazione di dati sperimentali e il calcolo statistico.
0. importare i dati. configurazione del formato dei numeri. Configurazione del PC (lingua, impostazioni di visualizzazione delle estensioni dei files).
a. costruzione di tabelle,
b. funzioni, funzioni in forma di matrice,
c. istogrammi e diagrammi a Barre,
d. grafici a dispersione.
e. funzioni avanzate: tabelle, regressione lineare, strumenti avanzati per l'analisi dei dati.
2. Sintesi statistica:
a. i principali indici statistici per un set di dati anche in forma aggregata,
b. distribuzioni di frequenza per un set di dati,
c. istogrammi di frequenze,
d. presentare la relazione tra grandezze usando grafici a dispersione,
e. valutare la relazione lineare tra grandezze valutandone la correlazione e/o i parametri della regressione lineare.
3. Calcolo delle probabilità:
a. definizioni di probabilità di un evento e simbolismo per il calcolo delle probabilità,
b. eventi dipendenti/indipendenti, compatibili/incompatibili,
c. probabilità di eventi: and, or e probabilità condizionate,
d. teorema di Bayes,
e. distribuzioni di probabilità modello (binomiale, uniforme, Gauss).
4. Valutazione delle incertezze sperimentali
a. l’incertezza su grandezze sperimentali (dati, frequenze degli istogrammi, etc..)
b. incertezze sui parametri di rette di regressione,
c. l’incertezza sulla correlazione lineare
d. valutare le incertezze di misura su grandezze derivate
5. Inferenza statistica
a. Calcolare e interpretare gli intervalli di confidenza per: valori medi, distribuzioni, correlazione lineare, parametri della regressione lineare,
b. test di reiezione delle ipotesi (Z, T, e chi^2),
c. test chi^2 per tabelle di contingenza o distribuzioni,
d. Calcolare un p-value per un test di ipotesi,
e. Costruire e/o interpretare correttamente un test di screening (teorema di Bayes)
Testi Adottati
M. C. WHITLOCK, D. SCHLUTER - ANALISI STATISTICA DEI DATI BIOLOGICI, ZANICHELLI.IL TESTO È INTEGRATO CON LE NOTE E GLI ESERCIZI DISPONIBILI SULLA PIATTAFORMA MOODLE e SUI SITI WEB:
https://scienze.el.uniroma3.it/course/view.php?id=2352
Bibliografia Di Riferimento
.Modalità Erogazione
Il corso si svolgerà con lezioni frontali e con esercitazioni pratiche con l'ausilio di PC e di programmi specifici per la sintesi e l'analisi dei dati sperimentali (Excel, Calc, Gnuplot) Le lezioni potranno essere svolte in modalità remota sulle piattaforme TEAMS e MOODLE.Modalità Frequenza
Fatti salvo i casi previsti dai regolamenti di Ateneo, la frequenza al corso è obbligatoria in presenza per gli studenti in corso. Alcune attività sono disponibili solo a che frequenta con regolarità il Corso. Alcune prove di valutazione e appelli potranno essere disponibili solo per gli studenti frequentanti con regolarità. A seguito dell'autorizzazione del Collegio Didattico il docente mete a disposizione lezioni in streaming e registrate per quegli argomenti e procedure più difficili da memorizzare e da seguire (algoritmi, procedure etc...). La frequenza al corso è valutata effettuando appelli a campione, chi non ottiene almeno il 75% delle presenze non è considerato frequentare regolarmente il corso.Modalità Valutazione
La frequenza è obbligatoria, le presenze sono registrate a campione, l'ammissione ad alcuni appelli di esame o test può essere subordinata alla presenza ad almeno 75% delle presenze rilevate. Gli esami consistono in - una prova scritta con QUESITI a risposta multipla (40 quesiti sugli argomenti del Corso) - una prova orale in cui vengono valutate le competenze acquisite durante il corso. Durante il corso sono attivi test di autovalutazione che consentono agli studenti di testare le conoscenze e competenze acquisite. I risultati dei Test di Autovalutazione non concorrono a definire il risultato dell'esame Non sono previste prove di esonero. Divieto di strumenti di Intelligenza Artificiale (IA) e LLM: Durante entrambe le prove (test su Moodle e orale) è vietato l’uso di strumenti di IA, inclusi i Large Language Models (LLM) e qualsiasi assistente che generi o suggerisca risposte (ad es. chatbot, funzioni di “riscrittura/riassunto/spiegazione”, estensioni del browser o app analoghe). Uso non autorizzato e sanzioni L’uso di tali strumenti, anche parziale o tramite dispositivi esterni, è considerato non autorizzato e comporta - l'interruzione immediata della prova - l'esclusione dalla partecipazione alle successive sessioni d’esame fino al semestre successivo. L’uso non autorizzato dei suddetti strumenti può essere accertato anche successivamente mediante strumenti di analisi (inclusi sistemi IA), verifiche software, controllo dei log/flussI di attività e colloqui o prove di riscontro delle competenze.