Elementi di statistica inferenziale per la decisione clinica e sanitaria.
Campione e popolazione. Test statistici parametrici e non parametrici applicati a dati biomedici. Test diagnostico-decisionali.
Distribuzioni di probabilità, semplici e condizionate, monovariate e multivariate, congiunte e marginali. Affidabilità dei sistemi sanitari, in serie e in parallelo. Disuguaglianza di Chebyshev.
Modelli a compartimenti di sistemi biomedici e sanitari. Schema a blocchi. Coefficienti frazionali di trasferimento. Equazioni di stato e di uscita. Esempi di modelli a compartimenti in ambiente biomedico e sanitario: farmacocinetica; diffusione cellulare; flusso di pazienti ospedalieri.
Metodi di classificazione per la decisione in ambito clinico e sanitario. Cluster Analysis, Pattern Recognition e Machine learning. Metodi di cluster analysis con e senza supervisore. La classificazione. Misure di distanza e similarità tra pattern. Tecniche non supervisionate di cluster analysis, gerarchiche e non gerarchiche. Metodi agglomerativi, divisivi e di partizione. Approccio probabilistico alle decisioni sanitarie. Richiami di teoria delle probabilità. Probabilità condizionata. Teorema di bayes. Il problema diagnostico-decisionale in ambito clinico-sanitario. Eventi sanitari, favorevoli e sfavorevoli. Classificatori supervisionati. Discriminazione e calibrazione. La sventura della dimensionalità. Inferenza statistica e generalizzazione. Standardizzazione e pre-processing. Classificatori probabilistici e non probabilistici, bayesiani e non bayesiani. Classificatori a punteggio intero.
Controllo della generalizzazione. Riduzione della dimensionalità. Scelta ottima delle informazioni (feature extraction). Karhunen-loeve expansion. Componenti principali. Metodo di Fukunaga-Koontz. Algoritmi stepwise. Learning e testing set. Bias e varianza. Fitting, underfitting e overfitting. Tecniche di cross-validation: k-fold e leave-one-out. Tecniche di regolarizzazione: early stopping, penalità sull’errore, insiemi di classificatori.
Valutazione delle prestazioni e scelta del classificatore ottimo. Errore medio, quadratico e probabilistico. Divergenza di kullback-leibler. Curva ROC e area sottostante. metodi statistici di validazione-incrociata. Cenni al criterio di Akaike alla dimensione di Vapnik-Chervonenkis e alla minimum description length.
Classificatore bayesiano. Valutazione del rischio clinico e sanitario. Regioni di decisione. Misclassificazione. Funzioni discriminanti. Minimizzazione del rischio. Costo della decisione. Soglia di rifiuto. Stima delle densità di probabilità condizionate alle classi: metodi parametrici e non parametrici. Modelli gaussiani: classificatori lineari, quadratici e naive; iperellissoide di confidenza. Proprietà della distribuzione gaussiana multivariata. Metodi parametrici di stima della densità di probabilità: massima verosimiglianza; inferenza bayesiana; metodi sequenziali; cenni alle catene di Markov. Metodi non parametrici: istogrammi; kernel e k-nearest-neighbours. Classificatori k-nearest-neighbours. Sintonizzazione dei parametri di progetto/smussamento. Entropia e divergenza. Metodi bootstrap per la stima degli intervalli di confidenza dei parametri.
Classificatore logistico. Rischio relativo e odds ratio. Stima del rischio sanitario individuale. Likelihood ratio. Calibrazione: test di Hosmer-Lemeshow.
Analisi della sopravvivenza.
Cenni sui classificatori a reti neurali artificiali: addestramento, generalizzazione e stima dei parametri. Cenni agli algoritmi genetici.
Classificatori a punteggio intero e loro impiego clinico-sanitario.
Laboratorio informatico teorico-pratico. Progetto di modelli, sistemi e processi gestionali per applicazioni cliniche e sanitarie. Implementazione in Matlab.