Weak Law of Large Number
2.3 Paradigma della statistica bayesiana
È generalmente concordato dai suoi sostenitori e critici che il Bayesianismo5 attualmente è la visione dominante nella filosofia della scienza. Alcuni statistici sono andati oltre, congetturando anni fa che le statistiche bayesiane saranno le statistiche dominanti per il ventunesimo secolo. Se questa affermazione può essere motivata è al di là dello scopo di questa introduzione. Tuttavia, è incontestabile che il paradigma bayesiano abbia svolto un ruolo centrale in discipline come la filosofia, la statistica, l’informatica e persino la giurisprudenza.
I bayesiani sono ampiamente divisi in categorie soggettive e oggettive. Secondo tutti i Bayesiani, la credenza di un agente deve soddisfare le regole del calcolo della probabilità. In caso contrario, in conformità con il familiare argomento “Libro olandese”, il grado di convinzione dell’agente è incoerente. I bayesiani soggettivi considerano questa coerenza (probabilistica) sia una condizione necessaria che sufficiente per la razionalità delle credenze di un agente, e quindi (tipicamente) sostengono che le credenze degli agenti razionali convergeranno nel tempo. Il punto di inferenza scientifica, e la fonte della sua “oggettività”, è garantire la coerenza e garantire la convergenza. I bayesiani oggettivi, d’altra parte, in genere insistono sul fatto che mentre la condizione di coerenza è necessaria, non è sufficiente anche per il tipo di obiettività che le metodologie scientifiche intendono rendere possibile.
L’articolo di Paul Weirich in questo volume si concentra principalmente sulla probabilità soggettiva. Weirich ha sviluppato un approccio teorico delle decisioni bayesiane in cui considera come le credenze di un agente possono essere riviste alla luce dei dati. Le probabilità rappresentano il grado di convinzione di un agente. Weirich valuta diverse accuse contro i Bayesiani. Secondo un’obiezione che ha considerato, Bayesianism permette gradi di un agente di credenza di essere qualsiasi cosa fintanto che soddisfano il calcolo della probabilità. Weirich prende l’obiezione di implicare che le probabilità soggettive bayesiane devono rappresentare le credenze idiosincratiche di un agente. Egli ha, tuttavia, respinto permissivo Bayesianism a favore della sua versione del Bayesianism. La nozione di probabilità condizionale su cui poggia il principio di condizionalizzazione è centrale per lui. Secondo questo principio, un agente dovrebbe aggiornare il suo grado di credenza in una ipotesi (H) alla luce dei dati (D) in conformità con il principio di conditionalization, che dice che il suo grado di credenza in H dopo dati è noto, è dato dalla probabilità condizionale P(H|D) = P(H&D)/P(D), supponendo che P(D) non è zero. Weirich valuta anche le accuse mosse contro l’uso del principio di condizionalizzazione. Infine, confronta la teoria delle decisioni statistiche bayesiane con la statistica classica, concludendo il suo lavoro con una valutazione di quest’ultima.
Un’area centrale di ricerca nella filosofia della scienza è la teoria della conferma bayesiana. James Hawthorne prende la teoria della conferma bayesiana per fornire una logica di come le prove distinguano tra ipotesi o teorie concorrenti. Egli sostiene che è fuorviante identificare la teoria della conferma bayesiana con il conto soggettivo della probabilità. Piuttosto, qualsiasi conto che rappresenta il grado in cui un’ipotesi è supportata dall’evidenza come probabilità condizionata dell’ipotesi sull’evidenza, in cui la funzione di probabilità coinvolta soddisfa i soliti assiomi probabilistici, sarà una teoria di conferma bayesiana, indipendentemente dall’interpretazione della nozione di probabilità che impiega. Per, su qualsiasi tale conto teorema di Bayes esprimerà come ciò che le ipotesi dicono sulla prova (attraverso le probabilità) influenza il grado in cui le ipotesi sono supportate da prove (attraverso probabilità posteriori). Hawthorne sostiene che la solita interpretazione soggettiva della funzione di conferma probabilistica è gravemente contestata dalle versioni estese del problema delle vecchie prove. Egli mostra che sulla solita interpretazione soggettivista anche informazioni banali un agente può conoscere una richiesta di prove può minare completamente l’obiettività delle probabilità. Pertanto, nella misura in cui le probabilità dovrebbero essere oggettive (o concordate intersoggettivamente), la funzione di conferma non può sopportare la solita lettura soggettivista. Hawthorne prende probabilità precedenti di dipendere da valutazioni di plausibilità, ma sostiene che tali valutazioni non sono solo soggettive, e che la teoria di conferma bayesiana non è gravemente handicappato dal tipo di soggettività coinvolti in tali valutazioni. Basa quest’ultima affermazione su un potente risultato di convergenza bayesiana, che chiama teorema di convergenza del rapporto di verosimiglianza. Questo teorema dipende solo dalle probabilità, non dalle probabilità precedenti; ed è una legge debole del risultato di grandi numeri che fornisce limiti espliciti sul tasso di convergenza. Dimostra che con l’aumentare delle prove, diventa altamente probabile che i risultati probatori siano tali da far sì che i rapporti di verosimiglianza favoriscano fortemente un’ipotesi vera su ciascun concorrente evidenzialmente distinguibile. Pertanto, due funzioni di conferma (impiegate da agenti diversi) che concordano sulle probabilità ma differiscono sulle probabilità precedenti per le ipotesi (a condizione che il precedente per l’ipotesi vera non sia troppo vicino a 0) tenderanno a produrre rapporti di probabilità che portano le probabilità posteriori a convergere verso 0 per le ipotesi false e verso 1 per la vera alternativa.6
John D. Norton cerca di fornire un contrappeso alla visione ormai dominante che la teoria della conferma bayesiana è riuscita a trovare la logica universale che governa l’evidenza e il suo cuscinetto induttivo nella scienza. Permette che i bayesiani abbiano buone ragioni per essere ottimisti. Dove molti altri hanno fallito, il loro sistema riesce a specificare un calcolo preciso, a spiegare i principi induttivi di altri conti e a combinarli in un’unica teoria coerente. Tuttavia, esorta, il suo dominio è sorto solo di recente nei secoli della teorizzazione bayesiana e potrebbe non durare data la persistenza dei problemi che deve affrontare.
Molti dei problemi che Norton identifica per la teoria della conferma bayesiana riguardano aspetti tecnici che i nostri lettori potrebbero trovare più o meno preoccupanti. A suo avviso, la sfida più seria deriva dall’aspirazione bayesiana di fornire un resoconto completo dell’inferenza induttiva che ricalca il nostro ragionamento induttivo a uno stato iniziale, neutro, prima dell’incorporazione di qualsiasi prova. Ciò che sconfigge questa aspirazione, secondo Norton, è il ben noto, recalcitrante problema dei priori, raccontato in due forme nel suo capitolo. In una forma, il problema è che il P posteriore (H / D&B), che esprime il supporto induttivo dei dati D per l’ipotesi H in combinazione con le informazioni di base B, è fissato completamente dalle due probabilità “precedenti”, P(H&D|B) e P(D|B). Se uno è un soggettivista e sostiene che le probabilità precedenti possono essere selezionate a capriccio, soggetto solo agli assiomi del calcolo della probabilità, allora, secondo Norton, il P posteriore(H|D&B) non può mai essere liberato da quei capricci. O se uno è un oggettivista e sostiene che ci può essere un solo corretto prima in ogni situazione specifica, poi, come spiegato nel suo capitolo, l’additività di una misura di probabilità preclude una assegnazione veramente “informationless priori.”Questo è per il meglio, secondo Norton, dal momento che un priore veramente privo di informazioni assegnerebbe lo stesso valore a ogni proposizione contingente nell’algebra. La dipendenza funzionale di un posteriore sui priori costringerebbe quindi tutti i posteriori non banali a un singolo valore senza informazioni. Quindi, un account bayesiano può essere non banale, sostiene Norton, solo se inizia con una ricca distribuzione di probabilità precedente il cui contenuto induttivo è fornito da altri mezzi non bayesiani.
Tre articoli del volume esplorano la possibilità che l’account bayesiano possa essere mostrato come una forma di logica. Colin Howson sostiene che il bayesianismo è una forma di logica deduttiva di inferenza, mentre Roberto Festa e Jan-Willem Romeijn sostengono che la teoria bayesiana può essere lanciata sotto forma di inferenza induttiva. Per indagare se l’account bayesiano può essere considerato come una forma di inferenza deduttiva, Howson esamina brevemente gli ultimi trecento anni di inferenza scientifica e poi si concentra sul perché pensa che l’inferenza bayesiana dovrebbe essere considerata una forma di pura logica di inferenza. Prendendo in considerazione il dibattito sul fatto inferenza probabilistica può essere considerato come logica di coerenza o coerenza, discute de Finetti teoria della probabilità in cui de Finetti ha preso la teoria della probabilità per non dire nulla sul mondo, ma lo prende come una “logica di incertezza.”Una ragione motivante per considerare perché l’inferenza bayesiana dovrebbe essere presa come una logica di pura logica è notare il suo disaccordo con la distinzione di Kyburg tra l’espressione” coerenza “da applicare a un sistema che non contiene due credenze incoerenti e l’espressione” coerenza” da applicare ai gradi di credenza. Per Howson, l’analogia con la logica deduttiva è tra quest’ultima che impone vincoli di coerenza sulle valutazioni della verità e le regole della teoria della probabilità che impongono vincoli nel grado di credenza. Il resto del suo lavoro è dedicato allo sviluppo e all’interpretazione dell’inferenza bayesiana come forma di pura logica di inferenza.
Sia Festa che Romeijn si rammaricano che nel secolo scorso le statistiche e l’inferenza induttiva si siano sviluppate e fiorite più o meno indipendentemente l’una dall’altra, senza chiari segni di simbiosi. Festa ingrandisce le statistiche bayesiane e la teoria delle probabilità induttive di Carnap, e mostra che, nonostante le loro diverse basi concettuali, i metodi elaborati all’interno di quest’ultimo sono essenzialmente identici a quelli utilizzati all’interno del primo. Sostiene che alcuni concetti e metodi della logica induttiva possono essere applicati nella ricostruzione razionale di diverse nozioni e procedure statistiche. Secondo lui, la logica induttiva suggerisce alcuni nuovi metodi che possono essere utilizzati per diversi tipi di inferenza statistica che coinvolgono considerazioni analogiche. Infine, Festa mostra come una versione bayesiana di approssimazione verità può essere sviluppato e integrato in un quadro statistico.7
Romeijn indaga anche la relazione tra statistica e logica induttiva. Anche se la logica induttiva e le statistiche si sono sviluppate separatamente, Romeijn pensa, come Festa, che sia tempo di esplorare l’interrelazione tra i due. Nel suo lavoro, indaga se sia possibile rappresentare vari modi di inferenza statistica in termini di logica induttiva. Romeijn considera tre idee chiave nelle statistiche per forgiare il collegamento. Sono (i) Neyman-Pearson hypothesis testing (NPTH), (ii) stima della massima verosimiglianza e (iii) statistica bayesiana. Romeijn mostra, usando sia la logica induttiva carnapiana che quella bayesiana, che l’ultima di due di queste idee (cioè, stima della massima verosimiglianza e statistica bayesiana) può essere rappresentata naturalmente in termini di una logica induttiva non amplificativa. Nella sezione finale del suo capitolo, NPTH è unito alla logica induttiva bayesiana per mezzo di probabilità basate sull’intervallo rispetto alle ipotesi statistiche.
Poiché ci sono Bayesiani soggettivi, quindi ci sono Bayesiani oggettivi. José Bernardo è uno di loro. Poiché molti filosofi non sono generalmente consapevoli del lavoro di Bernardo, dedicheremo una discussione relativamente più lunga ad esso. Bernardo scrive che “t è diventata pratica standard,…, per descrivere come ‘oggettiva’ qualsiasi analisi statistica che dipende solo dal modello assunto. In questo preciso senso (e solo in questo senso) l’analisi di riferimento è un metodo per produrre inferenza bayesiana ‘oggettiva’”.
Per Bernardo, l’analisi di riferimento che ha sostenuto per promuovere il suo marchio di Bayesianismo oggettivo dovrebbe essere intesa in termini di qualche modello parametrico della forma M {{P(x / w),x X X,w Ω Ω}, che descrive le condizioni in cui i dati sono stati generati. Qui, si presume che i dati x consistano in un’osservazione del processo casuale x X X con distribuzione di probabilità P (x|w) per alcuni w Ω Ω. Un modello parametrico è un’istanza di un modello statistico. Bernardo definisce θ = θ ( w) Θ Θ come un vettore di interesse. Tutte le inferenze bayesiane legittime sul valore θ sono catturate nella sua distribuzione posteriore P (θ / x)∫ ∫ ΛP(x|θ,λ)P(θ,λ) dλ a condizione che queste inferenze siano fatte sotto un modello assunto. Qui, λ è un vettore di parametri di fastidio ed è spesso indicato come” modello ” P(x|λ).
L’attrazione di questo tipo di oggettivismo è la sua enfasi sulla “analisi di riferimento”, che con l’aiuto di strumenti statistici ha fatto ulteriori progressi nel trasformare il suo tema dell’oggettività in una scuola statistica rispettabile all’interno del bayesianesimo. Come scrive Bernardo, ” l’analisi eference può essere descritta come un metodo per derivare posteriori non soggettivi basati su modelli, basati sulle idee teoriche dell’informazione e destinati a descrivere il contenuto inferenziale dei dati per la comunicazione scientifica” . Qui con il” contenuto inferenziale dei dati “intende che il primo fornisce” la base per un metodo per derivare posteriori non soggettivi” (Ibid). Obiettivo di Bernardo Bayesianism consiste nelle seguenti affermazioni.
In primo luogo, pensa che le informazioni di base dell’agente dovrebbero aiutare l’investigatore a costruire un modello statistico, quindi in ultima analisi influenza che prima quest’ultimo dovrebbe assegnare al modello. Pertanto, anche se Bernardo potrebbe approvare l’arrivo di un valore di probabilità unico come obiettivo, non richiede che abbiamo bisogno di avere l’assegnazione di probabilità unica in tutte le questioni a nostra disposizione. Egli scrive, ” egli analista dovrebbe avere un unico (spesso soggettivo) prima p (w), indipendentemente dal progetto dell’esperimento, ma la comunità scientifica presumibilmente sarà interessato a confrontare posteriore personale dell’analista corrispondente con il riferimento (consenso) posteriore associato al progetto sperimentale pubblicato.” . In secondo luogo, per Bernardo, l’inferenza statistica non è altro che un caso di decisione tra vari modelli/teorie, dove la decisione include, tra le altre cose, l’utilità di agire sull’assunzione che il modello/teoria sia empiricamente adeguato. Qui, l’utilità di agire sull’adeguatezza empirica del modello/teoria in questione potrebbe comportare una funzione di perdita . Nel suo capitolo per questo volume, ha sviluppato la sua versione del bayesianismo oggettivo e ha affrontato diverse accuse sollevate contro il suo account.
Nel loro capitolo congiunto, Gregory Wheeler e Jon Williamson hanno combinato il bayesianismo oggettivo con la teoria probatoria di Kyburg. Questa posizione di Bayesianism o qualsiasi forma di Bayesianism sembra in contrasto con l’approccio di Kyburg alla inferenza statistica che si basa sulla sua teoria probatoria della probabilità. Considereremo l’unico argomento di Kyburg contro il bayesianesimo. Kyburg pensa che non dovremmo considerare le credenze parziali come “gradi di credenza” perché i (severi) Bayesiani (come Savage) sono associati all’assunzione di una probabilità unica di una proposizione. Ha discusso la probabilità basata sull’intervallo come catturare le nostre convinzioni parziali sull’incertezza. Poiché la probabilità basata sull’intervallo non è bayesiana, ne consegue che non ci è permesso trattare le credenze parziali come gradi di credenza. Data questa opposizione tra la visione di Kyburg sulla probabilità e la visione bayesiana oggettiva, Wheeler e Williamson hanno cercato di mostrare come le idee fondamentali di entrambi questi due punti di vista potrebbero essere soddisfatte fruttuosamente all’interno di un unico account di inferenza scientifica.
Per concludere la nostra discussione sulla posizione bayesiana tenendo presente l’attribuzione di Royall della questione delle credenze ai Bayesiani, molti Bayesiani avrebbero sentimenti contrastanti su questa attribuzione. In una certa misura alcuni di loro potrebbero considerarlo inappropriatamente semplice. Howson sarebbe d’accordo con questa attribuzione con l’osservazione che questo mancherebbe alcune delle sfumature e sottigliezze della teoria bayesiana. Segue ampiamente la linea di de Finetti nel prendere valutazioni soggettive di probabilità. Queste valutazioni sono di solito chiamati ” gradi di fede.”Quindi, in quella misura egli certezza pensa che ci sia un ruolo centrale per gradi di fede, dal momento che dopo tutto sono ciò che viene indicato direttamente dalla funzione di probabilità. Pertanto, secondo lui, l’attribuzione della domanda di credenza ai bayesiani ha un senso. Tuttavia, egli pensa che il corpo principale della teoria bayesiana consiste nell’identificare i vincoli che dovrebbero essere imposti a questi per garantire la loro coerenza/coerenza. Il suo documento ha fornito quel quadro per Bayesianism. Hawthorne potrebbe parzialmente non essere d’accordo con Royall poiché il suo teorema di convergenza del rapporto di verosimiglianza mostra che come diversi agenti potrebbero essere d’accordo alla fine anche se potrebbero benissimo iniziare con vari gradi di credenza in una teoria. Sia Weirich e Norton, anche se appartengono a campi opposti nella misura in cui le loro posizioni verso Bayesianism sono interessati, potrebbe essere d’accordo che l’attribuzione di Royall a Bayesians è, dopo tutto, giustificata. Per quanto riguarda la domanda di previsione, molti Bayesiani, compresi quelli che lavorano entro i confini della teoria della conferma, sostengono che un account di conferma che risponde alla domanda di credenza è in grado di gestire la domanda di previsione in quanto, per Bayesiani, quest’ultimo è una sottoclasse della domanda di credenza.