Ley Débil de Gran Número

2.3 Paradigma de la estadística bayesiana

En general, sus partidarios y críticos coinciden en que el bayesianismo 5 es actualmente la visión dominante en la filosofía de la ciencia. Algunos estadísticos han ido más lejos, conjeturando hace años que las estadísticas bayesianas serán las estadísticas dominantes para el siglo XXI. El hecho de que esta alegación pueda fundamentarse rebasa el ámbito de aplicación de la presente introducción. Sin embargo, es indiscutible que el paradigma bayesiano ha estado desempeñando un papel central en disciplinas como la filosofía, la estadística, la informática e incluso la jurisprudencia.

Los bayesianos se dividen ampliamente en categorías subjetivas y objetivas. Según todos los bayesianos, la creencia de un agente debe satisfacer las reglas del cálculo de probabilidad. De lo contrario, de acuerdo con el conocido argumento del «Libro Holandés», el grado de creencia del agente es incoherente. Los bayesianos subjetivos toman esta coherencia (probabilística) como una condición necesaria y suficiente para la racionalidad de las creencias de un agente, y luego (típicamente) argumentan que las creencias de los agentes racionales convergerán con el tiempo. El objetivo de la inferencia científica, y la fuente de su «objetividad», es garantizar la coherencia y asegurar la convergencia. Los bayesianos objetivos, por otro lado, suelen insistir en que, si bien la condición de coherencia es necesaria, tampoco es suficiente para el tipo de objetividad que las metodologías científicas pretenden hacer posible.

El artículo de Paul Weirich en este volumen se centra principalmente en la probabilidad subjetiva. Weirich ha desarrollado un enfoque teórico de decisión bayesiano donde considera cómo las creencias de un agente pueden revisarse a la luz de los datos. Las probabilidades representan el grado de creencia de un agente. Weirich evalúa varios cargos contra bayesianos. Según una objeción que ha considerado, el bayesianismo permite que los grados de creencia de un agente sean cualquier cosa, siempre y cuando satisfagan el cálculo de probabilidad. Weirich considera que la objeción implica que las probabilidades subjetivas bayesianas deben representar las creencias idiosincrásicas de un agente. Sin embargo, ha rechazado el bayesianismo permisivo a favor de su versión del bayesianismo. La noción de probabilidad condicional en la que se basa el principio de condicionalización es central para él. De acuerdo con este principio, un agente debe actualizar su grado de creencia en una hipótesis (H) a la luz de los datos (D) de acuerdo con el principio de condicionalización, que dice que su grado de creencia en H después de que se conozcan los datos está dado por la probabilidad condicional P(H|D) = P(H&D)/P(D), suponiendo que P(D) no es cero. Weirich también evalúa los cargos presentados contra el uso del principio de condicionalización. Finalmente, compara la teoría de la decisión estadística bayesiana con la estadística clásica, concluyendo su artículo con una evaluación de esta última.

Un área central de investigación en la filosofía de la ciencia es la teoría de confirmación bayesiana. James Hawthorne toma la teoría de la confirmación bayesiana para proporcionar una lógica de cómo la evidencia se distingue entre hipótesis o teorías competidoras. Argumenta que es engañoso identificar la teoría de la confirmación bayesiana con el relato subjetivo de la probabilidad. Más bien, cualquier relato que represente el grado en que una hipótesis está apoyada por la evidencia como una probabilidad condicional de la hipótesis en la evidencia, donde la función de probabilidad involucrada satisface los axiomas probabilísticos habituales, será una teoría de confirmación bayesiana, independientemente de la interpretación de la noción de probabilidad que emplea. En cualquier caso, el teorema de Bayes expresará cómo lo que dicen las hipótesis sobre la evidencia (a través de las probabilidades) influye en el grado en que las hipótesis están respaldadas por la evidencia (a través de probabilidades posteriores). Hawthorne argumenta que la interpretación subjetiva habitual de la función probabilística de confirmación es severamente cuestionada por versiones extendidas del problema de la evidencia antigua. Muestra que en la interpretación subjetivista habitual, incluso la información trivial que un agente puede aprender sobre una afirmación de evidencia puede socavar completamente la objetividad de las probabilidades. Así, en la medida en que se supone que las probabilidades son objetivas (o intersubjetivamente acordadas), la función de confirmación no puede soportar la lectura subjetivista habitual. Hawthorne considera que las probabilidades previas dependen de evaluaciones de plausibilidad, pero argumenta que tales evaluaciones no son meramente subjetivas, y que la teoría de confirmación bayesiana no está gravemente perjudicada por el tipo de subjetividad involucrada en tales evaluaciones. Basa esta última afirmación en un poderoso resultado de convergencia bayesiano, al que llama teorema de convergencia de razón de verosimilitud. Este teorema depende solo de probabilidades, no de probabilidades anteriores; y es una ley débil del resultado de grandes números que proporciona límites explícitos a la tasa de convergencia. Muestra que a medida que aumenta la evidencia, es muy probable que los resultados probatorios sean tales que los ratios de verosimilitud favorezcan fuertemente una hipótesis verdadera sobre cada competidor que se distinga de manera evidente. Por lo tanto, dos funciones de confirmación cualesquiera (empleadas por agentes diferentes) que están de acuerdo en probabilidades pero difieren en probabilidades previas para hipótesis (siempre que el anterior para la hipótesis verdadera no esté demasiado cerca de 0) tenderán a producir ratios de verosimilitud que hacen que las probabilidades posteriores converjan hacia 0 para hipótesis falsas y hacia 1 para la alternativa verdadera.6

John D. Norton busca proporcionar un contrapeso a la visión ahora dominante de que la teoría de confirmación bayesiana ha tenido éxito en encontrar la lógica universal que gobierna la evidencia y su influencia inductiva en la ciencia. Permite que los bayesianos tengan buenas razones para ser optimistas. Donde muchos otros han fallado, su sistema tiene éxito en especificar un cálculo preciso, en explicar los principios inductivos de otras cuentas y en combinarlos en una sola teoría consistente. Sin embargo, insta, su dominio surgió solo recientemente en los siglos de teorización bayesiana y puede no durar dada la persistencia de los problemas que enfrenta.

Muchos de los problemas que Norton identifica para la teoría de la confirmación bayesiana se refieren a aspectos técnicos que nuestros lectores pueden encontrar más o menos preocupantes. En su opinión, el desafío más grave se deriva de la aspiración bayesiana de proporcionar un relato completo de la inferencia inductiva que remonta nuestro razonamiento inductivo a un estado inicial, neutral, antes de la incorporación de cualquier evidencia. Lo que derrota esta aspiración, según Norton, es el conocido y recalcitrante problema de los priores, relatado en dos formas en su capítulo. En una forma, el problema es que la P posterior (H|D& B), que expresa el soporte inductivo de los datos D para la hipótesis H junto con la información de fondo B, se fija completamente por las dos probabilidades «anteriores», P(H&D|B) y P(D|B). Si uno es subjetivista y sostiene que las probabilidades anteriores pueden seleccionarse a su antojo, sujeto solo a los axiomas del cálculo de probabilidad, entonces, según Norton, el P posterior(H|D&B) nunca puede liberarse de esos caprichos. O si uno es objetivista y sostiene que solo puede haber un previo correcto en cada situación específica, entonces, como se explica en su capítulo, la aditividad de una medida de probabilidad impide que uno asigne «antecedentes sin información».»Eso es para mejor, según Norton, ya que un prior verdaderamente sin información asignaría el mismo valor a cada proposición contingente en el álgebra. La dependencia funcional de una parte posterior de los antecedentes forzaría a todos los posteriors no triviales a un único valor sin información. Por lo tanto, una cuenta bayesiana puede ser no trivial, sostiene Norton, solo si comienza con una rica distribución de probabilidad previa cuyo contenido inductivo es proporcionado por otros medios no bayesianos.

Tres artículos en el volumen exploran la posibilidad de que la cuenta bayesiana pueda mostrarse como una forma de lógica. Colin Howson sostiene que el bayesianismo es una forma de lógica deductiva de inferencia, mientras que Roberto Festa y Jan-Willem Romeijn sostienen que la teoría bayesiana puede fundirse en la forma de inferencia inductiva. Para investigar si el relato bayesiano puede considerarse como una forma de inferencia deductiva, Howson examina brevemente los últimos trescientos años de inferencia científica y luego se centra en por qué piensa que la inferencia bayesiana debe considerarse una forma de lógica pura de inferencia. Teniendo en cuenta el debate sobre si la inferencia probabilística puede ser considerada como lógica de consistencia o coherencia, discute la teoría de la probabilidad de de Finetti, donde de Finetti tomó la teoría de la probabilidad para no decir nada sobre el mundo, pero la toma como una «lógica de incertidumbre».»Una razón motivadora para considerar por qué la inferencia bayesiana debe tomarse como una lógica de lógica pura es notar su desacuerdo con la distinción de Kyburg entre la expresión «consistencia» para ser aplicable a un sistema que no contiene dos creencias inconsistentes y la expresión «coherencia» para ser aplicable a grados de creencia. Para Howson, la analogía con la lógica deductiva es entre la última que impone restricciones de consistencia en las evaluaciones de la verdad y las reglas de la teoría de la probabilidad que imponen restricciones en el grado de creencia. El resto de su artículo está dedicado al desarrollo e interpretación de la inferencia bayesiana como una forma de lógica pura de inferencia.

Tanto Festa como Romeijn lamentan que en el siglo pasado las estadísticas y la inferencia inductiva se hayan desarrollado y florecido de forma más o menos independiente la una de la otra, sin signos claros de simbiosis. Festa se acerca a la estadística bayesiana y a la teoría de probabilidades inductivas de Carnap, y muestra que a pesar de sus diferentes bases conceptuales, los métodos elaborados dentro de esta última son esencialmente idénticos a los utilizados dentro de la primera. Argumenta que algunos conceptos y métodos de lógica inductiva pueden aplicarse en la reconstrucción racional de varias nociones y procedimientos estadísticos. Según él, la lógica inductiva sugiere algunos métodos nuevos que se pueden usar para diferentes tipos de inferencia estadística que involucran consideraciones analógicas. Finalmente, Festa muestra cómo se puede desarrollar e integrar una versión bayesiana de la aproximación a la verdad en un marco estadístico.7

Romeijn también investiga la relación entre la estadística y la lógica inductiva. Aunque la lógica inductiva y la estadística se han desarrollado por separado, Romeijn piensa, como Festa, que es hora de explorar la interrelación entre ambas. En su artículo, investiga si es posible representar varios modos de inferencia estadística en términos de lógica inductiva. Romeijn considera tres ideas clave en estadística para forjar el vínculo. Son (i) Pruebas de hipótesis de Neyman-Pearson (NPTH), (ii) estimación de máxima verosimilitud y (iii) estadísticas bayesianas. Romeijn muestra, usando lógica inductiva carnapiana y bayesiana, que la última de estas dos ideas (i. e., estimación de máxima verosimilitud y estadística bayesiana) pueden representarse naturalmente en términos de una lógica inductiva no ampliativa. En la sección final de su capítulo, NPTH se une a la lógica inductiva bayesiana por medio de probabilidades basadas en intervalos sobre las hipótesis estadísticas.

Como hay bayesianos subjetivos, hay bayesianos objetivos. José Bernardo es uno de ellos. Dado que muchos filósofos no son generalmente conscientes de la obra de Bernardo, dedicaremos una discusión relativamente más larga a ella. Bernardo escribe que «t se ha convertido en una práctica estándar, describe, para describir como ‘objetivo’ cualquier análisis estadístico que solo depende del modelo asumido. En este sentido preciso (y solo en este sentido) el análisis de referencia es un método para producir inferencia bayesiana ‘objetiva'».

Para Bernardo, el análisis de referencia que ha defendido para promover su marca de bayesianismo objetivo debe entenderse en términos de algún modelo paramétrico de la forma M {{P(x|w),x∈X,w∈Ω}, que describe las condiciones bajo las cuales se han generado los datos. Aquí, se supone que los datos x consisten en una observación del proceso aleatorio x ∈ X con distribución de probabilidad P(x|w) para algún w ∈ Ω. Un modelo paramétrico es una instancia de un modelo estadístico. Bernardo define θ = θ (w) ∈ Θ como un vector de interés. Todas las inferencias bayesianas legítimas sobre el valor θ se capturan en su distribución posterior P(θ|x)∫ ∫ ΛP(x|θ,λ)P (θ,λ)dλ siempre que estas inferencias se hagan bajo un modelo supuesto. Aquí, λ es un vector de parámetros molestos y a menudo se conoce como «modelo» P (x / λ).

La atracción de este tipo de objetivismo es su énfasis en el «análisis de referencia», que con la ayuda de herramientas estadísticas ha avanzado aún más en convertir su tema de objetividad en una escuela estadística respetable dentro del bayesianismo. Como escribe Bernardo, «el análisis de eferencia puede describirse como un método para derivar posteriors no subjetivos basados en modelos, basados en las ideas teóricas de la información, y destinados a describir el contenido inferencial de los datos para la comunicación científica» . Aquí por el» contenido inferencial de los datos «quiere decir que el primero proporciona» la base para un método para derivar posteriors no subjetivos » (Ibid). El bayesianismo objetivo de Bernardo consiste en las siguientes afirmaciones.

En primer lugar, piensa que la información de fondo del agente debe ayudar al investigador a construir un modelo estadístico, por lo tanto, en última instancia, influye en lo que este último debe asignar al modelo. Por lo tanto, aunque Bernardo podría apoyar el logro de un valor de probabilidad único como meta, no requiere que necesitemos tener la asignación de probabilidad única en todos los temas a nuestra disposición. Escribe: «se supone que el analista tiene un p (w) previo único(a menudo subjetivo), independientemente del diseño del experimento, pero la comunidad científica presumiblemente estará interesada en comparar el posterior personal del analista correspondiente con el posterior de referencia (consenso) asociado al diseño experimental publicado.” . En segundo lugar, para Bernardo, la inferencia estadística no es más que un caso de decisión entre varios modelos/teorías, donde la decisión incluye, entre otras cosas, la utilidad de actuar sobre la suposición de que el modelo/teoría es empíricamente adecuado. En este caso, la utilidad de actuar sobre la adecuación empírica del modelo/teoría en cuestión podría implicar alguna función de pérdida . En su capítulo para este volumen, ha desarrollado su versión del bayesianismo objetivo y ha abordado varios cargos presentados contra su relato.

En su capítulo conjunto, Gregory Wheeler y Jon Williamson han combinado el bayesianismo objetivo con la teoría probabilística de Kyburg. Esta posición del bayesianismo o cualquier forma de bayesianismo parece estar en desacuerdo con el enfoque de Kyburg a la inferencia estadística que se basa en su teoría probabilística. Consideraremos el único argumento de Kyburg contra el bayesianismo. Kyburg piensa que no debemos considerar las creencias parciales como «grados de creencia» porque los bayesianos (estrictos) (como Savage) están asociados con la suposición de una probabilidad única de una proposición. Discutió la probabilidad basada en intervalos como captura de nuestras creencias parciales sobre la incertidumbre. Dado que la probabilidad basada en intervalos no es bayesiana, se deduce que no se nos permite tratar las creencias parciales como grados de creencia. Dada esta oposición entre el punto de vista de Kyburg sobre la probabilidad y el punto de vista bayesiano objetivo, Wheeler y Williamson han tratado de mostrar cómo las ideas centrales de ambos puntos de vista podrían acomodarse fructíferamente dentro de un solo relato de inferencia científica.

Para concluir nuestra discusión sobre la posición bayesiana, teniendo en cuenta la atribución de Royall de la pregunta de creencia a los bayesianos, muchos bayesianos tendrían sentimientos encontrados sobre esta atribución. Hasta cierto punto, algunos de ellos podrían considerar que es inapropiadamente ingenuo. Howson estaría de acuerdo con esta atribución con la observación de que esto perdería algunos de los matices y sutilezas de la teoría bayesiana. En líneas generales, sigue la línea de de Finetti al tomar evaluaciones subjetivas de la probabilidad. Estas evaluaciones generalmente se llaman «grados de creencia».»Así que, hasta ese punto, él cree con certeza que hay un papel central para los grados de creencia, ya que después de todo son a lo que se refiere directamente la función de probabilidad. Por lo tanto, según él, la atribución de la pregunta de creencia a los bayesianos tiene cierto sentido. Sin embargo, piensa que el cuerpo principal de la teoría bayesiana consiste en identificar las restricciones que deben imponerse a estos para garantizar su consistencia/coherencia. Su documento ha proporcionado ese marco para el bayesianismo. Hawthorne podría estar parcialmente en desacuerdo con Royall, ya que su Teorema de Convergencia de la Razón de Verosimilitud muestra cómo los diferentes agentes podrían estar de acuerdo al final, a pesar de que muy bien podrían comenzar con diversos grados de creencia en una teoría. Tanto Weirich como Norton, aunque pertenecen a bandos opuestos en lo que respecta a sus posturas hacia el bayesianismo, podrían estar de acuerdo en que la atribución de Royall a los bayesianos después de todo está justificada. Con respecto a la pregunta de predicción, muchos bayesianos, incluidos aquellos que trabajan dentro de los confines de la teoría de la confirmación, argumentarían que un relato de confirmación que responde a la pregunta de creencia es capaz de manejar la pregunta de predicción, ya que, para los bayesianos, esta última es una subclase de la pregunta de creencia.



Deja una respuesta

Tu dirección de correo electrónico no será publicada.