Test de bondad de ajuste para la distribución Poissón Bivariante

Novoa Muñoz, Francisco

Test de bondad de ajuste para la distribución Poissón Bivariante

Novoa Muñoz, Francisco

Dirigida por:

María Dolores Jiménez Gamero Director/a

Universidad de defensa: Universidad de Sevilla

Fecha de defensa: 27 de noviembre de 2013

Tribunal:

Leandro Pardo Llorente Presidente/a
Juan Luis Moreno Rebollo Secretario/a
María Virtudes Alba Fernández Vocal
Alejandra Cabaña Vocal
Joaquín Muñoz García Vocal

Tipo: Tesis

Teseo: 349535 DIALNET Idus editor

Resumen

Los datos de conteo pueden aparecer bajo diferentes circunstancias. En un marco univariante, la distribución Poisson es la distribución que con mayor frecuencia ha sido empleada para modelar tales datos (ver por ejemplo, Haight (1967, pp. 100�107) [12], Johnson y Kotz (1969, pp. 88�90) [18], Sahai y Khurshid (1993) [41]). En la práctica, los datos de conteo bivariantes surgen en varias disciplinas diferentes y la distribución Poisson bivariante (DPB), siendo una generalización de la distribución Poisson, juega un rol importante al momento de modelarlos, siempre que dichos datos presenten una correlación no negativa. Esta distribución ha sido usada para modelar datos que aparecen en un amplio rango de campos incluyendo medicina, para mediciones en el pretratamiento y en el postratamiento en los mismos pacientes, o el número de accidentes por trabajador en una factor´?a durante dos intervalos dados de tiempo (ver por ejemplo, Hamdan (1972) [13]); en marketing, para el número de compras de diferentes productos; en epidemiología, para el número de incidentes de distintos tipos de muertes en una serie de distritos; en deportes, para el número de goles marcados por cada uno de los dos equipos oponentes en un partido de balompié (ver por ejemplo, Maher (1982) [32], Karlis y Ntzoufras (2000) [21], (2003a) [22], (2003b) [23], (2005) [24], Rue y Salvesen (2000) [39]); en biología, para el número de semillas y plantas que crecen en una parcela (ver por ejemplo, Lakshminarayana, Pandit y Rao (1999) [28]); en econometría, para el número de cambios de trabajo voluntarios e involuntarios (ver por ejemplo, Jung y Winkelmann (1993) [20]); en datos de turismo (ver por ejemplo, Berkhout y Plug (2004) [4]); en seguros de coches (ver por ejemplo, Bermúdez (2009) [5]); en sanidad (ver por ejemplo, Karlis y Ntzoufras (2005) [24], Karlis y Tsiamyrtzis (2008) [25]); en la industria textil, para el número de dos tipos de defectos en muestras de fibras de textil (ver por ejemplo, Ho y Singer (2001) [15]), entre muchos otros. En el caso multivariante, la distribución Poisson ha sido usada para modelar redes sociales multi-relacionales (ver por ejemplo, Dai, Chua y Lim (2012) [7]). Contrastar la bondad de ajuste de las observaciones dadas con un modelo probabilístico es un aspecto crucial del análisis de datos. Para el caso univariante, se han construido muchos tests de bondad de ajuste con la finalidad de comprobar si los datos provienen de una distribución Poisson (para una revisión detallada, ver Gürtler y Henze, (2000) [11]). En comparación, la literatura sobre tests de bondad de ajuste para la DPB es más bien escasa. Hasta donde conocemos, podemos mencionar el test propuesto por Crockett (1979) [6], el test desarrollado por Loukas y Kemp (1986) [30], que se basa en una extensión del índice de dispersión univariante, y el test sugerido por Rayner y Best (1995) [37], que consiste en una modificaci´on del test dado por Loukas y Kemp (1986) [30]. La principal desventaja de estos tests de bondad de ajuste es que no son consistentes contra cada alternativa fija. El objetivo de esta memoria es proponer y estudiar tests de bondad de ajuste para la DPB, que sean consistentes. Dado que la función generatriz de probabilidad (fgp) caracteriza la distribución de un vector aleatorio y se puede estimar consistentemente por la función generatriz de probabilidad empírica (fgpe), los tests que proponemos son funciones de la fgpe. El primer test estadístico compara la fgpe de los datos con un estimador de la fgp de la DPB. Luego, mostramos que la fgp de la DPB es la única fgp que satisface cierto sistema de ecuaciones diferenciales parciales, lo cual nos lleva a proponer dos tests estadísticos basados en el análogo empírico de dicho sistema, uno de ellos de tipo Cramér-von Mises y el otro se basa en los coeficientes de los polinomios de la versión empírica. Los tests que proponemos pueden ser vistos como extensiones al caso bivariante de algunos tests de bondad de ajuste diseñados para el caso univariante. Con el fin de decidir cuándo rechazar la hipótesis nula, debemos conocer la distribución nula del test estadístico o, al menos, una aproximación de la misma. Puesto que, para los tests propuestos, no es posible obtener las distribuciones nulas para tamaños de muestra finito, las aproximamos por las asintóticas, las cuales resultaron depender de cantidades desconocidas, por lo tanto no son útiles como estimaciones de la distribución nula. Así, para aproximar la distribución nula, proponemos un estimador bootstrap paramétrico. En cuanto a la potencia, obtuvimos que los tests que proponemos son consistentes contra alternativas fijas. Además, analizamos el comportamiento asintótico de los tests estadísticos bajo alternativas contiguas y encontramos que son capaces de detectar alternativas que convergen a la nula a razón de n-1/2. Todas las propiedades estudiadas de los tests introducidos en esta memoria son asintóticas, es decir, describen el comportamiento de los tests para muestras de tamaño grande. Con la finalidad de evaluar el comportamiento de los tests propuestos para muestras de tamaño finito, realizamos un estudio de simulación. En todos los casos considerados, el método bootstrap proporciona una buena aproximación a la distribución nula. En cuanto a la potencia, a diferencia de los tests estadísticos diseñados por los investigadores Crockett (1979) [6], Loukas y Kemp (1986) [30], y Rayner y Best (1995) [37], los tests que proponemos fueron capaces de detectar todas las alternativas seleccionadas. Con el propósito de mantener la notación tan simple como sea posible, desarrollamos el análisis teórico para el caso bivariante, pero los métodos se pueden extender de manera natural al caso multivariante. La presente memoria se organiza de la siguiente manera. En el Capítulo 1 presentamos algunos resultados preliminares que nos servirán en los capítulos siguientes, también damos la definición de la DPB con algunas de sus propiedades y además, mostramos contrastes de bondad de ajuste para la distribución Poisson tanto para datos univariantes como para datos bivariantes. El Capítulo 2 contiene los dos primeros tests estadísticos que proponemos, que son de tipo Cramér-von Mises. Aquí, también mostramos la distribución asintótica nula de los tests estadísticos y proporcionamos estimadores bootstraps consistentes. En la parte final, estudiamos la potencia de los tests propuestos frente a alternativas fijas y locales. En el Capítulo 3 presentamos el tercer estadístico que proponemos y describimos sus características. Estudiamos su distribución asintótica nula y aproximamos su distribución nula por medio de un estimador bootstrap consistente. También, analizamos su potencia frente a alternativas fijas y contiguas. El Capítulo 4 está dedicado a mostrar los resultados de un estudio de simulación y la aplicación de los tests propuestos a dos conjuntos de datos reales. Dicho estudio de simulación fue realizado con el objetivo de evaluar el comportamiento de los tests que proponemos y comparar la potencia tanto entre ellos como con otros tests que encontramos en la literatura estadística. En el Capítulo 5 entregamos las expresiones matemáticas de los tests que hemos desarrollado y damos algunos detalles técnicos que son muy útiles al momento de implementar algoritmos o subrutinas en algún lenguaje de programación. El Capítulo 6 muestra cómo los tests propuestos se pueden extender al caso multivariante general.