Propósito: Comprobar la aleatoriedad Las gráficas de autocorrelación (Box y Jenkins, págs. 28-32) son una herramienta comúnmente usada para verificar la aleatoriedad en un conjunto de datos. Esta aleatoriedad se determina mediante el cálculo de autocorrelaciones para los valores de datos en diferentes intervalos de tiempo. Si son aleatorias, tales autocorrelaciones deben estar cerca de cero para todas las separaciones de tiempo-retraso. Si no es aleatorio, entonces una o más de las autocorrelaciones serán significativamente no-cero. Además, las parcelas de autocorrelación se utilizan en la fase de identificación del modelo para los modelos autorregresivos y móviles de serie temporal de Box-Jenkins. La autocorrelación es solo una medida de aleatoriedad Tenga en cuenta que no correlacionado no significa necesariamente aleatorio. Los datos que tienen una autocorrelación significativa no son aleatorios. Sin embargo, los datos que no muestran una autocorrelación significativa todavía pueden mostrar no aleatoriedad de otras maneras. La autocorrelación es sólo una medida de aleatoriedad. En el contexto de la validación del modelo (que es el tipo primario de aleatoriedad que describimos en el Manual), la comprobación de la autocorrelación suele ser una prueba suficiente de aleatoriedad, ya que los residuos de un modelo de ajuste inadecuado tienden a mostrar aleatoriedad no sutil. Sin embargo, algunas aplicaciones requieren una determinación más rigurosa de la aleatoriedad. En estos casos, una batería de pruebas, que pueden incluir la comprobación de la autocorrelación, se aplican ya que los datos pueden ser no aleatorios de muchas maneras diferentes ya menudo sutiles. Un ejemplo de dónde se necesita un control más riguroso de la aleatoriedad sería probar generadores de números aleatorios. Trazado de muestra: Las autocorrelaciones deben ser cercanas a cero para aleatoriedad. Este no es el caso en este ejemplo y por lo tanto la suposición de aleatoriedad falla. Este gráfico de autocorrelación muestra muestra que la serie temporal no es aleatoria, sino que tiene un alto grado de autocorrelación entre observaciones adyacentes y casi adyacentes. Coeficiente de autocorrelación donde C h es la función de autocovariancia y C 0 es la función de varianza. Obsérvese que R h está entre -1 y 1. Tenga en cuenta que algunas fuentes pueden usar la función Fórmula siguiente para la función de autocovariancia Aunque esta definición tiene menos sesgo, la formulación (1 / N) tiene algunas propiedades estadísticas deseables y es la forma más comúnmente utilizada en la bibliografía estadística. Vea las páginas 20 y 49-50 en Chatfield para más detalles. Eje horizontal: Retardo de tiempo h (h 1, 2, 3.) La línea anterior también contiene varias líneas de referencia horizontales. La línea media está en cero. Las otras cuatro líneas son 95 y 99 bandas de confianza. Observe que hay dos fórmulas distintas para generar las bandas de confianza. Si se utiliza el gráfico de autocorrelación para probar la aleatoriedad (es decir, no hay dependencia temporal en los datos), se recomienda la siguiente fórmula: donde N es el tamaño de la muestra, z es la función de distribución acumulativa de la distribución normal estándar y (alfa ) Es el nivel de significación. En este caso, las bandas de confianza tienen un ancho fijo que depende del tamaño de la muestra. Esta es la fórmula que se utilizó para generar las bandas de confianza en la gráfica anterior. Las gráficas de autocorrelación también se usan en la etapa de identificación del modelo para el ajuste de modelos ARIMA. En este caso, se supone un modelo de media móvil para los datos y se deben generar las siguientes bandas de confianza: donde k es el retraso, N es el tamaño de la muestra, z es la función de distribución acumulativa de la distribución normal estándar y (alfa) es El nivel de significación. En este caso, las bandas de confianza aumentan a medida que aumenta el desfase. La gráfica de autocorrelación puede proporcionar respuestas a las siguientes preguntas: ¿Los datos son aleatorios? ¿Es una observación relacionada con una observación adyacente? ¿Es una observación relacionada con una observación extraída dos veces? ¿Es la serie de tiempo observada el ruido blanco? La serie temporal observada es sinusoidal ¿Es el modelo válido y suficiente? Es la fórmula ss / sqrt válida Importancia: Garantizar la validez de las conclusiones de la ingeniería Aleatoriedad (junto con el modelo fijo, la variación fija y la distribución fija) Es uno de los cuatro supuestos que típicamente subyacen a todos los procesos de medición. El supuesto de aleatoriedad es de importancia crítica por las tres razones siguientes: La mayoría de las pruebas estadísticas estándar dependen de la aleatoriedad. La validez de las conclusiones de la prueba está directamente relacionada con la validez del supuesto de aleatoriedad. Muchas de las fórmulas estadísticas utilizadas comúnmente dependen del supuesto de aleatoriedad, siendo la fórmula más común la fórmula para determinar la desviación estándar de la media de la muestra: donde s es la desviación estándar de los datos. Aunque muy utilizados, los resultados de usar esta fórmula no tienen ningún valor a menos que la suposición aleatoria se mantenga. Para datos univariados, el modelo predeterminado es Si los datos no son aleatorios, este modelo es incorrecto y no válido, y las estimaciones de los parámetros (como la constante) se vuelven sin sentido e inválidas. En resumen, si el analista no comprueba la aleatoriedad, entonces la validez de muchas de las conclusiones estadísticas se vuelve sospechosa. La gráfica de autocorrelación es una excelente manera de comprobar tal aleatoriedad. Distribución del residuo en el promedio móvil movido auto-regresivo Citas de la serie de tiempo Citas 1103 Referencias 10 quot (Box y Pierce, 1970), la prueba usando la estadística Q 2 n 2 K k 1 tr (Nk) de Hosking (1980), la prueba usando la estadística Q 3 n K k 1 tr p 2 K (K 1) / (2n) de Li y Mcleod (1981), donde (k) es la matriz de correlación muestral dada en (1). Se ha demostrado que bajo la condición de que t son IID (de ahí la hipótesis nula H 0 en (3)), todo Q j (j 1, 2, 3) son asintóticamente 2 p 2 K. quot Mostrar el resumen Ocultar el resumen RESUMEN: Proponemos una nueva prueba omnibus para el ruido blanco vectorial utilizando las auto-correlaciones absolutas máximas y las correlaciones cruzadas de las series de componentes. Basándose en la aproximación recientemente establecida por la norma Linfty de un vector aleatorio normal, el valor crítico de la prueba puede evaluarse mediante el arranque de una distribución normal multivariable. En contraste con la prueba convencional de ruido blanco, se demuestra que el nuevo método es válido para probar la salida del ruido blanco no IID. Se ilustra la exactitud y la potencia de la prueba propuesta por simulación, lo que también muestra que la nueva prueba supera a varios métodos comúnmente utilizados, incluyendo, por ejemplo, el test de multiplicador de Lagrange y las pruebas multivariables Box-Pierce portmanteau especialmente cuando la dimensión de las series temporales Es alta en relación con el tamaño de la muestra. Los resultados numéricos también indican que el rendimiento de la nueva prueba se puede mejorar aún más cuando se aplica a los datos pre-transformados obtenidos a través del análisis del componente principal de la serie temporal propuesto por Chang, Guo y Yao (2014). Los procedimientos propuestos se han implementado en un paquete R HDtest y está disponible en línea en CRAN. Este ensayo de estacionariedad confirma la independencia de los incrementos, donde el rechazo de la hipótesis nula H 0 indica la estacionariedad (el nulo La hipótesis H 0 es que los datos no son estacionarios) BULLET Prueba estadística t de Dickey-Fuller (ADF) aumentada (Said amp Dickey, 1984 Diebold amp Rudebusch, 1991 Banerjee et al., 1993): en el Dickey-Fuller Aumentado ) Prueba t-estadística la hipótesis nula H 0 es que los datos son no estacionarios (p pequeños valores (por ejemplo, menos de 0,05) sugieren que la serie de tiempo es estacionario). BULLET Kwiatkowski-PhillipsSchmidtShin test (KPSS) (Kwiatkowski et al., 1992): esta prueba invierte las hipótesis, de ahí que la hipótesis nula H 0 sea que la serie temporal es estacionaria. Quot Mostrar el resumen Ocultar el resumen RESUMEN: Un proyecto de software exitoso es el resultado de un proceso complejo que involucra, sobre todo, a las personas. Los desarrolladores son los factores clave para el éxito de un proceso de desarrollo de software, no sólo como ejecutores de tareas, sino como protagonistas y núcleo de todo el proceso de desarrollo. Este artículo investiga aspectos sociales entre desarrolladores que trabajan en proyectos de software desarrollados con el apoyo de herramientas Agile. Se estudiaron 22 proyectos de software de código abierto desarrollados con la plataforma Agile del repositorio de JIRA. Todos los comentarios cometidos por los desarrolladores involucrados en los proyectos fueron analizados y se exploró si la cortesía de los comentarios afectados el número de desarrolladores involucrados y el tiempo necesario para solucionar cualquier problema dado. Nuestros resultados mostraron que el nivel de cortesía en el proceso de comunicación entre los desarrolladores tiene un efecto sobre el tiempo necesario para solucionar los problemas y, en la mayoría de los proyectos analizados, tiene una correlación positiva con el atractivo del proyecto tanto para activos como potenciales Desarrolladores. Cuanto más educados eran los desarrolladores, menos tiempo tomaba para solucionar un problema. Artículo completo Artículo Jul 2016 quotPortmanteau white noise test desarrollado por Box amp Pierce (1970) se calcula para probar la distribución normal del residuo dentro de la muestra. La prueba se basa en el hecho de que si (1) ,, (n) es la realización del proceso de ruido blanco (Baum, 2005). RESUMEN: Teóricamente, el tipo de cambio es uno de los principales impulsores de la inflación que influye en el índice de precios al por mayor (IPM) en los países donde se pone énfasis en la importación y exportación como China. En este artículo se investiga la volatilidad de los tipos de cambio y su impulsividad como choque externo a WPI en un conjunto de datos de series de tiempo que representa 4.067 observaciones diarias de la economía china del 12 de agosto de 2004 al 30 de septiembre de 2015. El cuadrado mínimo ordinario Y el análisis de regresión ponderado revelan valores p significativos de 0,000 para el tipo de cambio que explican el IPM a lo largo del período indicado. La heterocedasticidad condicional autorregresiva y el modelo de heteroscedasticidad condicional autorregresiva generalizada presentan un valor de probabilidad significativo de 0,000 y 0,044 respectivamente para WPI y el tipo de cambio. Se encuentra que la volatilidad de días anteriores de WPI influye en la volatilidad futura de WPI como un choque interno además de los días anteriores impulsividad del tipo de cambio que influye en la futura volatilidad del IPM como choque externo. Los modelos de ensayo se aplican a fondo y se evidencia su estabilidad y validez. Artículo Abr 20162.1 Modelos de media móvil (modelos MA) Los modelos de series temporales conocidos como modelos ARIMA pueden incluir términos autorregresivos y / o términos de media móvil. En la semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor retrasado de x t. Por ejemplo, un término autorregresivo de retardo 1 es x t-1 (multiplicado por un coeficiente). Esta lección define los términos del promedio móvil. Un término medio móvil en un modelo de serie temporal es un error pasado (multiplicado por un coeficiente). Dejamos (wt desbordamiento N (0, sigma2w)), lo que significa que los w t son idéntica, independientemente distribuidos, cada uno con una distribución normal que tiene la media 0 y la misma varianza. El modelo de media móvil de primer orden, denotado por MA (1) es (xt mu wt theta1w) El modelo de media móvil de segundo orden, denotado por MA (2) es (xt mu wt theta1w theta2w) , Denotado por MA (q) es (xt mu wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, aunque sí cambia los signos algebraicos de los valores estimados de los coeficientes y los términos (no cuadrados) en las fórmulas para las ACF y las varianzas. Usted necesita comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza signos positivos en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie temporal con un modelo MA (1) Tenga en cuenta que el único valor distinto de cero en el ACF teórico es para el retardo 1. Todas las demás autocorrelaciones son 0. Por lo tanto, una ACF de muestra con una autocorrelación significativa sólo con el retardo 1 es un indicador de un posible modelo MA (1). Para los estudiantes interesados, las pruebas de estas propiedades son un apéndice a este folleto. Ejemplo 1 Supongamos que un modelo MA (1) es x t 10 w t .7 w t-1. Donde (wt overset N (0,1)). Así, el coeficiente 1 0,7. El ACF teórico se da por un diagrama de esta ACF sigue. La gráfica que se muestra es la ACF teórica para un MA (1) con 1 0,7. En la práctica, una muestra no suele proporcionar un patrón tan claro. Utilizando R, simulamos n 100 valores de muestra utilizando el modelo x t 10 w t .7 w t-1 donde w t iid N (0,1). Para esta simulación, sigue un diagrama de series de tiempo de los datos de la muestra. No podemos decir mucho de esta trama. A continuación se muestra el ACF de muestra para los datos simulados. Observamos un pico en el retraso 1 seguido por valores generalmente no significativos para los retrasos de 1. Obsérvese que la muestra ACF no coincide con el patrón teórico del MA subyacente (1), que es que todas las autocorrelaciones para los retrasos de 1 serán 0.Una muestra diferente tendría una ACF de muestra ligeramente diferente mostrada abajo, pero probablemente tendría las mismas características amplias. Propiedades Terapéuticas de una Serie de Tiempo con un Modelo MA (2) Para el modelo MA (2), las propiedades teóricas son las siguientes: Obsérvese que los únicos valores distintos de cero en la ACF teórica son para los retornos 1 y 2. Las autocorrelaciones para retardos mayores son 0 . Por lo tanto, una muestra de ACF con autocorrelaciones significativas en los intervalos 1 y 2, pero autocorrelaciones no significativas para retardos mayores, indica un posible modelo MA (2). Iid N (0,1). Los coeficientes son 1 0,5 y 2 0,3. Dado que se trata de una MA (2), la ACF teórica tendrá valores distintos de cero sólo en los retornos 1 y 2. Los valores de las dos autocorrelaciones distintas de cero son: Un gráfico del ACF teórico sigue. Como casi siempre es el caso, los datos de la muestra no se comportarán tan perfectamente como la teoría. Se simularon 150 valores de muestra para el modelo x t 10 w t .5 w t-1 .3 w t-2. Donde w t iid N (0,1). A continuación se muestra el gráfico de la serie de tiempo de los datos. Al igual que con el gráfico de la serie de tiempo para los datos de la muestra MA (1), no se puede decir mucho de ella. A continuación se muestra el ACF de muestra para los datos simulados. El patrón es típico para situaciones donde un modelo MA (2) puede ser útil. Hay dos picos estadísticamente significativos en los intervalos 1 y 2, seguidos de valores no significativos para otros desfases. Tenga en cuenta que debido al error de muestreo, la muestra ACF no coincide exactamente con el patrón teórico. ACF para modelos MA (q) Una propiedad de los modelos MA (q) en general es que hay autocorrelaciones no nulas para los primeros q retrasos y autocorrelaciones 0 para todos los retrasos gt q. No unicidad de la conexión entre los valores de 1 y (rho1) en MA (1) Modelo. En el modelo MA (1), para cualquier valor de 1. El 1/1 recíproco da el mismo valor para. Por ejemplo, use 0.5 para 1. Y luego utilice 1 / (0,5) 2 para 1. Youll get (rho1) 0.4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. Limitamos los modelos MA (1) a tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 será un valor de parámetro permisible, mientras que 1 1 / 0,5 2 no. Invertibilidad de los modelos MA Se dice que un modelo MA es invertible si es algebraicamente equivalente a un modelo de orden infinito convergente. Al converger, queremos decir que los coeficientes de AR disminuyen a 0 a medida que retrocedemos en el tiempo. Invertibilidad es una restricción programada en el software de la serie de tiempo usado para estimar los coeficientes de modelos con términos de MA. No es algo que buscamos en el análisis de datos. En el apéndice se proporciona información adicional sobre la restricción de la invertibilidad para los modelos MA (1). Nota de Teoría Avanzada. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para la invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - q y q 0 tiene soluciones para y que caen fuera del círculo unitario. Código R para los Ejemplos En el Ejemplo 1, se representó la ACF teórica del modelo x $ _ {t} $ w $ _ {t} $. 7w t - 1. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R usados para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0.7), lag. max10) 10 retardos de ACF para MA (1) con theta1 0.7 lags0: 10 crea una variable llamada lags que va de 0 a 10. plot Abline (h0) añade un eje horizontal al diagrama El primer comando determina el ACF y lo almacena en un objeto (a0) Llamado acfma1 (nuestra elección de nombre). El comando plot (el 3er comando) traza retrasos en comparación con los valores ACF para los retornos 1 a 10. El parámetro ylab etiqueta el eje y y el parámetro principal coloca un título en la gráfica. Para ver los valores numéricos de la ACF simplemente utilice el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. Xcarzim. sim (n150, lista (mac (0.7))) Simula n 150 valores de MA (1) xxc10 agrega 10 para hacer la media 10. La simulación predeterminada significa 0. plot (x, typeb, mainSimulated MA (1) data) (X, xlimc (1,10), mainACF para datos de muestra simulados) En el Ejemplo 2, se representó el ACF teórico del modelo xt 10 wt. 5 w t-1 .3 w t-2. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5.0.3), lag. max10) acfma2 lags0: 10 trama (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) con theta1 0,5, (X, typeb, principal serie MA simulado) acf (x, xlimc (1,10), x2) (1) Para los estudiantes interesados, aquí hay pruebas de las propiedades teóricas del modelo MA (1). Cuando x 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 (x) La razón es que, por definición de independencia del peso. E (w k w j) 0 para cualquier k j. Además, debido a que w t tiene una media 0, E (w j w j) E (w j 2) w 2. Para una serie de tiempo, aplique este resultado para obtener la ACF indicada anteriormente. Un modelo inversible MA es uno que puede ser escrito como un modelo de orden infinito AR que converge para que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el modelo MA (1). A continuación, sustituimos la relación (2) por wt-1 en la ecuación (1) (3) (zt wt theta1 (z-theta1w) wt theta1z - theta2w) En el momento t-2. La ecuación (2) es entonces sustituimos la relación (4) por w t-2 en la ecuación (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si continuáramos Sin embargo, si 1 1, los coeficientes que multiplican los retrasos de z aumentarán (infinitamente) en tamaño a medida que retrocedemos hacia atrás hora. Para evitar esto, necesitamos 1 lt1. Esta es la condición para un modelo de MA (1) invertible. Infinite Order MA model En la semana 3, veamos bien que un modelo AR (1) puede convertirse en un modelo de orden infinito MA: (xt - mu wt phi1w phi21w puntos phik1 w dots sum phij1w) Esta suma de términos de ruido blanco pasado es conocida Como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos remontándose en el tiempo. Esto se llama un orden infinito MA o MA (). Una orden finita MA es un orden infinito AR y cualquier orden finito AR es un orden infinito MA. Recordemos en la semana 1, observamos que un requisito para un AR estacionario (1) es que 1 lt1. Vamos a calcular el Var (x t) utilizando la representación causal. Este último paso utiliza un hecho básico sobre series geométricas que requiere (phi1lt1) de lo contrario la serie diverge. Navegación
No comments:
Post a Comment