Teoría de renovación

La teoría de renovación es la rama de la teoría de probabilidad que generaliza procesos de Poisson para tiempos de retención arbitrarios. Las aplicaciones incluyen el cálculo del tiempo esperado para un mono que da un toque al azar en un teclado para escribir a máquina la palabra Macbeth y compara las ventajas a largo plazo de pólizas de seguros diferentes.

Procesos de renovación

Introducción

Un proceso de renovación es una generalización del proceso de Poisson. En la esencia, el proceso de Poisson es un tiempo continuo proceso de Markov en los números enteros positivos (por lo general comenzando en el cero) que tiene tiempos de retención independientes idénticamente distribuidos en cada número entero (exponencialmente distribuido) antes de avanzar (con la probabilidad 1) a siguiente integer:. En el mismo espíritu informal, podemos definir un proceso de renovación para ser la misma cosa, salvo que los tiempos de retención toman una distribución más general. (Note sin embargo que la independencia y la distribución idéntica (IID) la propiedad de los tiempos de retención se retienen).

Definición formal

Deje ser una secuencia de variables arbitrarias independientes idénticamente distribuidas positivas tales que

:

Nos referimos a la variable arbitraria como el tiempo de retención "th".

Defina para cada n> 0:

:

cada uno referido como el tiempo de salto "de th" y los intervalos

:

llamarse intervalos de renovación.

Entonces la variable arbitraria dada por

:

(donde está la función del indicador) representa el número de saltos que han ocurrido antes del tiempo t, y se llama un proceso de renovación.

Interpretación

Uno puede decidir pensar en los tiempos de retención ya que el tiempo pasó antes de que una máquina se rompa para el tiempo "th" desde la vez pasada que se rompió. (Note que esto supone que la máquina inmediatamente se fije y reanudamos el reloj inmediatamente.) Bajo esta interpretación, los tiempos de salto registran los tiempos sucesivos en los cuales las rupturas de la máquina y el proceso de renovación registra el número de veces la máquina se ha tenido que hasta ahora reparar en cualquier momento dado.

Sin embargo es más provechoso entender el proceso de renovación en su forma abstracta, ya que puede ser usado para modelar un gran número de situaciones prácticas del interés que no están relacionadas muy estrechamente con la operación de máquinas.

Procesos de la recompensa de la renovación

Deje ser una secuencia de variables arbitrarias IID (recompensas) que satisfacen

:

Entonces la variable arbitraria

:

se llama un proceso de la recompensa de la renovación. Note que a diferencia del, cada uno puede tomar valores negativos así como valores positivos.

La variable arbitraria depende de dos secuencias: los tiempos de retención y las recompensas

Estas dos secuencias no tienen que ser independientes. En particular, puede ser una función

de.

Interpretación

En el contexto de la susodicha interpretación de los tiempos de retención como el tiempo entre funcionamientos defectuosos sucesivos de una máquina, las "recompensas" (que en este caso resultan ser negativos) se pueden ver como los gastos de reparación sucesivos incurridos a consecuencia de los funcionamientos defectuosos sucesivos.

Una analogía alternativa es que tenemos un ganso mágico que pone huevos a intervalos (tiempos de retención) distribuidos como. A veces pone huevos de oro del peso arbitrario, y a veces pone huevos tóxicos (también del peso arbitrario) que requieren responsable (y costoso) disposición. Las "recompensas" son las pérdidas/ganancias financieras (arbitrarias) sucesivas que resultan de huevos sucesivos (yo = 1,2,3...) y registra la "recompensa" financiera total en el tiempo t.

Propiedades de procesos de renovación y procesos de la recompensa de la renovación

Definimos la función de renovación:

:

El teorema de renovación elemental

La función de renovación satisface

:

Prueba

Abajo, encuentra que la ley fuerte de grandes números para procesos de renovación nos dice esto

:

Para demostrar el teorema de renovación elemental, es suficiente mostrar que esto es uniformemente integrable.

Para hacer esto, considere un poco de proceso de renovación truncado donde los tiempos de retención se definen por donde está un punto tal que

:

Los \begin {alinean }\

\overline {X_t} &\\leq \sum_ {i=1} ^ {[en]} \mathrm {Geométrico} (p) \\

El \mathbb {E }\\dejó [\, \overline {X_t }\\, \right] ^2 &\\leq C_1 t + C_2 t^2 \\

P\left (\frac {X_t} {t}> x\right) &\\leq \frac {E\left [X_t^2\right]} {t^2x^2} \leq \frac {E\left [\overline {X_t} ^2\right]} {t^2x^2} \leq \frac {C} {x^2}.

Los \end {alinean }\

</matemáticas>

El teorema de renovación elemental para la renovación recompensa procesos

Definimos la función de la recompensa:

:

La función de la recompensa satisface

:

La ecuación de renovación

La función de renovación satisface

:

donde está la función de distribución acumulativa de y es la función de densidad de probabilidad correspondiente.

Prueba de la ecuación de renovación

El:We puede iterar la expectativa sobre el primer tiempo de retención:

::

:But por la propiedad de Markov

::

:So

::

Los \begin {alinean }\

m (t) & {} = \mathbb {E} [X_t] \\[12pt]

& {} = \mathbb {E} [\mathbb {E} (X_t \mid S_1)] \\[12pt]

& {} = \int_0^\\infty \mathbb {E} (X_t \mid S_1=s) f_S (s) \, ds \\[12pt]

& {} = \int_0^\\infty \mathbb {yo} _ {\\{t \geq s\}} \left (1 + \mathbb {E} [X_ {t-s}] \right) f_S (s) \, ds \\[12pt]

& {} = \int_0^t \left (1 + m (t-s) \right) f_S (s) \, ds \\[12pt]

& {} = F_S (t) + \int_0^t m (t-s) f_S (s) \, ds,

Los \end {alinean} </matemáticas>

El:as requerido.

Propiedades asintóticas

y satisfaga

: (ley fuerte de grandes números para procesos de renovación)

: (ley fuerte de grandes números para procesos de la recompensa de la renovación)

casi seguramente.

Prueba

Los:First consideran. Por definición tenemos:

::

:for todos y tan

::

\frac {J_ {X_t}} {X_t} \leq \frac {t} {X_t} \leq \frac {J_ {X_t+1}} {X_t }\

</matemáticas>

:for todo t &ge; 0.

:Now desde entonces

::

:as casi seguramente (con probabilidad 1). De ahí:

::

:almost seguramente (usando la ley fuerte de grandes números); de manera similar:

::

:almost seguramente.

El:Thus (ya que se encajona entre los dos términos)

::

\frac {1} X_t \to {t} \frac {1} {\\mathbb {E} S_1 }\

</matemáticas>

:almost seguramente.

Los:Next consideran. Tenemos

::

:almost seguramente (usando el primer resultado y usando la ley de grandes números en).

La paradoja inspector

Un rasgo curioso de procesos de renovación es que si esperamos algún tiempo predeterminado t y luego observamos qué grande el intervalo de renovación que contiene t es, deberíamos esperar que esto sea típicamente más grande que un intervalo de renovación de la talla media.

Matemáticamente los estados de paradoja inspectores: para cualquier t> 0 el intervalo de renovación que contiene t es estocásticamente más grande que el primer intervalo de renovación. Es decir para todo x> 0 y para todo t> 0:

:

donde F es la función de distribución acumulativa de los tiempos de retención IID S.

Prueba de la paradoja inspector

Observe que la vez pasada antes t es; y que el intervalo de renovación que contiene t es. Entonces

:

Los \begin {alinean }\

\mathbb {P} (S_ {X_t+1}> x) & {} = \int_0^\\infty \mathbb {P} (S_ {X_t+1}> x \mid J_ {X_t} = s) f_S (s) \, ds \\[12pt]

& {} = \int_0^\\infty \mathbb {P} (S_ {X_t+1}> x | S_ {X_t+1}> t-s) f_S (s) \, ds \\[12pt]

& {} = \int_0^\\infty \frac {\\mathbb {P} (S_ {X_t+1}> x \, \, S_ {X_t+1}> t-s)} {\\mathbb {P} (S_ {X_t+1}> t-s)} f_S (s) \, ds \\[12pt]

& {} = \int_0^\\infty \frac {1-F (\max \{x, t-s \})} {1-F (t-s)} f_S (s) \, ds \\[12pt]

& {} = \int_0^\\infty \min \left\{\\frac {1-F (x)} {1-F (t-s)}, \frac {1-F (t-s)} {1-F (t-s) }\\right\} f_S (s) \, ds \\[12pt]

& {} = \int_0^\\infty \min \left\{\\frac {1-F (x)} {1-F (t-s)}, 1\right\} f_S (s) \, ds \\[12pt]

& {} \geq 1-F (x) \\[12pt]

& {} = \mathbb {P} (S_1> x)

Los \end {alinean }\

</matemáticas>

como requerido.

Aplicaciones del ejemplo

Ejemplo 1: uso de la ley fuerte de grandes números

Eric el empresario tiene máquinas n, cada uno que tiene una vida operacional uniformemente distribuyó entre el cero y dos años. Eric puede dejar a cada máquina dirigida hasta que falle con el coste de reposición 2600€; o bien puede sustituir una máquina en cualquier momento mientras todavía es funcional a un coste de 200€.

¿

Cuál es su política de reemplazo óptima?

Solución

Podemos modelar la vida de las máquinas n como n procesos de la recompensa de la renovación concurrentes independientes, por tanto es suficiente considerar el caso n=1. Denote este proceso por. Las vidas sucesivas S de las máquinas de reemplazo son independientes e idénticamente distribuidas, por tanto la política óptima es lo mismo para todas las máquinas de reemplazo en el proceso.

Si Eric decide al principio de la vida de una máquina sustituirlo en el tiempo 0

Los \begin {alinean }\

El \mathbb {E} S & = \mathbb {E} [S \mid \mbox {falla antes} t] \cdot \mathbb {P} [\mbox {falla antes} t] + \mathbb {E} [S \mid \mbox {no falla antes} t] \cdot \mathbb {P} [\mbox {no falla antes} t] \\

& = \frac {t} {2 }\\se fueron (0.5t\right) + \frac {2-t} {2 }\\dejado (t \right)

Los \end {alinean }\

</matemáticas>

y el coste esperado W por máquina es:

:

Los \begin {alinean }\

El \mathbb {E} W & = \mathbb {E} (W \mid \text {falla antes} t) \cdot \mathbb {P} (\text {falla antes} t) + \mathbb {E} (W \mid \text {no falla antes} t) \cdot \mathbb {P} (\text {no falla antes} t) \\

& = \frac {t} {2} (2600) + \frac {2-t} {2} (200) = 1200t + 200.

Los \end {alinean }\

</matemáticas>

Así pues según la ley fuerte de grandes números, su coste promedio a largo plazo por unidad de tiempo es:

:

\frac {1} Y_t \simeq {t} \frac {\\mathbb {E} W\{\\mathbb {E} S }\

\frac {4 (1200t + 200)} {t^2 + 4t - 2t^2 }\

</matemáticas>

entonces diferenciación con respecto a t:

:

\frac {\\parcial} {\\parcial t\\frac {4 (1200t + 200)} {t^2 + 4t - 2t^2} = 4\frac {(4t - t^2) (1200) - (4 - 2t) (1200t + 200)} {(t^2 + 4t - 2t^2) ^2},

</matemáticas>

esto implica que los puntos decisivos satisfacen:

:

Los \begin {alinean }\

0 & = (4t - t^2) (1200) - (4 - 2t) (1200t + 200)

4800t - 1200t^2 - 4800t - 800 + 2400t^2 + 400t \\

& =-800 + 400t + 1200t^2,

Los \end {alinean }\

</matemáticas>

y así

:

0 = 3t^2 + t - 2 = (3t-2) (t+1).

</matemáticas>

Recogemos la única solución t [0, 2]: t = 2/3. Esto en efecto es mínimo (y no un máximo) ya que el coste por unidad de tiempo tiende al infinidad ya que el t tiende al cero, significando que el coste disminuye como t aumentos, hasta el punto 2/3 donde comienza a aumentar.

Véase también



Buscar