Kriging Interpolation: la predicción es fuerte en este

Esculpa un modelo de predicción legendario con Kriging

Es hora de esculpirnos un modelo de predicción de las edades. La predicción es fuerte en kriging.

En su camino hacia la creación de una superficie de predicción precisa, deberá comprender algunos conceptos clave antes incluso de iniciarse en kriging.

¿Cuáles son estos conceptos?

Lea a continuación para obtener un conocimiento básico paso a paso de kriging.

Comencemos con algunos conceptos básicos.

Para comprender realmente el kriging, debe saber qué es la interpolación. Como con toda interpolación, estaban prediciendo valores desconocidos en otros lugares.

Con un método de interpolación como la ponderación de distancia inversa, está haciendo predicciones sin decir qué tan seguro está.

Aquí hay un ejemplo:

Predecimos el punto púrpura tomando una distancia ponderada inversa de los tres puntos de entrada más cercanos (los valores de 12, 10 y 10). Según la distancia, calculamos qué tan lejos está cada punto de entrada y obtenemos un valor de 11.1.

((12/350) + (10/750) + (10/850)) / ((1/350) + (1/750) + (1/850)) = 11,1

Así es exactamente como funciona la interpolación determinista . Simplemente, utiliza una función predefinida y es lo que es .

Pero no te dice qué tan seguro estás.

¿Qué es la interpolación Kriging?

Si un meteorólogo hace un pronóstico diciendo que va a llover mañana, ¿qué tan seguro estás de que va a llover?

En otras palabras:

En lugar de solo decir la cantidad de lluvia en lugares específicos, kriging también le dice la probabilidad de cuánta lluvia en un lugar específico.

Utiliza sus datos de entrada para construir una función matemática con un semivariograma, crea una superficie de predicción y luego valida su modelo con validación cruzada.

La geoestadística no solo proporciona una superficie de predicción óptima, sino que también brinda una medida de confianza de la probabilidad de que esa predicción sea cierta.

Mientras tanto, kriging puede generar superficies de predicción y superficies que describen qué tan bien predice su modelo:

PREDICCIÓN: Esta superficie recta predice los valores de la variable que está kriging.
ERROR DE PREDICCIÓN: Representa el error estándar. Obtiene un estándar de error más alto cuando no hay tantos datos de entrada.
PROBABILIDAD: La superficie de probabilidad se destaca cuando supera un umbral.
CUANTIL: Esta superficie representa los mejores o peores escenarios como un percentil 99.

La clave del Kriging es el semivariograma

Kriging se basa en el semivariograma. En términos simples, los semivariogramas cuantifican la autocorrelación porque representan gráficamente la varianza de todos los pares de datos según la distancia.

Lo más probable es que las cosas más cercanas estén más relacionadas y tengan una pequeña semivarianza. Mientras que las cosas lejanas están menos relacionadas y tienen una semi-varianza alta.

Pero a cierta distancia (rango), la autocorrelación se vuelve independiente. Donde esa variación se nivela, se llama (umbral) . Esto significa que ya no existe ninguna autocorrelación o relación espacial entre la cercanía de sus puntos de datos. Este concepto es la Primera Ley de Geografía de Toblers.

Nuevamente, el propósito aquí es ajustar una superficie como un polinomio que modela la tendencia general a gran escala. Luego, alrededor de esa tendencia, tenemos variabilidad con residuos donde entra el kriging.

Según los resultados de su semivariograma, puede seleccionar un semivariograma esférico, circular, exponencial, gaussiano o lineal. Alternativamente, si puede hacer una justificación intelectual para un modelo matemático, entonces elija ese.

Incluso antes de comenzar, verifique sus datos

Incluso antes de comenzar con el kriging, sus datos deben ajustarse a estos criterios antes del kriging ordinario.

Kriging es la técnica de interpolación óptima si sus datos cumplen ciertos criterios. Pero si no cumplen con esos criterios, puede masajearlo o elegir una técnica de interpolación completamente diferente.

  • Sus datos deben tener una distribución normal
  • Los datos deben ser estacionarios.
  • Tus datos no pueden tener ninguna tendencia.

Los siguientes pasos son formas de verificar sus datos para ver si cumplen con estos criterios. Primero, sugerimos trazar sus puntos y simbolizarlos de menor a mayor. En nuestro ejemplo, usamos muestras de humedad del suelo tomadas en un campo agrícola:

Suposición 1. Sus datos tienen una distribución normal

Si bien no estamos explorando las propiedades espaciales en esta prueba, solo estamos verificando que los valores se distribuyan de manera bastante normal. En otras palabras, ¿los valores de sus datos se ajustan a la forma de una curva de campana?

Una de las formas de explorar esto es usando un histograma. En ArcGIS, haga clic en Análisis geoestadístico > Explorar datos > Histograma.

En este punto, puede verificar el histograma en busca de valores atípicos y cuánto se parece a una curva de campana. En nuestro caso, parece que tiene una distribución normal bastante buena.

Alternativamente, puede verificar sus datos con un gráfico QQ normal. Un gráfico QQ normal compara cómo se alinean sus datos con los datos distribuidos normalmente. Si todos los puntos tienen una distribución perfectamente normal, todos sus puntos caerían en la línea 45. En nuestro caso, los datos siguen una línea recta.

¿Qué sucede si sus datos no tienen una distribución normal?

En este caso, deberá aplicar una transformación como Log o Arcsin hasta que se normalice. En lugar de seleccionar su propia transformación, puede hacer una transformación de partitura normal que prácticamente hace mucho del trabajo por usted. La transformación de puntaje normal es tan poderosa que ahora es el método predeterminado como kriging simple en ArcGIS. Explicamos esto con más detalle a continuación.

Suposición 2. Sus datos son estacionarios

¿Qué significa que sus datos tienen que ser estacionarios?

Significa que la variación local no cambia en diferentes áreas del mapa. Por ejemplo, 2 puntos de datos separados por 5 metros en diferentes ubicaciones deberían tener diferencias similares en su valor medido. La varianza es bastante constante en diferentes áreas del mapa. Kriging no es óptimo para cambios abruptos y líneas de ruptura.

Puede verificar la estacionariedad de sus datos con un mapa de Voronoi simbolizado por entropía (variación entre vecinos) o desviación estándar y buscar aleatoriedad. En ArcGIS, haga clic en Análisis geoestadístico > Explorar datos > Mapa de Voronoi.

LEER MÁS: Cómo dibujar un diagrama de Voronoi con polígonos de Thiessen

En nuestro caso, vemos algunas pequeñas cantidades de agrupamiento. En general, para la entropía y la desviación estándar, los mapas de Voronoi muestran que el conjunto de datos se ve adecuadamente estacionario.

¿Qué haces si tus datos no son estacionarios?

Empirical Bayesian Kriging (EBK) puede ayudar al tratar la varianza local por separado. En lugar de que la varianza sea similar en toda su extensión, EBK realiza kriging como un proceso subyacente separado en diferentes áreas. Todavía realiza kriging, pero se hace localmente.

Suposición 3. Sus datos no tienen tendencias

Las tendencias son cambios sistemáticos en los datos en toda un área de estudio. Podemos comprobar el análisis de tendencias con la herramienta ESDA. En ArcGIS, haga clic en Análisis geoestadístico > Explorar datos > Análisis de tendencias.

La línea verde muestra la tendencia en dirección este-oeste, y la línea azul representa la tendencia en dirección norte-sur. Generalmente, tenemos valores más altos de humedad del suelo en el centro. Pero no hay suficiente tendencia en nuestros datos como para que sea necesario eliminarlos.

¿Qué pasa si sus datos tienen tendencias sistemáticas?

Aunque tener grandes tendencias en toda su área de estudio puede ser una razón para cambiar los métodos de interpolación por completo, la herramienta de eliminación de tendencias puede ayudar a que el siguiente análisis no se vea influenciado por esa tendencia en sus datos.

Ejemplo de kriging en ArcGIS

Después de explorar sus datos para los criterios anteriores, puede hacer clic en Análisis de estadísticas geográficas > Asistente de estadísticas geográficas.

Y ahora empieza de verdad la diversión, dijo con sarcasmo.

Paso 1. Seleccione Kriging/Co-Kriging

Ahora que tiene abierto el Asistente de estadísticas geográficas, kriging está bajo los métodos de estadísticas geográficas. Como se mencionó anteriormente, esto se debe a que construye su superficie de predicción óptima con un semivariograma y puede estimar una medida de confianza de la probabilidad de que esa predicción sea cierta.

Observe cómo si selecciona una sola entrada, es simplemente kriging . Pero cuando agrega una segunda variable, de repente se convierte en co-kriging .

Si tiene 2 o más variables relacionadas con cómo cambia la precipitación en áreas montañosas, entonces puede agregar datos de elevación como una covariable a las cantidades de lluvia. En este caso, puede mejorar la predicción con información secundaria.

Paso 2. Elija el tipo de Kriging

Ahora, demos un paso atrás por un segundo para entender qué significan todas las opciones. Hay bastante que absorber en este paso.

El kriging ordinario era el predeterminado en ArcGIS 10.0. Ahora, debido a la transformación de puntuación normal, el kriging simple es el valor predeterminado. En particular, el kriging simple utiliza una transformación de puntaje normal que transforma sus datos en una distribución normal estándar.

Como se mencionó anteriormente, este es uno de los criterios esenciales para realizar kriging. Para los usuarios básicos, su mejor opción es adoptar el enfoque de kriging simple. Pero existen otros tipos de kriging más complicados:

KRIGING UNIVERSAL combina análisis de superficie de tendencia (deriva) con kriging ordinario al tener en cuenta las tendencias
INDICATOR KRIGING realiza kriging ordinario con datos binarios (0 y 1) como celdas urbanas y no urbanas.
KRIGING DE PROBABILIDAD utiliza datos binarios (similares al kriging de indicadores) y estima puntos desconocidos para una serie de puntos de corte.

Por último, puede configurar manualmente el tipo de transformación y la eliminación de tendencias en este paso. Por ejemplo, si desea cambiar su transformación a registro, aquí es cuando puede realizar este cambio.

Paso 3. Modelo de datos con un semivariograma

En este ejemplo, usamos kriging ordinario con fines de demostración. El asistente de estadísticas geográficas genera un semivariograma con cruces azules que muestra la variación promedio para cada par de puntos.

El tamaño de retraso es el tamaño de una clase de distancia en la que se agrupan pares de ubicaciones. Como regla general, puede multiplicar el tamaño del retraso por el número de retrasos para que sea igual a la mitad de la distancia más grande entre todos los puntos. Si sus puntos no están agrupados, puede ejecutar la herramienta Vecino más cercano promedio que le indica la distancia promedio entre puntos.

ArcMap ha agregado la funcionalidad para optimizar todos estos parámetros para usted. Cuando hace clic en el botón optimizar, encontrará el valor de cada parámetro que da como resultado el error cuadrático medio más pequeño. Eso sería mucho ensayo y error para que el usuario probara cada escenario. En última instancia, generalmente es mejor optar por el modelo de semivariograma que el software considere mejor.

Para nuestra área de estudio, así es como se ve el semivariograma:

Paso 4. Asignar el modelo con peso Kriging

Una vez que esté satisfecho con su semivariograma ajustado, el asistente brinda una superficie de vista previa con aún más parámetros para personalizar la salida. Lo que hace kriging es predecir las respuestas en cada ubicación utilizando un promedio ponderado con los vecinos más cercanos. Pero primero, debe establecer la cantidad de puntos (máximo y mínimo) para usar en su radio de búsqueda.

A pesar de tanto hablar sobre la importancia de los semivariogramas en kriging, este paso influye enormemente en la salida de su mapa. Si cambia cualquiera de estos parámetros, realmente puede alterar la apariencia de la superficie.

Si selecciona uno de los tipos de sectores de corte, esto asegura que habrá puntos incluidos para estimar en cada uno de esos cortes. Por ejemplo, si usa un pastel de cuatro porciones y establece sus vecinos en 5, entonces cada porción usará 5 puntos (un total de 20) para las estimaciones locales. Como no existe una fórmula de conjunto perfecta, la clave es desplazarse y verificar los valores predichos para ver cómo cree que debería verse la salida.

Paso 5. Comprobar los resultados de la validación cruzada

El paso de validación cruzada para kriging toma uno de sus puntos de datos de entrada y lo descarta del conjunto de datos. Usando todos los puntos restantes, ejecuta la predicción de regreso a esa ubicación. Una vez más, sabe cuál es el valor real, este proceso usa todo lo que queda para predecir ese valor.

Para la validación cruzada, itera a través de todos sus puntos de entrada hasta que se completa. Luego, crea esta tabla de resumen de residuos que compara los valores reales con los valores predichos de sus modelos. Lo que muestra esta tabla es cuán robusto es realmente su modelo.

Entonces, ¿qué tan cerca están los valores verdaderos de los valores predichos? En otras palabras, ¿qué tan bien se ajusta su modelo a los datos? Para poner todo esto en perspectiva, verifique su raíz cuadrática media estandarizada, ya que debe estar cerca de 1. Además, el error cuadrático medio de la raíz debe ser lo más pequeño posible.

La capa geoestadística dinámica

Debido a que la salida es una capa de estadísticas geográficas, es dinámica, lo que significa que puede cambiar su tipo de salida como predicción, errores de predicción, probabilidad o cuantil. O incluso puede volver a la capa de estadísticas geográficas y cambiar los parámetros si no le gusta el resultado optimizado.

Hay una ciencia y un arte en kriging.

No es solo cómo elige su modelo de un semivariograma, sino también cómo configura la cantidad de contenedores y otras configuraciones. Este es el arte del kriging.

Cuando representa su superficie de kriging, como elegir el número de intervalos, puede dar una impresión diferente en los resultados. Si bien más clases brindan más detalles, el método de clasificación de datos (como cuantil o intervalo igual) organiza sus datos de manera diferente.

La predicción es fuerte en Kriging

La predicción espacial implica algún componente de aleatoriedad. Esto es crucial con las geoestadísticas cuando se hacen inferencias sobre un conjunto de datos.

Los pesos de kriging se estiman a partir del variograma. Más específicamente, se deriva del modelo que elija. La calidad de la superficie estimada se refleja en la calidad de los pesos. Quiere pesos que proporcionen una predicción imparcial y la varianza más pequeña.

En otras palabras, kriging encuentra el patrón espacial. Luego predice valores desconocidos basados ​​en ese patrón espacial. Con estas predicciones, kriging genera una medida de error o incertidumbre. Esto significa que puede estimar la confianza en la superficie de predicción de que son verdaderos, no por casualidad aleatoria.

Porque no solo personaliza su función matemática para construir una, sino que también usa el poder del análisis estadístico, es decir, el semivariograma.

Kriging es un método de geoestadística que predice el valor en un área geográfica dado un conjunto de medidas. Se utiliza en minería, suelos, geología y ciencias ambientales.

Ninguna metodología única funciona para todos. En lo que respecta a sus datos, solo usted puede decidir cuáles son esas configuraciones y cuál es la mejor manera de generar una superficie de predicción.

Ir arriba