¿Qué es un semivariograma?
La primera ley de la geografía de Tobler establece que todo está relacionado con todo lo demás, pero las cosas cercanas están más relacionadas que las cosas distantes.
En el caso de un semivariograma, las cosas más cercanas son más predecibles y tienen menos variabilidad. Mientras que las cosas distantes son menos predecibles y están menos relacionadas.
Por ejemplo, es más probable que el terreno a un metro por delante de usted sea similar que a 100 metros de distancia.
Como aprenderá, el semivariograma representa este concepto de importancia crítica de cómo los valores de muestra (contaminación, elevación, ruido, etc.) varían con la distancia. Además, le mostraremos cómo se relaciona esto con la interpolación kriging.
Muestras de humedad del suelo
Nuestro ejemplo contiene 73 muestras de humedad del suelo en un campo de 10 acres. En la esquina noroeste, las muestras son mucho más húmedas y con mayor contenido de agua. Pero en el cuadrante este, son mucho más secos como los codificados por colores en la imagen de abajo.
- ¿Qué tan predecibles son los valores de un lugar a otro?
- ¿Son los valores conocidos más cercanos entre sí más similares que los valores más separados?
Podemos describir esta idea con dependencia estadística o autocorrelación. Además de esto, la autocorrelación espacial (las cosas más cercanas son más similares que las cosas más alejadas) proporciona información valiosa para la predicción.
Cómo funcionan los semivariogramas
Para comprender la dependencia espacial, puede estimarla con un semivariograma. Los semivariogramas toman 2 ubicaciones de muestra y llaman h a la distancia entre ambos puntos.
En el eje x, traza la distancia (h) en retrasos, que son solo distancias agrupadas. Tomando cada conjunto de 2 ubicaciones de muestra, mide la variación entre la variable de respuesta (contenido de agua en el suelo) y la representa en el eje y.
Dependiendo del observador, los semivariogramas parecen un gran lío de puntos. Por ejemplo, nuestro diagrama de humedad del suelo se ve así:
Pero realmente puede hacer un trabajo de detective seleccionando puntos individuales. Cuando toma este único punto en el semivariograma:
Puedes ver qué 2 puntos representan en el mapa. Esto tiene sentido porque están muy lejos el uno del otro. De ahí su posición en el extremo derecho del semivariograma. En realidad es este punto el que destacamos a continuación:
También tienen una gran diferencia con respecto al valor medio en esa distancia de retraso en particular. Se posiciona más alto en el eje y si la semivarianza es alta. Como probablemente haya notado, la semivarianza es menor a distancias más cercanas y aumenta con distancias de retraso mayores.
Recuerda siempre:
Estamos analizando todas las distancias entre 2 muestras y su variabilidad. Un semivariograma considera todos los puntos y su distancia con varianza. Por eso los semivariogramas tienen tantos puntos. Aquí hay un subconjunto del conjunto de datos anterior para ver todos los diferentes conjuntos de puntos que podemos trazar en un semivariograma.
¿Qué son el rango, el umbral y la pepita en los semivariogramas?
En puntos de muestra con distancias cercanas, la diferencia de valores entre puntos tiende a ser pequeña. En otras palabras, la semivarianza es pequeña.
Pero cuando las distancias de los puntos de muestra están más lejos, es menos probable que sean similares. Esto significa que la semivarianza se vuelve grande.
A medida que aumenta la distancia desde los puntos de muestra, ya no existe una relación entre los puntos de muestra. Su varianza comienza a aplanarse y los valores de la muestra no están relacionados entre sí.
SILL: El valor en el que el modelo se aplana por primera vez.
RANGO: La distancia a la que el modelo se aplana por primera vez.
NUGGET: el valor en el que el semivariograma (casi) intercepta el valor y.
Cuando tiene dos puntos de muestra en la misma ubicación, puede esperar tener el mismo valor, por lo que la pepita debe ser cero. A veces no lo hacen y esto agrega aleatoriedad. Pero antes de que el gráfico comience a nivelarse, estos valores se autocorrelacionan espacialmente.
Como era de esperar, cuando aumenta la distancia, aumenta la semivarianza. Hay menos pares de puntos separados por distancias lejanas, por lo tanto, hay menos correlación entre los puntos de muestra.
Pero como se indica en el semivariograma con la solera y el rango, comienza a alcanzar su nivel asintótico plano. Aquí es cuando intenta ajustar una función para modelar este comportamiento.
Función y modelos matemáticos
Seleccione el tipo de modelo según cómo se ajuste a los datos porque proporcionará una función matemática a la relación entre valores y distancias. Usamos funciones que se ajustan mejor, como exponencial, lineal, esférica y gaussiana.
Idealmente, está tratando de reducir su valor de R-cuadrado, lo mejor posible. Sin embargo, cuando comprende cómo se comportan los fenómenos con la distancia, puede elegir mejor qué modelo usar.
Por ejemplo, estas son las funciones matemáticas que puede aplicar a los semivariogramas:
1. Modelos lineales
Un modelo lineal significa que la variabilidad espacial aumenta linealmente con la distancia. Es el tipo de modelo más simple sin meseta, lo que significa que el usuario tiene que seleccionar arbitrariamente el alféizar y el rango.
2. Modelos esféricos
El modelo esférico es uno de los modelos más comunes que usamos en el modelado de variogramas. Es una ecuación cuadrática modificada donde la dependencia espacial se aplana como el alféizar y el rango.
3. Modelos Exponenciales
El modelo exponencial se parece al modelo esférico en que la variabilidad espacial llega al umbral gradualmente. La relación entre dos puntos de muestra decae gradualmente, mientras que a una distancia de dependencia espacial infinita se disipa.
4. Modelos gaussianos
La función gaussiana utiliza una curva de distribución de probabilidad normal. Este tipo de modelo es útil cuando los fenómenos son similares a distancias cortas debido a su ascenso progresivo en el eje y.
5. Modelos circulares
Este tipo de modelo de predicción utiliza una función circular para ajustar la variabilidad espacial en un semivariograma. Se parece a la función del modelo esférico donde la dependencia espacial se desvanece en su nivel asintótico.
Semi-variograma: Nugget, Range y Sill
Los semivariogramas proporcionan un paso preliminar útil para comprender la naturaleza de los datos.
Cada fenómeno tiene su propio semivariograma y su propia función matemática. El usuario descubre la relación entre los valores y las distancias y luego elige el modelo que mejor se ajusta.
Si bien los semivariogramas son útiles para comprender la variación con la distancia, el modelo que elija de los semivariogramas suele incluirse en kriging . Debido a que este tipo de técnica de interpolación utiliza el modelo matemático del semivariograma, es una de las mejores formas de predicción en la actualidad.
Esto se debe a que el modelo de variograma influye en la predicción de esos valores desconocidos durante la interpolación de kriging.
para que sirve un semivariograma
El semivariograma es una estadística que evalúa la disminución promedio de la similitud entre dos variables aleatorias a medida que aumenta la distancia entre las variables, lo que lleva a algunas aplicaciones en el análisis exploratorio de datos.
¿Cuáles son las partes principales de un semivariograma?
¿Qué son el rango, el umbral y la pepita en los semivariogramas?
- SILL: El valor en el que el modelo se aplana por primera vez.
- RANGO: La distancia a la que el modelo se aplana por primera vez.
- NUGGET: El valor en el que el semivariograma (casi) intercepta el valor y.
¿Cómo hago un Semivariograma en Arcgis?
Para crear un semivariograma empírico, determine la diferencia al cuadrado entre los valores para todos los pares de ubicaciones. Cuando estos se grafican, con la mitad de la diferencia al cuadrado en el eje y y la distancia que separa las ubicaciones en el eje x, se denomina nube de semivariograma.
¿Qué significa umbral en un variograma?
El umbral es la varianza total donde el variograma empírico parece estabilizarse y es la suma de la pepita más los umbrales de cada estructura anidada. Los puntos del variograma por encima del umbral indican una correlación espacial negativa, mientras que los puntos por debajo del umbral indican una correlación positiva.