The Rise of Machine Learning (ML): Cómo usar inteligencia artificial en SIG

Machine Learning e Inteligencia Artificial en SIG

Probablemente haya oído hablar del aprendizaje automático (ML). Pero no está exactamente seguro de cómo usarlo en el contexto de GIS.

Simplemente, el aprendizaje automático tiene sentido a partir de patrones de búsqueda de datos ruidosos que nunca pensó que existían. En otras palabras, su software que escribe software.

En lugar de aplicar una función preconstruida, ML gana experiencia a través de condiciones vistas repetidas y crea un modelo para aplicar en nuevas situaciones.

Por ejemplo, Google podría usar la clasificación bayesiana para filtrar correos electrónicos no deseados. Alternativamente, Facebook podría usarlo para el reconocimiento facial e identificar automáticamente las caras en las imágenes. Y ML puede incluso representar a Nicholas Cage en todas las películas que se hayan hecho.

Pero, ¿cómo podemos usarlo en el contexto de GIS? Exploremos esta pregunta hoy. Recuerde que si está realmente interesado en comenzar con la IA, aquí hay algunos cursos de certificación de aprendizaje automático para ayudarlo a comenzar.

Tipos de aprendizaje automático (ML)

Las dos grandes categorías de aprendizaje automático son supervisadas y no supervisadas. Y ambos pueden aplicarse a las aplicaciones GIS de varias maneras. Primero, ¿cuál es la diferencia entre los dos?

El APRENDIZAJE SUPERVISADO es simplemente ajustar datos a una función para la predicción. Por ejemplo, si traza millones de puntos de muestra en un gráfico, puede ajustar una línea para aproximar una función.

El APRENDIZAJE NO SUPERVISADO reconoce cuáles son los datos usando patrones de datos no etiquetados. Por ejemplo, toma millones de imágenes y las pasa por un algoritmo de entrenamiento. Después de billones de operaciones de álgebra lineal, puede tomar una nueva imagen y segmentarla en grupos.

Lo más importante es que el aprendizaje automático se trata de resolver un problema de manera óptima. Por lo tanto, aprende automáticamente por sí mismo y mejora con la experiencia.

Últimamente, GIS está aplicando inteligencia artificial en áreas como clasificación, predicción y segmentación. Dos de los frameworks más populares son TensorFlow y PyTorch.

1. Clasificación de imágenes (máquina de vectores de soporte)

Cuando miras una imagen satelital, no siempre es fácil saber si estás mirando árboles, pasto o caminos o edificios. Así que imagina lo difícil que sería para una computadora saberlo.

Support Vector Machine (SVM) es una técnica de aprendizaje automático que toma datos clasificados y analiza los extremos. A continuación, dibuja una línea límite de decisión basada en los datos llamada hiperplano. Y los puntos de datos contra los que empuja el margen del hiperplano son los vectores de soporte.

Y los vectores de soporte son lo importante porque son los puntos de datos que están más cerca de las clases opuestas. Debido a que estos puntos son los únicos considerados, todos los demás puntos de entrenamiento pueden ignorarse en el modelo. Esencialmente, alimenta muestras de entrenamiento SVM de árboles y césped. Con base en estos datos de entrenamiento, construye el modelo generando un límite de decisión propio.

Ahora, los resultados de esta clasificación supervisada no son perfectos y los algoritmos todavía tienen mucho más que aprender. Todavía tenemos que trabajar en elementos como carreteras, humedales y edificios. A medida que los algoritmos obtengan más datos de entrenamiento, eventualmente mejorarán para clasificar en cualquier lugar.

2. Segmentación y agrupamiento de imágenes con K-means

Con mucho, el algoritmo K-means es uno de los métodos más populares para agrupar datos. En la segmentación K-means, agrupa los datos no etiquetados en el número de grupos representados por la variable K .

Este enfoque de aprendizaje no supervisado asigna iterativamente cada punto de datos en una de las agrupaciones K en función de la similitud de las características. Por ejemplo, la similitud puede basarse en las características espectrales y la ubicación.

En la clasificación no supervisada, el algoritmo k-means primero segmenta la imagen para su posterior análisis. A continuación, a cada grupo se le asigna una clase de cobertura terrestre.

Sin embargo, GIS puede usar la agrupación en clústeres de otras formas únicas. Por ejemplo, los puntos de datos podrían representar un delito y es posible que desee agrupar los puntos calientes y bajos de delincuencia. Alternativamente, es posible que desee segmentar según las características socioeconómicas, de salud o ambientales (como la contaminación).

3. Predicción usando Empirical Bayesian Kriging (EBK)

Como sabrá, la interpolación de kriging predice valores desconocidos según el patrón espacial. Estima pesos basados ​​en el variograma. La calidad de la superficie estimada se refleja en la calidad de los pesos. Más específicamente, desea ponderaciones que proporcionen una predicción imparcial y la varianza más pequeña.

A diferencia del kriging, que se ajusta a un modelo completo para un conjunto de datos completo, el kriging de EBK simula al menos cien modelos locales mediante subconjuntos de todo el conjunto de datos. Debido a que el modelo puede transformarse localmente para ajustarse a cada semivariograma individual usando la metodología kriging, supera el desafío de la estacionariedad.

En Empirical Bayesian Kriging (EBK), predice una y otra vez usando una variedad de simulaciones hasta cien veces. Cada semivariograma varía de los demás. Al final, mezcla todos los semivariogramas para obtener una superficie final. No se puede personalizar como se puede con el kriging tradicional.

Finalmente, genera lo que cree que es la mejor solución. Como un análisis de Monte Carlo, lo ejecuta repetidamente en segundo plano. Si es un proceso aleatorio, deja que el proceso aleatorio se agote más de mil veces. Ve las tendencias en los datos resultantes y los usa para justificar su selección. Esta es la razón por la que EBK casi siempre predice mejor que el kriging directo.

El proceso de aprendizaje profundo y capacitación para Big Data

Ya sea que esté en SIG o en otro campo, el aprendizaje automático está de moda en estos días. Se trata de destilar grandes conjuntos de datos. Porque si puede dejar que la computadora detecte las características, le mostrará cosas que nunca ha notado.

Debido a que hay demasiados datos, puede descubrir patrones inherentes a partir de ellos. Y el resultado es una red neuronal entrenada con solo un conjunto de valores ponderados.

Cuando entrena big data, es cuando va a necesitar toda la potencia de fuego que pueda obtener. Pero una vez que haya entrenado el modelo, es solo un modelo con un conjunto de pesos en un archivo. Y es por eso que el aprendizaje automático es una forma de inteligencia artificial porque puede entrenar sus datos y luego aplicarlos a algo completamente nuevo y predecir qué es. es.

En general, GIS utiliza el aprendizaje automático para la predicción, clasificación y agrupación. AI y ML todavía son campos en crecimiento con una gran cantidad de marcos que aún se desarrollan a diario.

Ir arriba