Geoestadística, Análisis de Datos Exploratorios, Minería, Recursos Minerales, Distribución Normal, Distribución Lognormal, Histograma, Variograma, Estimación de Recursos.
Este documento ofrece una guía completa sobre el Análisis de Datos Exploratorios (EDA) en el contexto de la geoestadística aplicada a la exploración y evaluación de recursos minerales. Con un enfoque práctico, el documento explica las diferentes herramientas y técnicas estadísticas utilizadas para comprender, visualizar y analizar datos espaciales, como leyes de minerales, con el objetivo de tomar decisiones informadas en la planificación minera.
Se explora la importancia de identificar las poblaciones geológicas, determinar la estacionaridad de los datos, asegurar la calidad de los datos y familiarizarse con la geología del yacimiento. Se describen en detalle métodos estadísticos univariables y bivariables, incluyendo histogramas, gráficos de probabilidad, diagramas de caja, curvas tonelaje-ley, gráficos de dispersión y nubes de correlación. Se explican conceptos clave como la distribución normal, la distribución lognormal, los cuantiles, los intervalos de confianza y el coeficiente de correlación.
Asimismo, se introduce la noción de función aleatoria y su importancia en el modelado de la continuidad espacial de las variables regionalizadas. Se presentan las generalidades del uso de programas geoestadísticos como GSLIB y se propone un ejercicio práctico para aplicar los conceptos aprendidos.
Contenido:
- Objetivos del Estudio Exploratorio de Datos:
- Desplegar los datos en diferentes formas para su visualización e interpretación.
- Comprender los datos, diferenciando entre poblaciones estadísticas y poblaciones geológicas.
- Seleccionar las poblaciones geológicas relevantes para el estudio.
- Decidir la estacionaridad o identificar la deriva en los datos.
- Asegurar la calidad de los datos.
- Resumir la información contenida en los datos.
- Familiarizarse con los datos y la geología del yacimiento.
- Despliegue de Datos:
- Utilización de plantas y secciones para el análisis de datos.
- Visualización en 3-D para una mejor interpretación de los datos.
- Creación de mapas codificados con color para representar la distribución espacial de las variables.
- Histogramas:
- Despliegue de la frecuencia de ocurrencia de los datos en clases.
- Construcción de histogramas acumulados para visualizar la frecuencia acumulada bajo un valor de corte.
- Interpretación de histogramas para obtener estadísticas de las muestras, como la media, la varianza, la mediana y el rango intercuartil.
- Uso de la escala logarítmica para visualizar mejor los datos.
- Identificación de valores extremos y su impacto en las estadísticas.
- Determinación de cuantiles a partir del gráfico de frecuencia acumulativa.
- Estadísticas Básicas:
- Medidas de Posición: Media, mediana, moda, mínimo, máximo, rango, cuartil inferior y superior, deciles, percentiles y cuantiles.
- Medidas de Dispersión: Varianza, desviación estándar, rango intercuartil y coeficiente de variación.
- Medidas de Forma: Coeficiente de asimetría (skewness) y coeficiente de aplanamiento (kurtosis).
- Distribución Normal:
- Propiedades de la distribución normal: definida por su media y varianza, descripción matemática concisa, favorable para enfoques teóricos de estimación.
- Función de densidad de probabilidad.
- Estandarización para obtener la distribución normal estándar N(0,1).
- Función de distribución acumulada.
- Intervalos de confianza.
- Distribución Lognormal:
- Definición de la distribución lognormal: los logaritmos de los datos están distribuidos como una normal.
- Propiedades de la distribución lognormal: común en Ciencias de la Tierra, relación con la distribución normal, favorable para enfoques teóricos de estimación.
- Función de densidad de probabilidad.
- Gráfico de Probabilidad:
- Verificación de modelos de distribución: línea recta en escala aritmética (distribución normal) o en escala logarítmica (distribución lognormal).
- Detección de valores extremos y anómalos.
- Identificación de la presencia de dos poblaciones, confirmada con información geológica.
- Comparación de distribuciones separando por algún atributo geológico.
- Agrupación de unidades según su distribución, siempre y cuando tenga sentido geológico.
- Otras Herramientas de Análisis Univariable:
- Diagrama de Caja (box-plot): resumen de la forma y dispersión de una distribución, comparación de distribuciones para diferentes categorías.
- Curvas Tonelaje-Ley: representación de la proporción de tonelaje y la ley media en función de una ley de corte, cálculo de la cantidad de metal.
- Valores Extremos (Outliers):
- Definición de valores extremos: observaciones que no pertenecen a la misma población que el resto de los datos.
- Impacto de los valores extremos en las estadísticas básicas y en el análisis de regresión.
- Estrategias para manejar valores extremos: eliminarlos, clasificarlos en poblaciones separadas, usar estadísticas robustas, transformarlos, bajarlos a un máximo razonable.
- Recorte de Atípicos:
- Metodologías para el recorte de atípicos: ajuste al hueco del histograma, corte en un punto de inflexión del gráfico de probabilidad, análisis de correlación en indicadores down-the-hole.
- Gráfico Q-Q (Q-q Plot):
- Comparación de distribuciones: muestras de RC vs. DDH, compósitos vs. valores simulados.
- Interpretación del gráfico Q-Q: línea de 45° indica distribuciones iguales, desplazamiento de la línea indica diferentes medias, inclinación diferente a 45° indica diferentes varianzas, carácter no lineal indica diferentes formas en el histograma.
- Gráfico de Dispersión:
- Análisis bivariable: pares de datos co-localizados.
- Ejemplos de uso: ley estimada vs. ley verdadera, leyes de diferentes elementos, ley vs. profundidad.
- Nube de Correlación Diferida:
- Relación entre dos valores de la misma variable separados por una distancia.
- Coeficiente de correlación como medida de la dependencia lineal: varía entre -1 y +1, sensible a valores aberrantes.
- Definición de Unidades Geológicas:
- Importancia de definir volúmenes con comportamiento homogéneo de la variable en estudio.
- Concepto de estacionaridad: datos dentro de una unidad geológica pertenecen a la misma población, propiedades estadísticas constantes.
- Incorporación de derivas: modelado de cambios sistemáticos en las propiedades.
- Modelos geológicos: combinación de características geológicas como litologías, alteraciones y mineralización.
- Unidades geológicas para estimación de leyes: combinación de poblaciones litológicas, de alteración y mineralización.
- Agrupación de datos con características geológicas relevantes, número de datos razonable y consistencia espacial.
- Dificultades en la definición de unidades: extensión desconocida, tipos de límites, incoherencias entre datos y modelo geológico, discretización en bloques.
- Análisis de Contacto:
- Estudio del comportamiento de la ley media al cruzar una frontera geológica.
- Impacto del tipo de frontera en las leyes estimadas.
- Incertidumbre en la Extensión de Unidades Geológicas:
- Modelado de superficies y volúmenes por interpolación/extrapolación a partir de datos de sondajes.
- Posibles errores geométricos debido a la suavidad de las fronteras modeladas.
- Verificación de la consistencia entre unidades modeladas y datos disponibles.
- Sondajes adicionales para reducir la incertidumbre.
- Consideración de varios escenarios, incluyendo la probabilidad de pertenencia a cada unidad.
- Unidades Definidas por Rangos de Ley:
- El método de «isoleyes» define unidades geológicas por rangos de leyes.
- Limitaciones del método de isoleyes: falta de sentido geológico, fronteras duras artificiales, sensibilidad a los rangos de leyes escogidos.
- Uso del método de isoleyes para definir la geometría de la zona de estudio.
- Modelo Probabilístico:
- Interpretación del valor de la variable regionalizada como una realización de una variable aleatoria.
- Inferencia sobre la variable aleatoria a partir de una sola realización.
- Interpretación de la distribución de probabilidades en cada punto.
- Definiciones de variable aleatoria, función aleatoria, variable continua y variable discreta.
- Análisis Estadístico:
- Inferencia de parámetros de la población a partir de una muestra.
- Importancia de la representatividad espacial y la cantidad de datos.
- Caracterización de la variable aleatoria por su función de distribución acumulada y función de densidad de probabilidad.
- Momentos de una población: media (esperanza) y varianza.
- Propiedades de la esperanza y la varianza.
- Noción de Función Aleatoria:
- Definición de función aleatoria: conjunto de variables aleatorias en un dominio.
- La variable regionalizada es una realización de la función aleatoria.
- Importancia de modelar la correlación entre variables aleatorias para representar la continuidad espacial.
- Ejemplos de diferentes distribuciones espaciales con diferentes correlaciones entre variables aleatorias.
- Aplicación con GSLIB:
- Generalidades del uso de programas geoestadísticos.
- Ejemplo del programa HISTPLT para graficar histogramas.
- Creación y edición de archivos de parámetros.
- Ejercicio Práctico:
- Aplicación de los conceptos aprendidos utilizando los programas HISTPLT, LOCMAP, SCATPLT, SCATPLT-EQ, GTCURVE, LOCXYZ, PROBPLT y QPPLT.
- Análisis de una base de datos de sondajes de exploración.
Autor:
Dr. Julián M. Ortiz
Fecha de Publicación:
Universidad de Chile
Link de descarga: Aquí