Este documento presenta una guía práctica sobre el Análisis Exploratorio de Datos (EDA) en geoquímica, una herramienta fundamental para la exploración minera. Se explica la importancia del EDA para comprender la distribución de las leyes, identificar valores atípicos y establecer umbrales de anomalías. Se describen las herramientas estadísticas clave del EDA, incluyendo histogramas, diagramas de dispersión, gráficos de caja y gráficos de cuantiles. Se ilustra el proceso de validación, filtrado e interpretación de datos geoquímicos, utilizando ejemplos de proyectos mineros.
Análisis Exploratorio de Datos (EDA), Geoquímica, Exploración Minera, Leyes, Anomalías, Histogramas, Diagramas de Dispersión, Box Plots, QQ Plots, Valor de Fondo, Umbral, Geoquímica por Litografía.
Contenido:
- Introducción al Análisis Exploratorio de Datos (EDA): El documento introduce el concepto del EDA como un paso crucial en el análisis de datos geoquímicos. Se destaca su utilidad para:
- Comprender la distribución de las leyes: El EDA permite visualizar la distribución de los valores de los elementos químicos en un conjunto de datos, identificando patrones y tendencias.
- Identificar valores atípicos: El EDA ayuda a detectar valores extremos que pueden ser errores de muestreo o indicadores de mineralización.
- Establecer umbrales de anomalías: El EDA permite determinar valores de corte para definir anomalías geoquímicas, que pueden ser indicativas de la presencia de mineralización.
- Diagrama de Gestión de la Información: Se presenta un diagrama que ilustra el flujo de trabajo para el análisis de datos geoquímicos, desde la obtención de los datos hasta la generación de reportes.
- Validación de Datos: Se enfatiza la importancia de validar los datos geoquímicos antes de realizar cualquier análisis. Esto incluye verificar la calidad de los datos, identificar posibles errores y realizar las correcciones necesarias.
- Filtro Inicial: Se explica la necesidad de filtrar los datos para eliminar valores atípicos o no representativos. Se muestra cómo aplicar filtros en función de la litología o la ubicación de las muestras.
- Medidas de Posición y Dispersión: Se describen las medidas estadísticas básicas para caracterizar un conjunto de datos, incluyendo:
- Medidas de posición: Media, mediana, moda, cuartiles, percentiles.
- Medidas de dispersión: Varianza, desviación estándar, coeficiente de variación, covarianza, coeficiente de correlación, rango, rango intercuartil.
- Herramientas del EDA: Se presentan las principales herramientas estadísticas para el EDA, con ejemplos de cómo aplicarlas a datos geoquímicos:
- Histogramas: Permiten visualizar la distribución de frecuencias de los valores de un elemento. Se muestran ejemplos de histogramas de cobre (Cu) y oro (Au), comparando datos sin filtrar y filtrados.
- Histogramas por Litografía: Se ilustra cómo analizar la distribución de las leyes en función de la litología. Se presentan histogramas de Cu y Au para diferentes tipos de rocas (arenisca, tonalita, limolita, lutita).
- Diagramas de Dispersión (Scatter Plots): Permiten visualizar la relación entre dos variables. Se muestra un ejemplo de un diagrama de dispersión de Cu vs Au para diferentes litologías.
- Gráficos de Cuantiles (QQ Plots): Permiten comparar la distribución de un conjunto de datos con una distribución teórica. Se muestra un ejemplo de un QQ plot para Cu en tonalita.
- Gráficos de Caja (Box Plots): Permiten visualizar la distribución de los datos de forma compacta, mostrando la mediana, los cuartiles y los valores atípicos. Se muestran ejemplos de box plots para Cu y Au en diferentes litologías.
- Coeficiente de Correlación: Se explica el concepto de coeficiente de correlación como una medida de la relación lineal entre dos variables. Se presentan tablas de coeficientes de correlación para diferentes elementos en arenisca y tonalita.
- Valor de Fondo y Umbral: Se define el valor de fondo como la concentración natural de un elemento en un área determinada. Se explica cómo determinar el valor de fondo y cómo establecer umbrales de anomalías, utilizando el percentil 68 y la desviación estándar. Se presentan tablas con los valores de fondo, umbrales de anomalía posible y probable para diferentes elementos.
- Anomalías: Se clasifican las anomalías geoquímicas en: débil, moderada y fuerte, en función de los umbrales establecidos. Se presentan tablas con los rangos de valores para cada tipo de anomalía.
- Geoquímica por Litografía: Se destaca la importancia de analizar los datos geoquímicos en función de la litología para una mejor interpretación de los resultados.
- Conclusiones: El documento finaliza con una serie de conclusiones sobre la importancia del EDA en geoquímica para la exploración minera. Se enfatiza la necesidad de:
- Considerar la base de datos como un sistema integrado.
- Ingresar las variables cualitativas nominales por selección y no por tipeo.
- Tener en cuenta que la media y la varianza son susceptibles a los valores extremos.
- Entender la geología y el fundamento matemático para interpretar la distribución de las leyes.
- Reconocer que el EDA es una parte importante en la vectorización de las exploraciones mineras.
- Citas: Se incluye una cita de Harry and Schroeder (2000) sobre la importancia de las buenas prácticas en el trabajo de exploración y evaluación.
Autor:
Carlos Mamani
Fecha de Publicación:
No se especifica la fecha de publicación en el documento.
Link de descarga: Aquí