Comparte nuestro contenido

El análisis de una base de datos de publicaciones científicas a través de un modelo de tópicos permitió determinar también que, en el caso de tsunamis, se estudia mucho más la gestión de riesgo de desastres que el fenómeno mismo. Estos análisis bibliográficos pueden servir para determinar las áreas más débiles en la generación de conocimientos sobre desastres.

Por Belén Harnecker, Jorge Vásquez y Ricardo Ortega
Imagen de portada: Detalle figura 1. Créditos: Conecta Resiliencia.


 

¿Qué investigan los científicos chilenos cuando investigan sobre desastres? ¿En qué temas ponen énfasis los estudios? ¿Qué disciplinas se interesan por estudiar desastres y con qué objetivos? Estas son algunas de las preguntas que busca responder este análisis bibliográfico de la producción científica chilena en desastres asociados a tres amenazas geológicas: terremotos, erupciones volcánicas y tsunamis.

Los resultados de este análisis demuestran que hay una diferencia muy grande entre los estudios relacionados con estos desastres. Por ejemplo, el número de estudios relacionados con terremotos duplica los estudios sobre volcanes y casi quintuplica los estudios relacionados con tsunamis. Además, el énfasis que se le da a la gestión del riesgo de desastres es muy distinta: mientras que en los estudios relacionados con volcanes, este abarca un 30% del total, en los estudios relacionados con tsunamis se eleva a un 64%.

A lo largo de este artículo, veremos qué metodología se usó para llegar a estos resultados, qué temas —que serán llamados tópicos— son los que dominan en las investigaciones y cómo se cruzan estos tópicos en las investigaciones sobre desastres.

Identificando y caracterizando la producción científica

Como explicábamos previamente, el objetivo de este artículo es caracterizar la producción científica de investigadores chilenos en desastres asociados a amenazas geológicas. Nos centraremos en la información bibliográfica sobre terremotos, tsunamis y actividad volcánica extraída de Scopus, una de las bases de datos académica más grandes junto a Web of Science. 

Scopus fue analizada utilizando técnicas de minería de textos para conocer de manera exploratoria qué aspectos de los desastres geológicos se estudian en Chile. Para ello, se desarrolló un programa de descarga automática de información básica de publicaciones científicas. Se buscó por palabras en inglés relacionadas con desastres causados por amenazas geológicas —terremoto, tsunami y actividad volcánica—, filtrando por afiliaciones chilenas. De esta manera, se descargó información de 3.647 documentos publicados entre 1961 y 2020 (número que incluye artículos de revistas científicas, libros y artículos en conferencias). De cada documento, se obtuvo información específica como el título, el abstract (resumen), las palabras clave, autores y afiliaciones, entre otras.

El desafío de este estudio fue conocer de manera exploratoria el contenido de cada investigación, qué temas abordan y cómo se distribuyen estos temas en los diversos documentos. Esto se consiguió a partir de la información no estructurada que se obtuvo de la extracción de datos: los campos de texto. Casi la totalidad de la información de texto está disponible solo en inglés.

En minería de texto, existen numerosas metodologías exploratorias. Los modelos de tópicos son un buen método para la clasificación no supervisada, ya que permiten conocer el contenido de un texto o conjunto de textos sin imponer etiquetas o categorías de antemano. La idea básica de los modelos de tópicos es construir tópicos o cúmulos (clusters) de palabras que aparecen en el texto. Un texto contiene una mezcla de todos los tópicos, mezcla en la cual cada tópico tendrá un peso específico.

Antes de construir los modelos de tópicos, se realizó una limpieza de los textos que incluyó las siguientes acciones: consolidación de todos los campos de texto (título, resumen, nombre de la revista y palabras clave); normalización del texto (todo a minúsculas y eliminación caracteres no alfanuméricos); eliminación de stopwords1Las stopwords («palabras vacías» en castellano) son palabras muy comunes y poco informativas desde el punto de vista léxico, tales como las conjunciones (and, or, that…), preposiciones (on, by, to…) y verbos muy comunes (to be, to have, to do…).; eliminación de palabras poco frecuentes2Se eliminan todas las palabras cuya frecuencia de aparición era menor a 10 en el total de documentos.; lematización3La lematización consiste en llevar cada palabra a su forma canónica o lema (por ejemplo, «soy», «eres», «somos», «son», «eran» y «fuimos» son conjugaciones del mismo verbo, «ser»). Este proceso permite reducir aún más la cantidad de palabras y así la dimensionalidad del input del modelo. y creación del corpus4El corpus corresponde al conjunto total del texto de todos los documentos.; y un modelo de tópicos preliminar para descartar documentos que abordaban temas que no se relacionaban directamente con el desastre (por ejemplo, agricultura en suelos volcánicos). De esta forma, se obtuvo un total de 2.697 documentos: 1.749 documentos relacionados con terremotos, 353 con tsunamis y 872 con volcanología.

A partir del corpus, se construyeron tres modelos de tópicos: uno por cada amenaza. Para terremotos, se construyó un modelo de cinco tópicos. Para tsunamis y volcanes, se construyeron modelos de cuatro tópicos en ambos casos. Cada tópico está descrito por 20 palabras clave, que se usaron para interpretar la asociación de cada tópico a un tema o campo de estudio de la amenaza.

El producto de cada modelo es una matriz documento-tópico de dimensiones D x T: «D» filas por «D» documentos y «T» columnas por «T» tópicos. Las celdas de la matriz contienen una probabilidad entre 0 y 1 de cada documento de pertenecer a cada uno de los tópicos. La suma de las columnas en la matriz tópico-documento debe ser siempre igual a 1. En circunstancias óptimas, los documentos se clasificarían con una alta probabilidad (cercana a 1) a un solo tópico.

Resultados por tipo de amenaza

TERREMOTOS

Se identificaron cinco tópicos relevantes en un total de 1.749 documentos. Los tópicos identificados son los siguientes:

  1. Resiliencia social y urbana, que abarca principalmente la dimensión social de la gestión del riesgo: análisis sociodemográficos de población expuesta, psicología y salud mental (como estrés postraumático por terremotos), resiliencia comunitaria, reconstrucción, transformación y planificación urbana en torno a los desastres. También incluye análisis de procesos de reconstrucción y rehabilitación.
  2. Ingeniería estructural, que aborda el comportamiento de las estructuras y sistemas de protección sísmica.
  3. Tectónica de terremotos, principalmente, tectónica de placas, sistemas de fallas geológicas y subducción.
  4. Sismología, con foco en la caracterización  de la amenaza y en la medición y modelación del movimiento del suelo.
  5. Geotecnia y licuefacción, que incluye estudios de mecánica de suelos y licuefacción.

Figura 1: Distribución de documentos por tópicos en estudios sobre terremotos

No Description

En este caso, por ejemplo, se puede observar en la Figura 1 que el tópico «tectónica» coexiste con el tópico «sismología» en varios documentos. Esto tiene sentido, ya que ambos pertenecen al área de las geociencias. Sin embargo, el tópico «tectónica» se combina levemente con «resiliencia social» y con «ingeniería estructural». Por otra parte, el tópico «sismología» se combina fuertemente con el tópico «resiliencia social y urbana», ya que esta última es una variable importante en la caracterización de la amenaza sismológica.

Figura 2: Distribución de tópicos dominantes en estudio de terremotos

No Description

VOLCANES

Se identificaron cuatro tópicos relevantes en un total de 872 documentos. Los tópicos son los siguientes:

  1. Geoquímica de volcanes, con foco en composición química del magma, arco magmático y volcanismo.
  2. Tectónica de volcanes, que incluye el estudio de arco volcánico, evolución volcánica, interacción entre terremotos y actividad volcánica (actividad sísmica en complejos volcánicos).
  3. Erupciones volcánicas, que aborda el estudio del evento y su dimensión física (erupción, flujo piroclástico).
  4. Gestión del riesgo de volcanes, principalmente en temas de evaluación de riesgos, monitoreo y alerta temprana, estudios sociodemográficos, vulnerabilidad, resiliencia comunitaria, psicología y salud mental, entre otros.

Figura 3: Distribución de documentos por tópicos en estudios sobre volcanes

No Description

En la Figura 3 se puede observar que, de forma similar al caso de terremotos, el tópico «gestión del riesgo» coexiste mucho más con «erupciones volcánicas» que con «geoquímica de volcanes» o «tectónica de volcanes». Por otro lado, el tópico «geoquímica de volcanes» coexiste con «tectónica de volcanes» y «erupciones volcánicas».

Figura 4: Distribución de tópicos dominantes en estudio de volcanes

No Description

TSUNAMIS

Se identificaron cuatro tópicos relevantes en 353 documentos. Los tópicos identificados son los siguientes:

  1. Alerta temprana, que se refiere mayormente a la perspectiva de las ingenierías y la logística (evaluación de riesgos, sistemas de monitoreo del océano, alerta temprana, ingeniería de océanos).
  2. Eventos terremoto tsunami, que estudia fenómenos históricos. Este tópico incluye distintas perspectivas del estudio de la amenaza, entre las que se incluyen la geología, geofísica e ingenierías (sísmica y de océano).
  3. Resiliencia social con fuerte foco en ciencias sociales y ciencias de la salud (resiliencia comunitaria, psicología y salud mental).
  4. Impacto costero, con foco en el impacto ecológico y el estudio del desastre biogeográfico en la zona costera.

Figura 5: Distribución de documentos por tópico en estudios sobre tsunamis

No Description

En la Figura 5, se observa que el tópico «resiliencia social» coexiste con el tópico «alerta temprana», lo que tiene sentido porque ambos son aspectos de la gestión del riesgo de tsunamis. Se observa también que «impacto costero» se relaciona con los tres tópicos restantes. Por otro lado, el estudio de eventos históricos (tópico «evento terremoto y tsunami») casi no coexiste con «resiliencia social». Esto puede deberse al hecho de que el primer tema se estudia desde las ciencias de la Tierra e ingeniería, mientras que el aspecto de resiliencia social se estudia desde las ciencias sociales y ciencias de la salud.

Figura 6: Distribución de tópicos dominantes en estudio de tsunamis

No Description


Conclusiones

Los resultados de este estudio demuestran que la aplicación de algunos métodos exploratorios de minería de textos, específicamente, la construcción de modelos de tópicos, pueden ser útiles para caracterizar la investigación científica y para obtener un conocimiento general acerca del contenido de una gran cantidad de documentos. En  este caso, se logró reducir a cinco tópicos la información contenida en más de 1.700 investigaciones científicas relacionadas con terremotos. En el caso de los estudios relacionados con tsunamis y volcanes, la información de 353 y 872 documentos respectivamente se redujo a cuatro tópicos para cada tema. 

Los resultados fueron semánticamente coherentes, lo que permitió asociar cada tópico a temas de estudio concretos relacionados con cada amenaza, utilizando para ello las palabras clave que describen los tópicos. Además, el visualizar la distribución de los tópicos en la diversidad de investigaciones estudiada permitió identificar qué tan lejos o qué tan distintos son los temas que abarcan; también se pudo identificar qué tópicos coexisten típicamente en los mismos documentos.

Los datos extraídos de Scopus demuestran un claro desbalance en cuanto a la cantidad de publicaciones que existen para cada amenaza: terremotos es por lejos el tema más estudiado (1.749 investigaciones contra 872 de vulcanismo y 353 de tsunamis). Las razones de esta diferencia no están claras, pero podemos aventurar algunas: 1) hay mayor interés en investigar temas relacionados con sismos porque estos pueden generar impactos serios en prácticamente todo Chile, mientras que las erupciones volcánicas y los tsunamis tienen impacto en una zona mejor delimitada; 2) no todos los sismos se asocian a tsunamis, por lo que es de suponer que el estudio relacionado con tsunamis será inferior; 3) las investigaciones sobre terremotos incluyen un tópico sobre ingeniería estructural que abarca casi un 30% de los estudios y que no tiene un equivalente en los otros dos temas (el estudio de la ingeniería estructural para tsunamis es algo muy reciente); y 4) los estudios sobre tsunamis en Scopus son bastante más recientes que los de sismos y volcanes: mientras que la investigación más antigua sobre terremotos es de 1961 y la de volcanes es de 1964, la más antigua sobre tsunamis es de 1988: más de dos décadas de diferencia implica no solo dos décadas menos de estudios, sino también una menor cantidad de personas expertas formadas y especializadas en temas relacionados con tsunamis.

Sin embargo, estas son solo especulaciones con los datos que se tienen disponibles: puede haber muchas otras razones para explicar esta disparidad. Cabe recordar que la base de datos de datos de Scopus, si bien es bastante completa y es una de las más importantes que existen, no incluye todo el universo de documentos. En un futuro trabajo será importante complementar la información de Scopus con la de otras bases de datos.

En cuanto a los temas identificados, en el caso de terremoto se ve un clara inclinación hacia las ciencias de la tierra y las ingenierías: alrededor del 50% se centra en el estudio mismo de la amenaza (tectónica, sismología y geotecnia) y casi un 30% corresponde a análisis de ingeniería estructural: cómo responde nuestra infraestructura a los movimientos sísmicos. Solo un 20% corresponde a estudios de vulnerabilidad social desde un foco multidisciplinario, desde las ciencias sociales, las humanidades y las ciencias de la salud. 

El caso del estudio de volcanes es similar: cerca de un 70% de la investigación se centra en el estudio de la amenaza, mientras que el 30% abarca otros temas de la gestión del riesgo, desde un foco multidisciplinario. La gestión del riesgo abarca desde el monitoreo y alerta temprana (generalmente desde la perspectiva de las ingenierías), hasta el impacto comunitario y la resiliencia social.

El caso de tsunami es claramente distinto a los dos anteriores: solo un 36% se centra en el estudio de la amenaza en sí, aunque esto muchas veces se limita al estudio de las ondas sísmicas que los originan. El 64% restante se centra en la gestión del riesgo de desastre: alerta temprana, resiliencia social y el impacto ecológico y geomorfológico de la costa.

En un trabajo futuro, se espera incorporar más fuentes de información, además de hacer análisis de tópicos relacionados con otras amenazas, tales como las hidrometeorológicas y los incendios forestales.

 

X