Tesauro de Historia de Cataluña

Tesauro de Historia de Cataluña

El Tesauro de Historia de Cataluña es un vocabulario controlado de terminología, en catalán, sobre la historia de Cataluña. Se creó para servir como instrumento en el análisis documental y la recuperación de la información del Fons d'Història Local de Catalunya. Es el fruto de un largo esfuerzo que se inició el año 1987 y que en estos momentos cuenta con 4.509 términos.
Se hacía necesario contar con un lenguaje documental controlado que permitiera una indización homogénea de los documentos que se iban incorporando a la base de datos, y que a la vez hiciera posible la recuperación de forma exhaustiva y fácil.
El Tesauro, utilizado como puente entre el documento y el usuario, permite un nivel de análisis exhaustivo del contenido del documento, con una terminología de la disciplina adaptada a las necesidades de información del usuario.

El Tesauro se puede consultar en línea implementado bajo el programa libre de gestión de Tesauros "Tematres" (v.1.04)
La aplicación permite buscar un término o descriptor por diferentes sistemas y/o presentaciones:

. Búsqueda libre de un término en el formulario de "Búsqueda" (parte superior derecha de la pantalla)

. Tesauro jerárquico: lista sistemática desplegable de les áreas del Tesauro i de las jerarquías de los términos que contiene.

. Tesauro alfabético: relación alfabética de todos los términos del tesauro con la siguiente información asociada:

- USEU: remite de un no-descriptor al término aceptado en el Tesauro.
- Nota histórica: ámbito cronológico del término.
- Nota de alcance: definición del término extraída de una obra de referencia (Enciclopèdia Catalana, etc.)
- Nota de úso: indicaciones para usar el término en el proceso de indización.
- UP (Usado por): relación de no-descriptores, sinónimos del descriptor.
- TG: término genérico al cual pertenece jerárquicamente el descriptor, inmediatamente superior en la jerarquía.
- TE: término o términos específicos que contiene jerárquicamente el descriptor, inmediatamente inferior en la jerarquía.
- TR: términos relacionados semánticamente con el descriptor y que están en otras áreas temáticas del Tesauro.

 

¿Porqué un tesauro de historia de Cataluña?

La decisión de crear un tesauro específico de historia de Cataluña se tomó ante la inexistencia de lenguajes documentales adecuados a esta disciplina. Necesitábamos una herramienta de trabajo que permitiera recuperar la información a través de la terminología y los puntos de vista más familiares para nuestros usuarios: historiadores y estudiosos de la historia de Cataluña. Se descartaron, pues, lenguajes documentales más generales (Lista de Encabezamientos de materia en catalán) en favor de un lenguaje más técnico y especializado. Por otra parte, no nos servían los tesauros existentes porqué su aplicación al ámbito catalán no recogía muchos aspectos importantes de nuestra historia.
La posibilidad de crear nuestro propio lenguaje documental, nos permitiría también realizar una valoración crítica de la terminología usada en la historiografía catalana. La recopilación de los conceptos usados y el análisis posterior de estos (relaciones de equivalencia, jerarquía y asociación) permiten la reducción de los significados de los términos a un único significante, eliminando ambigüedades y sinonimias en unos términos o dando contenido a otros.
La terminología recogida en la primera etapa de creación de la base de datos quedó compilada en el Tesauro de Historia Contemporánea de Cataluña . La adaptación de este lenguaje documental a las nuevas necesidades de la base de datos, ampliada a todos los períodos históricos, implicó la incorporación de nueva terminología y la integración de nuevas áreas temática y estructuras (diferentes tipos de administración, nuevos movimientos sociales...)

La terminología recogida en las diferentes bases de datos comarcales, ha sido el punto de partida de esta reestructuración del tesauro en la que se está trabajando actualmente. Este lenguaje, que nació como herramienta documental estricta, se ha convertido en un instrumento que aporta información sobre la propia naturaleza de la disciplina y sobre aspectos importantes y peculiares de nuestra historia. Se ha de mencionar el hecho de que la terminología aportada por cada comarca refleja, en algunas ocasiones, las particularidades de la su historia y territorio y enriquece extraordinariamente el tesauro. Por ejemplo, la actividad vinícola del Penedès ha planteado la necesidad de multiplicar los conceptos al respecto para poder reflejar tota esta cultura; la problemática de los acuíferos en el Baix Llobregat obliga también a recoger nueva terminología sobre medio ambiente; aspectos peculiares de la historia del Bages, como “Avalot de les Faves de 1688" en Manresa, han de tener también cabida en el tesauro, respetando la terminología utilizada por los estudiosos de la comarca, etc.


Proceso de construcción

El proceso de construcción del tesauro ha contemplado diferentes tareas: recopilación del vocabulario, selección y normalización de los descriptores y establecimiento de las relaciones de equivalencia, jerarquía y asociación entre descriptores.
El primer paso era la recopilación del vocabulario o terminología. Un primer estudio a priori de las fuentes terminológicas más características de la disciplina nos permitió establecer una primera gran estructura con las posibles grandes áreas de conocimiento o micro-disciplinas. Posteriormente, y a partir de un primer muestreo hecho en diversas bibliotecas por nuestros analistas, con un sistema de indización libre, establecimos unas relaciones de "descriptores candidatos". Mediante un método deductivo reagrupamos los descriptores en función de su temática. Esta primera recopilación de vocabulario nos permitía ya establecer los grandes temas o áreas de conocimiento específicos del tesauro, es decir, una primera estructura dentro de la cual podíamos ir incorporando otras (de manera que los términos específicos que pertenecieran a un mismo campo semántico, quedasen agrupados en "microdisciplinas" y "facetas"). Estas áreas se han ido revisando continuamente al lo largo del proceso de construcción, subdividiendo aquellas con muchos descriptores o reagrupando oltras con pocos términos.
En una segunda fase, se normalizó el vocabulario recogido y se concretó en un lenguaje documental. Se examinó cada micro-disciplina con la finalidad de seleccionar y normalizar los descriptores. Este proceso supone una primera elección entre descriptores y no-descriptores y, por tanto, la elaboración de una primera estructura de equivalencia semántica entre términos sinónimos.
Una vez seleccionados y normalizados los términos descriptores se tenía que elaborar una estructura jerárquica dentro de cada una de las micro-disciplinas. La creación de cadenas jerárquicas permitió detectar y eliminar los dobles usos de descriptores y encontrar posibles lagunas que se llenarían añadiendo los conceptos que faltaban para mantener la coherencia.
Finalmente se examinó cada descriptor del tesauro para poder establecer sus relaciones asociativas con otros descriptores ubicados en otras áreas de conocimiento.

Mantenimiento y actualización

El tesauro es una herramienta viva y dinámica que se nutriendo de nuevos descriptores como consecuencia de la indización de nuevos documentos y de los cambios cualitativos que el mismo proceso de construcción va generando. El mantenimiento y la actualización periódica de este lenguaje documental es, pues, una necesidad. Se ha de controlar el uso y tener en cuenta las dificultades que se presentan y las soluciones a adoptar. Se hace necesario actualizarlo periódicamente tanto para corregir errores y omisiones como para adaptarlo a la evolución científica de las disciplinas que reúne.
El seguimiento de uso del tesauro es una tarea de los responsables de su construcción, contando siempre con las sugerencias y problemas planteados por los analistas encargados de la indización de los documentos y de los usuarios que lo utilizan para plantear sus búsquedas en la base de datos.
Se controla la frecuencia de uso de los descriptores (gran cantidad de descriptores que se usan  muy poco o, contrariamente, descriptores que se utilizan con mucha frecuencia); la ausencia de conceptos que sí aparecen en los documentos (descriptores candidatos); las dificultades de uso del tesauro (descriptores con un sentido muy similar que necesitan la inclusión de una nota de aplicación y uso); nuevas relaciones semánticas o asociativas entre descriptores, ...




Bibliografía


Cuadrado, M.; García, C.; Perpinyà, M. et al. Tesaurus d'història contemporània de Catalunya. Barcelona: Diputació de Barcelona, 1996. 237 pàg

Cuadrado, M.; García, C.; Perpinyà, M. et al. "El Thesaurus d’història de Catalunya: creació i anàlisi d’un llenguatge documental aplicat a la història”. Item, núm. 15 (juliol-desembre 1994): 134-159.

Cuadrado, M.; García, C.; Perpinyà, M. et al. Tesaurus d’Història de Catalunya. Edició 0. Presentació jeràrquica i alfabètica. Bellaterra : Servei de Documentació d’Història Local de Catalunya, 1999

Campus d'excel·lència internacional U A B