Académicos transcriben cientos de miles de fragmentos de la Genizá de El Cairo

La Biblioteca Nacional de Israel anunció esta semana un proyecto de transcripción digital de textos en cientos de miles de fragmentos de la Genizá de El Cairo, y miles de manuscritos hebreos adicionales por académicos israelíes e internacionales.

El proyecto, denominado MiDRASH (“Migraciones de Tradiciones Textuales y de Escribas mediante el Análisis Computacional a Gran Escala de Manuscritos Medievales en Escritura Hebrea”), se inició en 2023 tras obtener una subvención de 10 millones de euros (11.5 millones de dólares) a lo largo de seis años del Consejo Europeo de Investigación (CEI) de la Unión Europea.

Prácticamente la totalidad de los 400,000 fragmentos de la Genizá fueron fotografiados y sus imágenes digitalizadas anteriormente. Sin embargo, menos del 15 % de ellos han sido transcritos, y muchos nunca han sido leídos o estudiados.

“Nuestro objetivo es reconstruir la cultura literaria medieval judía, y comenzamos por transcribir la enorme colección de manuscritos virtuales reunida en la Biblioteca Nacional de Israel“, señaló Daniel Stökl Ben Ezra, profesor de Hebreo Antiguo y Arameo en la École Pratique des Hautes Études (PSL) de París, uno de los principales académicos del proyecto.

Según la halajá (ley judía), está prohibido tirar o destruir documentos que incluyan el nombre de Dios. Durante aproximadamente un milenio, los judíos de El Cairo depositaron manuscritos, cartas, antiguos libros de oraciones y otros objetos en una sala de la Sinagoga Ben Ezra de la ciudad, cuyo edificio original se cree que existe desde antes del siglo IX d. C.

Preservado por el clima seco de Egipto la Genizá de El Cairo llamó la atención de académicos europeos en 1896. La mayoría de los objetos fueron trasladados a Inglaterra en los años siguientes.

“Este material es extremadamente importante porque el 90% de los judíos [en la Edad Media] vivían en zonas de dominio musulmán, no en Europa, y aun así la mayoría de sus manuscritos se perdieron”, explicó Stökl en una entrevista telefónica con The Times of Israel.

“Tras el descubrimiento de la Genizá de El Cairo, encontramos muchos textos nuevos, muchas versiones nuevas de textos que ya conocíamos, y aprendimos muchísimo”.

“Disponer de una transcripción digital de un documento implica muchas cosas: se pueden buscar palabras, agrupar géneros, comparar idiomas fácilmente y mucho más”.

Finalmente, todas las transcripciones estarán disponibles en el sitio web de la Biblioteca Nacional de Israel, cada una acompañada de las fotografías de los manuscritos originales.

Según la Dra. Tsafra Siew, directora de Proyectos de Investigación de la Biblioteca Nacional de Israel, MiDRASH es un nuevo capítulo en la misión principal de la biblioteca: preservar los libros hebreos.

“En 1950, David Ben Gurión, el primer mandatario de Israel, fundó el Instituto de Manuscritos Hebreos Microfilmados. La idea era rescatar la mayor cantidad posible de manuscritos hebreos, y como no era posible traerlos físicamente a Jerusalén, el instituto comenzó a fotografiarlos en microfilm. Así nació la primera colección fotográfica”, explicó Siew.

Dra. Tsafra Siew, directora de Proyectos de Investigación de la Biblioteca Nacional de Israel. (Biblioteca Nacional de Israel)

A lo largo de las décadas, se incorporaron al proyecto unas 1,500 colecciones de libros de todo el mundo. Los fragmentos de la Genizá de El Cairo se digitalizaron en el marco de una iniciativa denominada Proyecto Genizá Friedberg, que comenzó en 2006.

“En 2014, comenzamos a digitalizar nuestra colección fotográfica y a crear un sitio web que permita a los usuarios buscar y consultar todos los manuscritos digitalizados. Fue un gran avance. El proyecto MiDRASH es el siguiente paso tecnológico”, agregó.

Actualmente, la Biblioteca Nacional de Israel está creando la infraestructura del sitio web para subir todos los materiales.

Al preguntarle cuánto tardarían las transcripciones en estar disponibles en línea, Siew respondió que es difícil de precisar, pero espera que tome “menos de un año”.

“Trabajar con la Biblioteca Nacional nos ha dado una gran ventaja, ya que cuenta con todo el trabajo preliminar de reunir esta enorme colección”, afirmó Stökl. “Si se trabajara en árabe, se tendrían millones de manuscritos, pero dispersos por todo el mundo, y pasarían décadas antes de que se incluyeran todos en una biblioteca electrónica”.

Daniel Stökl Ben Ezra, profesor de Hebreo Antiguo y Arameo en la École Pratique des Hautes Études (PSL) de París. (Cortesía)

El grupo interdisciplinario de académicos MiDRASH incluye paleógrafos (que estudian la escritura histórica), expertos en computación, lingüistas y expertos en literatura hebrea y estudios judaicos. Además de Stökl, los investigadores principales son el Prof. Nachum Dershowitz de la Universidad de Tel Aviv, el Dr. Avi Shmidman de la Universidad Bar-Ilan y la Prof. Judith Olszowy-Schlanger de la Universidad de Oxford. Equipos de la Universidad de Haifa y del Instituto Nacional de Literatura también participan en el proyecto, bajo la supervisión del Dr. Moshé Lavee y de Siew. El Proyecto Genizá de Princeton, dirigido por la Prof. Marina Rustow, proporciona apoyo adicional.

El grupo ha utilizado eScriptorium, una plataforma de código abierto para la transcripción automática de grabados y manuscritos, a fin de desarrollar un modelo de segmentación y transcripción del material en escritura hebrea (los textos están escritos en hebreo, arameo y judeoárabe, que utilizan caracteres hebreos). El modelo se ha entrenado alimentándolo con transcripciones existentes realizadas manualmente por académicos.

Stökl indicó que en los próximos meses planean transcribir 10 millones de imágenes adicionales de manuscritos hebreos.

“La transcripción es solo el comienzo del proceso”, dijo. “Necesitamos las transcripciones para realizar otros análisis. Queremos realizar análisis lingüísticos para identificar quién cita a quién, quién parafrasea a quién y quién toma qué ideas de quién, a fin de rastrear ideas, motivos y comentarios a lo largo de los siglos. El objetivo principal del proyecto es después de la transcripción”.

Un fragmento de texto hebreo encontrado en la Genizá de El Cairo y una versión transcrita. (Proyecto MiDRASH)

Si bien es probable que las transcripciones contengan errores, especialmente en la primera fase, permitirán que buscar y comparar los textos. El sistema podrá reconocer si un fragmento contiene un extracto de la Biblia, una página del Talmud, otro texto conocido, una carta privada, etc.

Uno de los objetivos de Stökl es estudiar cómo los midrashim, o relatos y exposiciones rabínicos extraídos de la Biblia, cambiaron a medida que se compartían en entornos musulmanes o cristianos y evolucionaron con el tiempo.

Los resultados del proyecto se publicarán en revistas académicas con revisión por pares.

Mientras tanto, para ayudar a los académicos a mejorar las transcripciones y los sistemas, la Biblioteca Nacional de Israel lanzó un “Maratón de Transcripciones” en Jerusalén y en línea, del 24 al 27 de noviembre, animando a voluntarios con habilidades relevantes a revisar y mejorar las transcripciones automáticas generadas por la plataforma, optimizando así su modelo basado en aprendizaje automático.

“Este proyecto nos permite plantear nuevas preguntas, más amplias y profundas”, afirmó Siew. “Preguntas que solo se pueden responder basándose en la visión completa de la colección de manuscritos hebreos”.

Reproducción autorizada con la mención siguiente: © EnlaceJudío

Enlace Judío: