Le projet de Venise "Time Machine" suspendu au milieu d'une rangée de données

[ad_1]

Les historiens veulent utiliser des documents d'archives pour créer une machine à remonter le temps virtuelle pour Venise, illustrée ici au 18ème siècle.Crédit: DEA / Getty

Comme la ville elle-même, un effort ambitieux visant à numériser des documents d’une durée de dix siècles et retraçant l’histoire de Venise risque de s’effondrer. Deux partenaires clés ont suspendu le projet après avoir abouti à une impasse sur des problèmes liés aux données ouvertes et à la méthodologie. Les Archives de l’Etat de Venise et l’École Polytechnique Fédérale de Lausanne (EPFL) ont déclaré qu’ils avaient dû suspendre la collecte des données. Le directeur des archives a également posé des questions sur la convivialité des 8 téraoctets d’informations déjà collectés.

Le projet visait à numériser des documents qui s'étendent sur 80 kilomètres d'étagères dans les archives nationales. Celles-ci enregistrent les détails de l’administration de la ville – des transactions financières aux adresses des citoyens et aux relations familiales – à l’époque des hauts faits du Moyen Âge et de la Renaissance en tant que république qui a dominé pendant des siècles le commerce en Méditerranée orientale. Beaucoup sont écrits en latin ou en dialecte vénitien et n'ont jamais été lus par les historiens modernes.

L'objectif était de rendre cette information disponible gratuitement en ligne pour les chercheurs du monde entier. Le projet visait également à faire progresser les technologies de reconnaissance de texte des documents manuscrits à la pointe de la technologie, en utilisant l’apprentissage automatique pour lire automatiquement des millions de pages et étiqueter leur contenu afin que les historiens puissent effectuer des recherches rapides.

Le projet a été lancé en collaboration avec l’EPFL, les Archives nationales de Venise et l’Université Ca’ Foscari de Venise. En 2014, les trois organisations ont signé un mémorandum d’accord non contraignant sur la manière de mener cette initiative.

Toutefois, l'accord initial laissait de côté des détails cruciaux sur les protocoles de recherche, selon un communiqué de presse des archives daté du 19 septembre annonçant la suspension. En particulier, il n’a pas précisé le type de licence qui régirait l’utilisation des données numérisées par les chercheurs – qui doit également respecter la loi italienne, explique le directeur actuel de l’archive, Gianni Penzo Doria. Il a ajouté qu'après avoir pris ses fonctions en août, il avait tenté de relancer les négociations en vue d'un contrat détaillé, mais que les deux parties s'étaient rapidement retrouvées dans une impasse. La décision d'arrêter le projet était inévitable, dit-il, et mutuelle.

Cependant, le 23 septembre, l'EPFL a publié son propre communiqué de presse, dans lequel elle affirmait que les archives avaient suspendu le projet de manière unilatérale et que l'EPFL avait été surprise d'apprendre cette décision sur le site Web des archives nationales de Venise.

«Je pense que c’est essentiellement un malentendu», déclare Frédéric Kaplan, informaticien à l’EPFL et directeur de Venice Time Machine. Il ajoute que le désaccord aurait potentiellement pu être résolu par des réunions en face à face entre les collaborateurs, mais que jusqu'à présent toutes les discussions avaient eu lieu par téléconférence.

Fichiers «inutiles»

Dans le même temps, le sort de 8 téraoctets de fichiers numériques accumulés au cours des 5 dernières années – environ 190 000 documents – n’est pas clair. Penzo Doria affirme que du point de vue de la science archivistique, «ces fichiers sont inutiles», car les travaux de numérisation n’ont pas suivi le projet Interpares (recherche internationale sur les enregistrements authentiques permanents dans les systèmes électroniques).

Ces directives exigent l’enregistrement scrupuleux des informations permettant de certifier la provenance de chaque document et exigent qu’un enregistrement de ces informations soit conservé dans les métadonnées fournies avec chaque fichier. Il s’agit d’une sorte de signature électronique qui garantit la conservation et la validation à long terme d’un fichier numérique. Selon Penzo Doria, les chercheurs de l'EPFL qui ont effectué les scannages n'ont pas expliqué comment ils avaient collecté ces informations. Sinon, ils n'ont pas partagé ces documents avec des collaborateurs des archives.

Kaplan explique que les chercheurs ont collecté des métadonnées, mais que leur méthodologie était basée sur un ensemble de règles différent – les directives ISAD (International Standard Archival Description) du. Il dit que les chercheurs de l’EPFL ont suivi les procédures établies par le personnel des archives nationales. Kaplan dit également avoir fourni de la documentation sur les métadonnées dans un courrier électronique à son prédécesseur, Giovanna Giubbini, en février 2019. Penzo Doria et Giubbini ont tous deux La nature qu'ils n'ont jamais reçu cette documentation.

Raffaele Santoro, qui était directeur des archives de l'État de Venise en 2014 lors de la signature du mémorandum sur le projet Time Machine, déclare qu'il ne connaît pas en détail la façon dont les travailleurs ont collecté les métadonnées, mais il suppose qu'elles sont scientifiquement valables, car le personnel des archives a été étroitement associé au processus. Pour rendre les documents déjà numérisés conformes à des normes supplémentaires, on pourrait simplement ajouter plus d'informations aux métadonnées, a-t-il déclaré, «sans qu'il soit nécessaire de tout recommencer».

Kaplan dit qu'il espère que le projet pourra se remettre sur les rails si les deux parties se rencontrent pour discuter de nouvelles conditions en personne. "L'EPFL espère sincèrement que la réunion aura lieu bientôt", a-t-il déclaré.

[ad_2]