Skip to content
This repository has been archived by the owner on Mar 28, 2019. It is now read-only.

!!!! Version dépréciée au profit de sedatools !!! Générateur semi-automatique de SIP contenant des bordereaux sous forme de fichiers XML, conformes au standard SEDA 2.0.

License

Notifications You must be signed in to change notification settings

ProgrammeVitam/generateur-seda

Repository files navigation

Générateur SEDA

Cet outil permet de générer des SIP contenant des bordereaux sous forme de fichiers XML, conformes au standard SEDA 2.1 (`http://www.archivesdefrance.culture.gouv.fr/seda/`_) de manière semi-automatique (au delà d'editeurs XML comme oxygen ou Eclipse) à partir d'une arborescence normalisée de fichiers.


  • Disposer d'au moins 1 Go de RAM sur son poste de travail
  • Disposer de 50 Mo de disque disponible (+ espace nécessaire pour la génération des archives)
  • Disposer d'un JRE 8 sur le poste de travail (testé avec la JRE Oracle sous Windows et JRE OpenJDK sous Linux)
  • Sous Windows, ne pas avoir de processus écoutant sur le port 5138

La version Windows inclut l'outil d'identification de format Siegfried avec une liste de signature

Lancer le script run_generator.bat avec 1 paramètre : Répertoire de base de l'arborescence que l'on désire scanner (ce doit être un répertoire et non un fichier seul).

Ceci peut notamment être fait avec un drag-and-drop dans l'explorateur windows en faisant "glisser" un répertoire sur le fichier run_generator.bat

Sous Windows, le script inclut le démarrage de Siegfried en mode serveur (port 5138) puis arrête Siegfried à la fin de l'exécution

La version Linux a besoin comme pré-requis de l'outil d'identification de format Siegfried :

Lors du 1er lancement, il faut récupérer le fichier de signature : sf -update (accès HTTP sans proxy sur Internet nécessaire)

Lors de chaque lancement :

  • Lancer siegfried en mode serveur sur le port 5138 : sf -serve localhost:5138
  • Lancer le script run_generator.sh avec 1 paramètre : Répertoire de base de l'arborescence que l'on désire scanner
.. seealso:: Voir le fichier `doc/Arborescence.rst`_ pour les spécification de l'arborescence d'entrée.

Dans le répertoire conf :

  • logback.xml : fichier de configuration logback standard
  • ArchiveUnitTransfer.json : métadonnées globales de l'ArchiveTransfer (Comment, MessageIdentifier, ArchivalAgreement, CodeListVersions, ArchivalAgency, TransferringAgency, OriginatingAgencyIdentifier, SubmissionAgencyIdentifier)
  • playbook_BinaryDataObject.json : Définition du "workflow" des différentes étapes pour un BinaryDataObject
.. seealso:: Voir le fichier `doc/Configuration.rst`_ pour plus de détails


2 fichiers :

  • Un fichier horodaté ZIP (pkZIP) avec les fichiers suivants (SIP-yyyyMMddHHmmss.zip) :

    • Un fichier SEDA généré qui est valide par rapport au schéma SEDA 2.1 (MEDONA) : l'affichage des ArchiveUnit est dans l'ordre du parcours en profondeur de l'arborescence
    • Un répertoire Content qui contient l'ensemble des BinaryDataObject décrits dans le fichier SEDA. Chaque fichier a pour nom son ID dans le bordereau Seda
  • Un fichier avec la liste des fichiers rejetés (SIP-yyyyMMddHHmmss.rejected)

Les pré-requis de compilation sont les suivants :

  • maven (version 3.3.9 minimale) ;

  • pour la génération de la documentation :

    • sphinx
    • make

La compilation et le packaging se font via maven : mvn clean package ; le résultat du packaging est un fichier zip présent dans le dossier generator-dist/target/.

Note

par défaut, la documentation est générée et incluse dans les packages de distribution. Pour ne pas la générer, il suffit de désactiver le profil maven doc (mvn -P-doc [...]).

A l'issue de la décompaction du packaging du générateur SEDA, le fichier sf.exe peut être reconnu par certains antivirus comme infecté. Il est alors supprimé du répertoire cible, par prévention de l'antivirus ; toutes les tâches liées aux appels Siegfried tomberont alors en erreur.

About

!!!! Version dépréciée au profit de sedatools !!! Générateur semi-automatique de SIP contenant des bordereaux sous forme de fichiers XML, conformes au standard SEDA 2.0.

Resources

License

Stars

Watchers

Forks

Packages

No packages published