Cet outil permet de générer des SIP contenant des bordereaux sous forme de fichiers XML, conformes au standard SEDA 2.1 (`http://www.archivesdefrance.culture.gouv.fr/seda/`_) de manière semi-automatique (au delà d'editeurs XML comme oxygen ou Eclipse) à partir d'une arborescence normalisée de fichiers.
Contents
- Disposer d'au moins 1 Go de RAM sur son poste de travail
- Disposer de 50 Mo de disque disponible (+ espace nécessaire pour la génération des archives)
- Disposer d'un JRE 8 sur le poste de travail (testé avec la JRE Oracle sous Windows et JRE OpenJDK sous Linux)
- Sous Windows, ne pas avoir de processus écoutant sur le port 5138
La version Windows inclut l'outil d'identification de format Siegfried avec une liste de signature
Lancer le script run_generator.bat
avec 1 paramètre : Répertoire de base de l'arborescence que l'on désire scanner (ce doit être un répertoire et non un fichier seul).
Ceci peut notamment être fait avec un drag-and-drop dans l'explorateur windows en faisant "glisser" un répertoire sur le fichier run_generator.bat
Sous Windows, le script inclut le démarrage de Siegfried en mode serveur (port 5138) puis arrête Siegfried à la fin de l'exécution
La version Linux a besoin comme pré-requis de l'outil d'identification de format Siegfried :
- Pour une distribution basée sur des packages deb en 64 bits , suivre la procédure décrite sur la page `https://github.com/richardlehane/siegfried#ubuntudebian-64-bit`_.
- Pour une distribution RPM, il n'y a pas pour l'instant de version compilée
Lors du 1er lancement, il faut récupérer le fichier de signature : sf -update
(accès HTTP sans proxy sur Internet nécessaire)
Lors de chaque lancement :
- Lancer siegfried en mode serveur sur le port 5138 :
sf -serve localhost:5138
- Lancer le script run_generator.sh avec 1 paramètre : Répertoire de base de l'arborescence que l'on désire scanner
.. seealso:: Voir le fichier `doc/Arborescence.rst`_ pour les spécification de l'arborescence d'entrée.
Dans le répertoire conf :
logback.xml
: fichier de configuration logback standardArchiveUnitTransfer.json
: métadonnées globales de l'ArchiveTransfer (Comment, MessageIdentifier, ArchivalAgreement, CodeListVersions, ArchivalAgency, TransferringAgency, OriginatingAgencyIdentifier, SubmissionAgencyIdentifier)playbook_BinaryDataObject.json
: Définition du "workflow" des différentes étapes pour un BinaryDataObject
.. seealso:: Voir le fichier `doc/Configuration.rst`_ pour plus de détails
2 fichiers :
Un fichier horodaté ZIP (pkZIP) avec les fichiers suivants (
SIP-yyyyMMddHHmmss.zip
) :- Un fichier SEDA généré qui est valide par rapport au schéma SEDA 2.1 (MEDONA) : l'affichage des ArchiveUnit est dans l'ordre du parcours en profondeur de l'arborescence
- Un répertoire Content qui contient l'ensemble des BinaryDataObject décrits dans le fichier SEDA. Chaque fichier a pour nom son ID dans le bordereau Seda
Un fichier avec la liste des fichiers rejetés (
SIP-yyyyMMddHHmmss.rejected
)
Les pré-requis de compilation sont les suivants :
maven (version 3.3.9 minimale) ;
pour la génération de la documentation :
- sphinx
- make
La compilation et le packaging se font via maven : mvn clean package
; le résultat du packaging est un fichier zip présent dans le dossier generator-dist/target/
.
Note
par défaut, la documentation est générée et incluse dans les packages de distribution. Pour ne pas la générer, il suffit de désactiver le profil maven doc (mvn -P-doc [...]
).
A l'issue de la décompaction du packaging du générateur SEDA, le fichier sf.exe
peut être reconnu par certains antivirus comme infecté. Il est alors supprimé du répertoire cible, par prévention de l'antivirus ; toutes les tâches liées aux appels Siegfried tomberont alors en erreur.