Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Article OCS GE #1081

Draft
wants to merge 5 commits into
base: master
Choose a base branch
from
Draft
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
235 changes: 235 additions & 0 deletions content/articles/2024/20240322_ocsge.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,235 @@
---
title: "L'OCS GE dans une boucle de correction"
subtitle: "Le monde vu d'en haut"
authors:
- Florian Boret
categories:
- article
comments: true
date: 2024-03-22
description: "Découvrez l'OCS GE et les problèmes auxquels nous avons été confrontés lors de la boucle de correction"
icon: material/land-plots
image: ""
license: beerware
robots: index, follow
tags:
- DGALN
- IGN
- OCS GE
- IA
---

# L'OCS GE dans une boucle de correction

:calendar: Date de publication initiale : 22 mars 2024

## Intro

![icône IGN](https://cdn.geotribu.fr/img/logos-icones/entreprises_association/ign.png "icône IGN"){: .img-thumbnail-left }

En lien direct avec la [loi Climat et Résilience](https://www.ecologie.gouv.fr/loi-climat-resilience), l'état et plus précisément la [direction générale de l'aménagement, du logement et de la nature (DGALN)](https://www.ecologie.gouv.fr/direction-generale-lamenagement-du-logement-et-nature-dgaln) a décidé de lancer la production d'un référentiel d’occupation et usage des sols à grande échelle (référentiel OCS GE nouvelle génération) sur l’ensemble du territoire national, afin qu’il soit diffusé en « open data » à l’ensemble des acteurs, dont les collectivités territoriales, pour leur permettre une maîtrise progressive de la consommation de l’espace dans le cadre de l’objectif de zéro artificialisation nette. :raised_hands:

Si sur le papier ce projet est plein de bonnes intentions :

- production harmonisée,
- production de 2 premiers millésimes d'ici fin 2024,
- implication des acteurs locaux dans le contrôle de la donnée,...

Le résultat des premières livraisons de la production basée sur l'IA est plus mitigé.

L'objectif de cet article est donc de vous sensibiliser sur les spécificités de cette donnée et d'alerter sur les problèmes auxquels j'ai été confronté lors de la boucle de correction du département de l'Hérault.

[Commenter cet article :fontawesome-solid-comments:](#__comments){: .md-button }
{: align=middle }

----

## Les spécifications de l'OCS GE nouvelle génération

Les spécifications de l'OCS GE sont notamment issues des travaux de l'IGN et des discussions du [groupe de travail OCS GE du CNIG](https://cnig.gouv.fr/gt-ocs-ge-a8069.html) initiées il y a plusieurs années et rapidement détaillée ci-dessous.

[Accéder aux données de l'OCS GE disponibles :fontawesome-solid-database:](https://geoservices.ign.fr/ocsge-nouvelle-generation){: .md-button }[Accéder à la documentation de l'OCS GE :fontawesome-solid-book:](https://geoservices.ign.fr/documentation/donnees/vecteur/ocsge){: .md-button }
{: align=middle }

### La nomenclature

La nomenclature retenue pour la production de cette donnée de nouvelle génération est déclinée suivant une approche hiérarchique et emboitée en deux dimensions avec d'un côté la couverture (14 postes) et de l'autre l'usage des sols (20 postes).

![Nomenclature CS](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/nomenclature_CS.png){: .img-center loading=lazy }

> La couverture du sol est une vue « physionomique » du terrain. La description est une simple distinction des éléments structurant le paysage sans préjuger de leur fonction ou de leur spécificité macroscopique.

![Nomenclature US](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/nomenclature_US.png){: .img-center loading=lazy }

> L’usage du sol est une vue « anthropique du sol ». Il est partagé en fonction du rôle que jouent les portions de terrain en tant qu’activité économique.

!!! info
Il n’y a pas de différence dans la nomenclature socle (Couverture et Usage) entre les OCS GE anciennes génération et les OCS GE qui sont produites avec le nouveau processus. Toutefois, dans l’OCS GE nouvelle génération, l’usage 235 est découpé en usage 2, 3 et 5.

### Echelle et unité minimale de collecte

- Echelle d’utilisation : jusqu’au 1:2500 ;
- 500 m² pour les objets situés dans la zone construite ;
- 2500 m² pour les objets situés hors zone construite ;
- Seuils de largeur : 5m pour les réseaux routiers et ferrés, 10m pour les autres couvertures du sol, 20m pour l’usage sylvicole.
- Unités minimales de collecte 200 m² pour les zones bâties ;

!!! info
Le seuil de prise en compte des bâtiments peut aller jusqu’à 50m². Toutefois, les surfaces bâties isolées ayant une surface comprise entre 50 m² et 200 m² sont agrandies pour que leur surface soit égale à 200 m².

## Les méthodes de production

L’OCS GE produite jusqu’à présent n’utilisait pas d’intelligence artificielle et la durée de photo-interprétation était relativement longue et annoncée comme plus couteuse (Nota : je n'ai pas trouvé de chiffres sur l'ancienne génération). Jusqu’à présent la sortie d’un département était de l'ordre de 4 à 5 ans après la prise de vue aérienne. L’objectif avec cette nouvelle production de l’OCS GE est de permettre aux utilisateurs de disposer d’une donnée plus fraiche et livrée plus rapidement après la prise de vue.

### Schémas du processus de production de l'OCS GE nouvelle génération

![Processus complet](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_processus.png){: .img-center loading=lazy }

![Processus manuel (zoom)](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_processus_manuel.png){: .img-center loading=lazy }

### Utilisation de l'intelligence artificielle

Les photos aériennes sont initialement traitées et classifiées par intelligence artificielle (Deep Learning ou apprentissage profond). Le résultat de la classification, la « carte de chaleur », est vectorisée pour répondre aux spécifications de l’OCS GE. Les données des bases existantes (BD TOPO, RPG, Fichiers fonciers, BD Forêt) sont ensuite intégrées pour compléter la couverture et l’usage.

![PVA](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/pva.png){: width=30% loading=lazy } ![IA](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/pva_ia.png){: width=30% loading=lazy } ![OCS GE](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/pva_ia_ocsge.png){: width=30% loading=lazy }

### Photo-interprétation et contrôle qualité du prestataire

#### Photo-interprétation

Par la suite les données sont photo-interprétées pour améliorer le niveau de qualité attendu de l’OCS GE mais je n'ai trouvé aucun document sur les méthodes mises en place ou sur les éléments ciblés lors de la phase de photo-interprétation réalisée par les sous-traitants de l'IGN.

Quelles ont été les marges de manœuvres en termes de photo-interprétation ?

#### Contrôle qualité

En revanche sur le département de l'Hérault (ce n'est visiblement pas le cas partout), l'IGN nous a mis à disposition les résultats du contrôle qualité réalisé par le prestataire. On y voit notamment que 2 types de vérifications ont été opérée :

1. Vérifications techniques :
- Contrôle des règles logiques (Intégrité de l'ossature, surfaces minimales, attributs complétés, cohérence des valeurs,...)
- Contrôles de topologie (Pas de trous, Non recouvrement des polygones, Absence de doublons,
Absence d’auto-intersection, Absence d’intersection de surface sans point, Absence de multi-parties)
- Contrôles sémantiques
- Contrôles de l’ossature
- Contrôle de la zone construite

2. Vérifications thématiques :
- Tirage de 10% des entités par poste (contrôle réalisé à l'aveugle)
- Vérification des postes ayant peu d'entités
- Fourniture d'une matrice de confusion (entre 93% et 100% de justesse annoncé)

### Comparaison OCS GE nouvelle et ancienne génération

Les méthodes de production étant différentes, les OCS GE ancienne et nouvelle génération ne seront pas comparables d'un point de vue statistique.

De plus, on s'aperçoit que l'OCS GE générère d'avantage de géométrie "complexe" (dents de scie, lissage, vagues) et qu'une forme de généralisation que l'on pouvait retrouver dans l'ancienne génération serait d'une part souhaitable et pourrait faciliter les mises à jour.

![Comparaison 2021/2015 : exemple 1](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_old.png){: .img-center loading=lazy }

![Comparaison 2021/2015 : exemple 2](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_old2.png){: .img-center loading=lazy }

### Contrôle par les acteurs locaux

En Occitanie, l'organisation du contrôle des données d'OCS GE a été organisé par l'IGN en lien direct avec [OpenIG](https://www.openig.org/).

Après une première réunion d'information pour :

1. présenter aux acteurs locaux les évolutions méthodologiques et technologiques
2. évoquer le contexte réglementaire associé à cette donnée.

Un atelier de formation a été organisé pour la préparer la boucle de correction de l'OCS GE afin former les acteurs locaux aux remontées de signalements via l'espace collaboratif IGN :

1. inscription à l'espace collaboratif
2. formation des utilisateurs au [plugin QGIS de l’espace collaboratif](https://espacecollaboratif.ign.fr/plugins/qgis) (vous savez le seul plugin que vous devez mettre à jour en vous authentifiant :shushing_face:)

:rotating_light: C'est à ce moment-là que ça a commencé à déraper :

1. l'IGN nous annonce que l'on ne peut faire des retours que sur la sémantique et pas sur la géométrie car je vous résume le truc : les corrections géométriques ne peuvent pas être traitées automatiquement contrairement aux corrections sémantiques :thinking: Forcément, j'ai un peu d'expérience dans le domaine de l'occupation du sol et ça m'interpelle car la simple subdivision d'une entité nécessite un découpage géométrique... je me dis que j'ai mal compris et j'interroge le référent utilisateur qui maintient que l'on ne peut faire que des remontés sémantiques et que le plugin n'est pas prévu pour ça :upside_down: Toutefois, si un problème important est identifié il faut envoyé les éléments par mail...
2. les retours doivent être fait depuis le plugin QGIS et là je me dis que je ne vais pas pouvoir impliquer mes collègues hors SIG car nous n'avons aucun QGIS de déployé en dehors du SIG donc en terme de collaboratif ça va se limiter à l'expertise du service. D'autant plus que l'IGN ne livre aucun projet de contrôle de la donnée et que le formulaire est des plus minimaliste (aucune liste de valeurs préparée pour saisir une valeur US/CS). Clairement les outils ne sont pas adaptés à un contrôle élargi.

#### Contrôle du premier millésime

Dans l'Hérault le contrôle était initialement prévu pour tomber en pleine période des vacances de Noël mais a été repoussé du 2/01 au 22/01 sauf que sans plus d'explication la donnée nous a été finalement livrée le 15/01 pour une fin de saisie au 2/02 (15 jours ouvrés de remontés).

Autant vous dire qu'en terme d'organisation interne ce n'est pas facile à planifier... mais pas le choix étant donné les enjeux de suivi du territoire l'objectif est de contrôler l'intégralité de notre territoire. Et pour m'aider dans ce travail, j'ai pu m'appuyer à la fois sur ma connaissance terrain et sur la donnée d'occupation du sol que nous produisons en interne.

##### Des géométries complexes

Bien qu'on nous demande de ne pas intervenir sur les géométries, on se rend rapidement compte que les anomalies liées aux méthodes de productions (utilisation de l'IA et intégration automatique de données exogènes) sont récurrentes et ces géométries "farfelues" risquent de poser des problèmes lors des mises à jour, je suis donc curieux de voir comment l'IGN va les gérer ça sur le long terme.

![Géométrie : exemple 1](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_geometrie.png){: width=49% loading=lazy } ![Géométrie : exemple 2](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_geometrie2.png){: width=49% loading=lazy }

##### Des voies flottantes

Parmi les autres anomalies récurrentes que nous avons pu constater, il y a des voies flottantes qui ne sont pas raccordées au reste du réseau alors que la continuité nous parait importante dans une logique d'harmonisation.

![Voie flottante : exemple 1](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_voies_flottantes.png){: width=49% loading=lazy } ![Voie flottante : exemple 2](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_voies_flottantes2.png){: width=49% loading=lazy }

##### Des espaces publics mal qualifiés

Nous avons aussi été surpris de constater que des espaces publics connus de tous et clairement identifiés soient mal qualitfiés. Notamment des parcs publics classifiés comme de l'agricole ou encore une déchetterie en construction classée en zone d'extraction alors qu'elle a fait l'objet d'un [géosignalement pris en compte par l'IGN il y a près de 2 ans](https://espacecollaboratif.ign.fr/georem/674356).

![Espace public : exemple 1](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_espace_public.png){: width=49% loading=lazy } ![Espace public : exemple 2](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_espace_public2.png){: width=49% loading=lazy }

Où encore une aire d'autoroute classée en zone à matériaux minéraux alors qu'il s'agit bien d'une zone non bâtie (La surface est non négligeable).

![Espace public : exemple 3](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_espace_public3.png){: width=49% .img-center loading=lazy }

##### Des problèmes d'homogénéité de traitement

Ici des problèmes sont récurrents sur le traitement de zone en transition comme les friches agricoles. Elles peuvent être visuellement très proche mais classifiées de manière différentes.

Il peut également y avoir une des anomalies dans la détection des vergers et des vignes.

![Harmonisation : exemple 1](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_harmonisation.png){: width=49% loading=lazy } ![Harmonisation : exemple 2](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_harmonisation2.png){: width=49% loading=lazy }

Sur l'usage des erreurs parfois flagrante comme ici où l'espace associé au réseau ferré est classé comme espace associé au réseau routier.

![Harmonisation : exemple 4](https://cdn.geotribu.fr/img/articles-blog-rdp/articles/2024/ocsge/ocsge_ng_harmonisation4.png){: width=49% .img-center loading=lazy }

#### Un bilan sur le contrôle du premier millésime

L'implication des acteurs locaux et leur connaissance du territoire est indispensable pour garantir d'une part la qualité de la donnée et son appropriation hors aujourd'hui ce n'est pas forcément le cas :

- de nombreux acteurs n'ont pas participé à la boucle de correction, souvent par manque de temps ou par manque de compétences interne ce qui fait qu'il y a des zones importantes ne seront jamais contrôlées
- d'autres acteurs ont eux le sentiment de ne pas être écouté dans leur retour ou de ne pas avoir de visibilité sur les signalements remontés avec le sentiment qu'il n'y a pas de réelle volonté de les intégrer dans le processus de production (on est sur de la com').

## Avancement du projet

Pour ceux qui n'auraient pas suivi, voici une carte vous présente l'avancée de la production de l'OCS GE.

<iframe width="100%" height="600" src="https://macarte.ign.fr/carte/VVpbhc/Production-de-l-OCS-GE-NG"></iframe>

## L'OCS GE, quelques chiffres

D'après les éléments du projet de loi de finance de 2024, le budget prévu pour : **"Le projet OCS GE, qui concerne également le P345 et P135, a un coût total de 30,36 M€ en AE[^1] = CP[^2] selon les données de la DINUM (direction interministérielle du numérique)."

Concernant la production stricte de l'OCS GE le coût était de 18,578 M€ mais au vu des évolutions réglementaires et de la mise en place plus tardive que prévue de la chaîne de production par intelligence artificielle, le budget a été revu à la hausse pour passer à 20.15 M€

| | Au lancement | Actualisation | Ecart en % |
| :--------------------- |:---------------------:|:---------------------:|:---------------------:|
| Coût total en M€ | 18,58 | 20,15 | +8,47% |
| Durée totale en mois | 30 | 48 | +60% |

[Source PLF 2024](https://www.budget.gouv.fr/files/uploads/extract/2024/PLF/BG/PGM/113/FR_2024_PLF_BG_PGM_113_JPE.html)

----

## Conclusion

L'objectif de cet article est de partager notre expérience sur le contrôle de l'OCS GE nouvelle généralisation et de sensibiliser les acteurs locaux sur les problèmes auxquels nous avons été confronté (méthodes, qualité des données produites,...).

N'hésitez pas à partager votre retour d'expérience en commentaire ou sur l'espace OSMOSE de l'IGN.

[:material-format-list-bulleted-type: Rejoindre la communauté OSMOSE de l'IGN](https://geoservices.ign.fr/rejoindre-la-communaute-ocs-ge){: .md-button }
{: align=middle }

----

## Auteur {: data-search-exclude }

--8<-- "content/team/fbor.md"

<!-- Notes de bas de page -->
[^1]: AE : autorisations d'engagement ([Source](https://www.economie.gouv.fr/cedef/difference-autorisation-engagement-credit-paiement))
[^2]: CP : crédit paiement ([Source](https://www.economie.gouv.fr/cedef/difference-autorisation-engagement-credit-paiement))
Loading