Image de la métropole combinant plusieurs informations quantitatives.

Introduction

Des données et une ville

On parle aujourd’hui de plus en plus de big data, de data analysis, de ville intelligente. Mais qu’en est-il dans les faits ? Quelles informations nous donnent les données actuellement disponibles en France ?

Les lois récentes, au niveau européen comme national, poussent largement les collectivités territoriales à ouvrir leurs données. Cela consiste à mettre en place une plateforme accessible en ligne où sont disponibles plusieurs couches géographiques ou non de données.

Dans cette lignée, l'INSEE, l'IGN, le CEREMA et d’autres entités affiliées au secteur public ont également ouvert une grande partie de leurs données quantitatives (statistiques, recensement, cartes de la BDTOPO, informations sur les DPE, etc.).

Ce bref travail a cet objectif double :

  1. détailler les données utilisables et quelques méthodes simples d’analyse inspirées de la data science actuelle, et
  2. construire un exemple sur la métropole du Grand Lyon.

Ce travail est en grande partie inspiré ou issu de ma thèse de doctorat (voir ici pour plus d’informations) dont le manuscrit est gratuitement disponible ici.

Présentation de la démarche

Méthodologie

La méthode d’extraction et d’utilisation des données s’appuie sur plusieurs axes principaux :

  • un découpage spatial fixe ;
  • un ensemble de données sélectionnées ;
  • le choix et l’application d'algorithmes statistiques.

Le découpage statistique officiel de l’INSEE

J’ai choisi d’utiliser le découpage spatial national qu’est celui des IRIS. Cette division du territoire a été créée à la fin du XXème siècle pour accompagner le recensement statistique et assurer l’anonymat des individus. Chaque zone correspond environ à 2 000 habitants (sauf pour certaines communes de moins de 5 000 habitants).

Carte des IRIS de la métropole de Lyon (couleurs arbitraires).

La métropole rassemble ainsi 512 IRIS pour les 59 communes de son territoire.

Des données pertinentes largement publiques

Les grands fournisseurs de données publiques sont les suivants :

  • l'IGN pour les données géographiques (BDTOPO, routes, végétation, etc.),
  • l'INSEE pour les données statistiques relatives à la population et aux entreprises (SIRENE),
  • les collectivités territoriales elles-mêmes pour des données supplémentaires spécifiques (ortophotographies aériennes par exemple).

Dans un deuxième temps, on peut se pencher sur des sources supplémentaires qui n’ont pas été utilisées ici avec, par exemple :

  • des données énergétiques comme celles des gestionnaires de réseaux (Enedis ou GRDF),
  • les données de diagnostics de performance énergétique (DPE) pour les logements et les bâtiments tertiaires,
  • les demandes de valeurs foncières (ou DVF) correspondant aux ventes et mutations de terrains (notamment) disponibles sur ce site.

Pour faciliter la lecture des résultats, nous ne prenons ici que les données les plus simples, c’est-à-dire celles de l’IGN et de l’INSEE.

La liste non exhaustive des données utilisées ici va comme suit :

  • Répartition d’usage des sols entre routes, bâti, végétation (IGN)
  • Coefficients d’emprise et d’occupation des sols (IGN)
  • Caractéristiques des parcelles (Cadastre)
  • Répartition des usages de bâtiments (INSEE, SIRENE)
  • Caractéristiques des bâtiments, chauffage, voiture, garage, etc. (INSEE).

Les algorithmes déployés

Notre procédé se déroule selon les étapes suivantes :

  1. Afficher quelques corrélations de variables afin d’étudier les relations entre certains paramètres urbains,
  2. Procéder à une analyse en composantes principales (ACP) pour déterminer les paramètres les plus importants, et enfin
  3. Construire des archétypes urbains par clustering (algorithme des k-means).

Cartes des données

Visualisation de quelques informations quantitatives

Carte de la population.

Carte de la densité moyenne de population par IRIS.

Carte de la hauteur moyenne de bâtiments.

Carte de moyenne de proportions de surface occupée par de la nature d’après la BDTOPO de l’IGN.

Carte de l’entropie (ou de l’hétérogénéité) de l’utilisation des sols d’après le projet Corine Land Cover (Copernicus).

Carte du coefficient d’emprise au sol moyen par IRIS.

Carte de moyenne de proportion de surface occupée par des routes d’après la BDTOPO de l’IGN.

Faits marquants des données

Quelques informations extraites des données brutes

Les caractéristiques urbaines ont été séparées entre occupation des sols et bâtiments. De la sorte, nous procédons un peu à la façon dont l’aménagement fonctionne : d’abord aborder avec la répartition des usages, les espaces publics par le travail des urbanistes, ensuite avec la construction des bâtiments et l’appel aux architectes.

Sur l’occupation des sols

Corrélations entre le coefficient d’emprise au sol et le pourcentage de surface occupée par de la végétation pour les IRIS de la métropole.

Assez logiquement, on constate sur la première figure que les IRIS très denses, proches du centre de la métropole (en jaune), sont opposés à des quartiers moins denses et plus périphériques (en violet). On note également que ces IRIS extérieurs présentent une proportion de nature logiquement plus importante. Toutefois, on note que les quartiers se distribuent sur l’ensemble des possibilités : une forme d’organisation de la nature en ville ne prévaut pas sur les autres.

Corrélations entre l'aire moyenne des îlots et le pourcentage de surface occupée par des routes pour les IRIS de la métropole.

Le rapport entre la taille des îlots et la superficie de routes est par contre beaucoup plus resserré autour d’un ratio fixe (d’environ -0.04). Ces deux données sont assez logiquement liées puisqu’elles le sont physiquement. On retrouve un gradient selon la distance au centre. Les formes urbaines respectent une loi : à beaucoup de routes des petits îlots et inversement.

Corrélations entre le coefficient d’occupation des sols et le pourcentage de surface occupée par des routes pour les IRIS de la métropole.

La dernière figure illustre la relation entre le COS (ou coefficient d’occupation des sols) et la présence de routes. On constate deux parties à ce graphe :

  • la première dans le quadrant inférieur gauche avec une quasi linéarité restreinte pour les IRIS périphériques;
  • la seconde dans le reste pour les IRIS du centre de la métropole qui se répartissent dans une zone beaucoup plus large et avec un autre coefficient de linéarité.

Sur les bâtiments

La variabilité des relations est beaucoup plus importante pour les caractéristiques des bâtiments. Il y a une plus grande diversité de bâtiments que de formes urbaines.

Corrélations entre l'âge moyen estimé des bâtiments et la densité de population pour les IRIS de la métropole.

Il est déjà possible d’étudier la répartition temporelle des bâtiments. On identifie ainsi trois ensembles principaux d’IRIS :

  1. ceux proches du centre et plus anciens (1920-1960) qui présentent des densités relativement fortes par rapport à la moyenne métropolitaine (0.0422),
  2. ceux de densités également élevées mais plus récents (1960-1990) et qui se répartissent plus largement sur le territoire de la métropole, et enfin
  3. les IRIS plus larges, plus éloignés, beaucoup moins denses et qui correspondent aux mêmes périodes (1960-1990).

Corrélations entre l'âge moyen estimé des bâtiments et la hauteur des bâtiments pour les IRIS de la métropole.

Quand on combine cette donnée avec le rapport entre hauteur des bâtiments et âge des bâtiments, on constate également la présence de trois groupes d’IRIS.

  1. Les IRIS du centre, qui suivent une droite, les bâtiments les plus hauts correspondant aux bâtiments les plus anciens (1920-1960).
  2. Un ensemble plus resserré dans le temps et avec une même variété de hauteurs différentes pour une seule période (1960-1990). Ces IRIS sont toutefois répartis sur l’ensemble du territoire.
  3. Des bâtiments de plus petites tailles sur la période 1950-1990 et situés dans des IRIS plus larges et plus éloignés.

Corrélations entre le nombre de bâtiments moyen par IRIS et la hauteur des bâtiments pour les IRIS de la métropole.

Si l’on cherche à affiner la caractérisation de ces bâtiments de plus petites tailles, la figure précédente met en évidence différents profils. D’une part, on a les bâtiments qui se regroupent par très grands nombres (jusqu’à 3 000 ou 4 000 par IRIS), tandis que dans d’autres cas, ils sont très peu nombreux (moins de 200 bâtiments par IRIS). Cela sépare les zones résidentielles denses des zones plus rurales et moins denses.

Corrélations entre la densité et la hauteur des bâtiments pour les IRIS de la métropole.

De ces premières constations, on peut ressortir quelques premières conclusions partielles :

  • Que les bâtiments les plus hauts et les plus anciens sont concentrés dans le centre de la métropole;
  • Que l’on a poursuivi la construction de bâtiments de haute taille mais sur l’ensemble du territoire sur la période 1960-1990 (tours, grands ensembles, etc.);
  • Que des maisons individuelles (de petite taille) ont été largement construites sur la période des Trente Glorieuses;
  • Que les nouvelles formes de constructions de la période 1960-1990 ont abouti à des bâtiments aussi denses que le centre historique (mais dans quel contexte urbain ?).

Corrélations entre l'âge moyen estimé des bâtiments et la possession d’une place de stationnement pour les IRIS de la métropole.

Le transport est également un facteur important d'influence sur la morphologie des villes. La possession de voiture et celle de place de stationnement sont des paramètres marquants corrélés à la densité de population mais aussi à l’âge des bâtiments. La figure précédente souligne ainsi que la prise en compte du besoin de stationnement de véhicules individuels près des logements est une problématique récente mais également que plus la densité est faible et plus l’équipement en stationnement est grand. On note également une répartition similaire (mais renversée) à celle de la hauteur par rapport à l’âge des bâtiments.

Corrélations entre la hauteur moyenne des bâtiments et la proportion de bâtiments dédiés au secteur tertiaire pour les IRIS de la métropole.

Enfin, la répartition des usages des bâtiments (et donc indirectement la programmation urbaine des zones) est-elle liée aux caractéristiques physiques ? Cela parait logique, des tours de bureaux étant plus fréquentes que de logements. Néanmoins, cette thématique est plutôt marquée par la sempiternelle distinction centre de métropole et périphéries.

Conclusions

Quelles conclusions pouvons-nous tirer de ces analyses de corrélations ?

Conclusions

Éléments saillants de l’exercice

Une densité logiquement répartie

Pas de solution unique pour améliorer la densité