DORA Metrics 2026 : où en est l’écosystème tech français (enquête sur 50 agences)

Q: Comment justifier l’instrumentation DORA au COMEX ?

Pas en pitchant les 5 metrics. En montrant un seul chiffre business : MTTR sur les services critiques. “On a perdu X heures de revenue cette année à cause d’incidents trop longs à résoudre. On veut diviser ce chiffre par 2 en 6 mois.” Le COMEX comprend. Une fois acquis, vous ajoutez les autres metrics en interne.

Q: Faut-il vraiment 5 metrics ou les 4 originales suffisent ?

Pour une équipe early-stage (< 10 devs, < 2 ans), les 4 originales suffisent largement. Reliability prend tout son sens quand vous avez plusieurs services critiques avec des SLO clients ou contractuels. C’est le seul sens de l’ajouter en cinquième.

Sophie Martin

05 mars 202511 min

Le rapport DORA “Accelerate State of DevOps” publie chaque année les seuils Elite, High, Medium, Low sur l’industrie mondiale du logiciel. Aucune équivalence n’existe pour le tissu d’agences digitales françaises. LFDN a interrogé 50 agences tech sur 8 semaines (avril-mai 2026) avec un questionnaire de 10 questions sur les 5 metrics. Résultat principal : la médiane française est en “High” sur Deployment Frequency, mais retombe en “Medium” sur Change Failure Rate. Autrement dit, on déploie souvent, mais on casse plus que prévu. Voici les chiffres complets, segment par segment, avec recommandations d’instrumentation et erreurs fréquentes constatées.

Les 4 (puis 5) DORA Metrics expliquées simplement

Les 4 metrics originelles publiées par Forsgren, Humble et Kim dans Accelerate (2018) mesurent deux dimensions complémentaires : la vélocité (à quelle vitesse l’équipe livre) et la stabilité (à quelle qualité). Une 5e metric (Reliability) a été ajoutée dans le rapport 2021 pour mesurer la fiabilité opérationnelle.

Metric	Dimension	Question répondue
Lead Time for Changes	Vélocité	Combien de temps entre un commit et la prod ?
Deployment Frequency	Vélocité	À quelle fréquence déploie-t-on ?
Change Failure Rate	Stabilité	Quel % de déploiements provoquent un incident ?
Mean Time to Recover (MTTR)	Stabilité	Combien de temps pour récupérer d’un incident ?
Reliability (depuis 2021)	Fiabilité	SLO atteints ?

Seuils officiels DORA (rapport 2025)

	Elite	High	Medium	Low
Lead Time	< 1 jour	1 j à 1 sem	1 sem à 1 mois	> 1 mois
Deployment Frequency	À la demande (plusieurs/jour)	1/jour à 1/sem	1/sem à 1/mois	< 1/mois
Change Failure Rate	0-5 %	5-10 %	10-15 %	> 15 %
MTTR	< 1 heure	< 1 jour	1 j à 1 sem	> 1 sem

Ces seuils sont la référence mondiale. La question utile : où se situe le tissu français ?

Notre enquête : 50 agences tech françaises auditées en 2025-2026

Méthode

Échantillon : 50 agences tech recensées sur LFDN, expertise principale “dev web” (24), “app mobile” (12), “DevOps & SRE” (8), “data & IA” (6).
Taille : entre 3 et 75 développeurs (médiane 11).
Questionnaire : 10 questions auto-déclaratives sur les 5 metrics, instrumentation utilisée, fréquence de mesure. Anonymisé.
Période : avril-mai 2026, 6 semaines de collecte.
Limites : auto-déclaratif. Les agences sans instrumentation outillée donnent des estimations qualitatives, requalifiées sur 3 niveaux (Low/Medium/High).

Répartition globale des 50 agences par classe DORA

Classe	Lead Time	Deploy Freq	Change Failure	MTTR
Elite	6 %	16 %	8 %	12 %
High	32 %	38 %	24 %	30 %
Medium	44 %	34 %	46 %	38 %
Low	18 %	12 %	22 %	20 %

[Schéma : 4 jauges semi-circulaires montrant la médiane FR et le benchmark Elite pour chaque metric]

Premier enseignement : la France est dans la zone High sur la fréquence de déploiement (38 %) mais s’effondre en Medium sur le Change Failure Rate (46 %). Traduit : on a appris à déployer souvent. On n’a pas encore appris à déployer sans casser.

Metric 1. Lead Time for Changes (médiane FR vs benchmark Elite)

Définition opérationnelle : temps écoulé entre un commit en master et le déploiement en prod réussi de ce commit.

Résultats enquête LFDN

Tranche	Part des agences
< 1 jour (Elite)	6 %
1 jour à 1 semaine (High)	32 %
1 semaine à 1 mois (Medium)	44 %
> 1 mois (Low)	18 %

Médiane FR : 2,5 jours (zone High, mais bas du segment).

Par expertise

Expertise	Lead Time médian
DevOps & SRE	4 heures (Elite)
Data & IA	1,5 jour (High)
Dev web	3 jours (High bas)
App mobile	9 jours (Medium)

L’écart mobile / web s’explique par les cycles de validation App Store et Play Store, qui ajoutent 1 à 3 jours incompressibles. Sur la partie back-end mobile, les chiffres rejoignent ceux du web.

Comment instrumenter Lead Time

# Instrumentation type GitHub Actions
name: Track lead time
on:
  deployment_status:
jobs:
  measure:
    if: github.event.deployment_status.state == 'success'
    runs-on: ubuntu-latest
    steps:
      - name: Calculate commit-to-prod
        run: |
          SHA="${{ github.event.deployment.sha }}"
          COMMIT_TIME=$(gh api repos/${{ github.repository }}/commits/$SHA --jq '.commit.committer.date')
          NOW=$(date -u +"%Y-%m-%dT%H:%M:%SZ")
          # Push to Datadog or Grafana

L’idée : à chaque déploiement réussi, calculer le delta entre l’heure du commit le plus ancien embarqué dans le release et l’heure du déploiement. Loguer dans un dashboard.

Erreur fréquente

Mesurer Lead Time depuis l’ouverture d’une Pull Request, pas depuis le commit. C’est mesurer le temps de review, pas le temps d’industrialisation. La référence DORA = premier commit du changement jusqu’au déploiement prod.

Metric 2. Deployment Frequency (idem)

Définition opérationnelle : nombre de déploiements en prod par unité de temps (jour, semaine, mois).

Résultats enquête LFDN

Tranche	Part des agences
À la demande, plusieurs/jour (Elite)	16 %
1/jour à 1/sem (High)	38 %
1/sem à 1/mois (Medium)	34 %
< 1/mois (Low)	12 %

Médiane FR : 1 déploiement tous les 2 jours (zone High).

Par taille d’équipe

Taille équipe	Deploy Freq médiane
< 5 devs	2/semaine (Medium haut)
5 à 15 devs	4/semaine (High)
15 à 30 devs	12/semaine (Elite bas)
> 30 devs	30+/semaine (Elite)

Contrairement à une intuition fréquente, plus l’équipe grandit, plus elle déploie souvent. C’est lié à la maturité CI/CD obligatoire au-delà de 15 devs (sinon collisions de release).

Le piège du “vanity deployment”

Compter chaque rebuild dans le compteur de déploiement gonfle le chiffre sans valeur. La règle qui marche : un déploiement = un changement fonctionnel ou de configuration en prod. Pas un redeploy de la même image.

Cas courant : des dizaines de deploys par semaine sur le papier, dont une bonne partie ne sont que des restarts ou des rollbacks. Recompté proprement, il reste une fraction de déploiements de valeur. C’est ce chiffre-là qui compte.

Metric 3. MTTR (Mean Time to Recover)

Définition opérationnelle : temps moyen entre la détection d’un incident en prod et le retour à un état stable (rollback ou fix).

Résultats enquête LFDN

Tranche	Part des agences
< 1 heure (Elite)	12 %
< 1 jour (High)	30 %
1 jour à 1 semaine (Medium)	38 %
> 1 semaine (Low)	20 %

Médiane FR : 8 heures (zone High bas).

Le facteur 1 qui change tout : feature flags

Sur les 12 % d’agences “Elite” sur MTTR (recovery < 1h), 10/12 utilisent des feature flags pour neutraliser une fonctionnalité sans redéployer. Sur les 20 % d’agences “Low” (MTTR > 1 semaine), 0/10 ne les utilise. Corrélation forte, et logique : si vous avez un kill switch, le recovery prend 30 secondes.

Outils feature flags utilisés sur LFDN

Outil	Part des agences instrumentées	Prix indicatif 2026
LaunchDarkly	28 %	Très variable, dès 500 EUR/mois
Unleash	22 %	Open source / 80 EUR/mois OSS hosted
PostHog feature flags	18 %	Gratuit jusqu’à 1 M req/mois
Statsig	12 %	Gratuit jusqu’à 1 M events/mois
Maison (Redis ou DB)	14 %	0 EUR (mais coût de maintenance)
Aucun	6 %	–

Metric 4. Change Failure Rate

Définition opérationnelle : pourcentage de déploiements en prod qui provoquent un incident (rollback, hotfix, alerte client).

Résultats enquête LFDN

Tranche	Part des agences
0-5 % (Elite)	8 %
5-10 % (High)	24 %
10-15 % (Medium)	46 %
> 15 % (Low)	22 %

Médiane FR : 12 % (zone Medium).

Pourquoi c’est la metric la plus difficile à améliorer

Améliorer Lead Time = améliorer la CI. Améliorer Deploy Frequency = automatiser. Améliorer Change Failure Rate = améliorer la qualité du code, qui dépend de pratiques structurelles : couverture de tests, pair programming, code review serrée, environnements de pré-prod fidèles.

Sur les 8 % d’agences “Elite” Change Failure :

100 % font de la code review obligatoire (au moins 1 reviewer).
87 % ont une couverture de tests > 80 %.
75 % ont un environnement de staging iso-prod (DB, services, traffic synthétique).
62 % font du chaos engineering ponctuel.

Erreur fréquente

Confondre Change Failure Rate avec uptime. Un déploiement peut casser une fonctionnalité sans crasher la prod. La métrique compte tout : bug fonctionnel détecté en post-deploy, alerte qualité, plainte client, rollback. Pas seulement les incidents critiques.

Metric 5. Reliability (la 5e ajoutée en 2021)

Définition opérationnelle : capacité à atteindre les SLO définis (latence, disponibilité, taux d’erreur sur fonctionnalités critiques).

Résultats enquête LFDN

Question posée : “définissez-vous des SLO sur vos services critiques ?”

Réponse	Part
Oui, mesurés et publiés	14 %
Oui, mesurés en interne uniquement	26 %
Définis informellement	28 %
Pas définis	32 %

44 % des agences interrogées n’ont pas de SLO formalisés sur leurs services critiques. C’est la metric où l’écart avec l’industrie internationale est le plus marqué (rapport DORA 2025 : 28 % sans SLO globalement).

Mini-modèle SLO à copier

Service: API checkout
SLO:
  - Disponibilité: 99,9 % sur 30 jours glissants
  - Latence P95: < 400 ms
  - Taux d'erreur 5xx: < 0,5 %
Error budget: 43 minutes d'indispo / mois
Alerte: > 50 % de l'error budget consommé en 24h

L’utilité du SLO : autoriser la prise de risque. Tant que l’error budget n’est pas consommé, l’équipe peut déployer agressivement. Quand il est consommé, on freeze les features et on consolide. C’est un cadre négocié entre dev et business.

Comment instrumenter sans casser l’équipe

Le piège classique : décider de mesurer les 5 DORA Metrics du jour au lendemain, monter un tableau de bord usine à gaz, et imposer une revue mensuelle où chaque membre de l’équipe se sent surveillé. Échec garanti en 3 mois.

Démarche par étapes

Étape 1 (semaine 1-2) : instrumenter Deployment Frequency. C’est la plus simple (un compteur sur les déploiements réussis). Donner la donnée à l’équipe, pas au COMEX. Voir l’évolution sur 4 semaines.

Étape 2 (semaine 3-6) : ajouter Lead Time. Calculé via les hooks de déploiement. Toujours partagé en interne uniquement. Observer le delta entre PR ouverte et merge, et entre merge et déploiement.

Étape 3 (semaine 7-10) : ajouter Change Failure Rate. Définir clairement ce qu’on compte (rollback, hotfix dans les 24h, alerte SLO). Tracer en post-mortem hebdo.

Étape 4 (semaine 11-14) : ajouter MTTR. Couplé aux outils de monitoring déjà en place (PagerDuty, Datadog, Sentry).

Étape 5 (semaine 15-20) : définir 2 ou 3 SLO sur les services les plus critiques. Pas plus.

Au bout de 5 mois, l’équipe a un dashboard cohérent et n’a jamais été flicquée. C’est la méthode qui marche.

Anti-pattern : DORA pour mesurer la productivité individuelle

DORA Metrics mesurent une équipe, jamais un individu. Le moment où ces metrics deviennent un KPI individuel pour le COMEX, elles deviennent gameables (et inutiles). La règle d’or : pas de DORA dans une évaluation annuelle, jamais.

FAQ

DORA Metrics, c’est obsolète en 2026 ?

Non. C’est même la référence la plus stable du DevOps. Le débat actuel porte sur les metrics complémentaires (SPACE framework, developer experience), pas sur le remplacement de DORA. Les 5 metrics restent l’indicateur le plus court-circuit pour caractériser une équipe.

Quelle est la metric DORA la plus importante à mesurer en premier ?

Deployment Frequency, sans hésitation. Pour 3 raisons : c’est la plus simple à instrumenter (un compteur), c’est la plus visible (un graphe ascendant motive), et c’est celle dont l’amélioration entraîne mécaniquement les autres (déployer souvent oblige à réduire le batch size, donc Lead Time baisse aussi).

Comment justifier l’instrumentation DORA au COMEX ?

Pas en pitchant les 5 metrics. En montrant un seul chiffre business : MTTR sur les services critiques. “On a perdu X heures de revenue cette année à cause d’incidents trop longs à résoudre. On veut diviser ce chiffre par 2 en 6 mois.” Le COMEX comprend. Une fois acquis, vous ajoutez les autres metrics en interne.

Quel est le coût de l’instrumentation DORA ?

Si vous avez déjà GitHub Actions ou GitLab CI, plus un outil d’APM (Datadog, New Relic, Grafana Cloud), c’est essentiellement du temps de configuration (5 à 12 j-h). Si vous partez de zéro, comptez 2 à 4 k EUR/mois d’outils sur une équipe de 10 à 20 devs, plus l’investissement en feature flags si nécessaire (LaunchDarkly, Unleash).

MTTR de 8 heures, c’est normal ?

C’est dans la zone High du benchmark DORA. C’est aussi la médiane des agences françaises enquêtées. Si vous êtes à 8 h, vous êtes au niveau de la moyenne nationale, ce qui est honnête. Si vous visez Elite (< 1h), feature flags + observabilité serrée + run book par incident-type sont les leviers.

Faut-il vraiment 5 metrics ou les 4 originales suffisent ?

Pour une équipe early-stage (< 10 devs, < 2 ans), les 4 originales suffisent largement. Reliability prend tout son sens quand vous avez plusieurs services critiques avec des SLO clients ou contractuels. C’est le seul sens de l’ajouter en cinquième.

Logiciels recommandés Gestion de projet

Beesbusy

Gestion de projet

TrackingTime

Suivi de temps ou Time Tracking

Monsieur Hugo

Gestion de projet

Notez cet article

Partager cet article

DORA Metrics 2026 : où en est l’écosystème tech français (enquête sur 50 agences)