INDÉPENDANT — AUCUNE COMMISSION PERÇUE · DONNÉES 100% PUBLIQUES · 703 EHPAD · 8 DÉPARTEMENTS IDF
SOURCES : HAS · CNSA · ARS · FINESS · data.gouv.fr

Notre méthodologie — Données publiques, zéro conflit d'intérêts

SeniorVigil n'est pas un annuaire. C'est un scanner de conformité. Nous croisons exclusivement des données publiques françaises, vérifiables par quiconque, pour produire des fiches d'établissement factuelles. Pas d'avis subjectifs. Pas de scores maison. Pas de classements sponsorisés. Les données parlent ; nous les rendons lisibles.

Pourquoi un scanner, pas un comparateur

Un comparateur agrège et simplifie. Il attribue des scores composites, pondère selon des critères choisis par ses créateurs, et finit inévitablement par produire un classement. Le problème : qui décide que l'hygiène alimentaire vaut 20 % et le tarif 30 % ? Ces pondérations sont des jugements de valeur déguisés en objectivité.

SeniorVigil refuse cette approche. Nous affichons les données brutes par critère, telles que publiées par les autorités compétentes. Quand un signal est objectivement alarmant — note HAS D, hygiène alimentaire « À corriger de manière urgente », critères impératifs non atteints — nous le signalons comme un red flag binaire, pas comme un point dans un score.

La décision reste celle des familles. Notre travail est de s'assurer qu'elles disposent des mêmes informations que les autorités de contrôle.

Les 5 piliers de données

Chaque fiche d'établissement est construite par croisement de ces sources publiques. L'identifiant unique de jointure est le SIRET, complété par le numéro FINESS pour les sources qui n'utilisent pas le SIRET. Aucune donnée ne provient des établissements eux-mêmes.

FINESS

Répertoire exhaustif de tous les établissements sanitaires, sociaux et médico-sociaux en France. Chaque EHPAD y est identifié par un numéro FINESS unique et un SIRET. C'est notre colonne vertébrale : sans FINESS, un établissement n'existe pas légalement.

Éditeur
Ministère de la Santé — DREES
Champs exploités
Numéro FINESS (EJ et ET), SIRET, raison sociale, adresse, coordonnées GPS, catégorie d'établissement, statut juridique, date d'ouverture.
Fréquence
Mensuelle
Clé de jointure
FINESS ET (identifiant établissement) et SIRET (identifiant entreprise INSEE)
Source
data.gouv.fr

CNSA Tarifs

Tarifs journaliers déclarés par chaque EHPAD : hébergement permanent (chambre simple et double) et tarifs dépendance par niveau de GIR. Ce sont les tarifs opposables, pas des estimations commerciales.

Éditeur
Caisse Nationale de Solidarité pour l'Autonomie (CNSA)
Champs exploités
Prix hébergement chambre simple/double (€/jour), tarifs dépendance GIR 1-2 / 3-4 / 5-6 (€/jour).
Fréquence
Mensuelle
Clé de jointure
FINESS ET
Source
data.gouv.fr

HAS Qualiscope

Résultats des évaluations qualité obligatoires, réalisées par des organismes accrédités. Chaque EHPAD reçoit une cotation globale (A, B, C ou D) et des scores détaillés sur 3 chapitres : bientraitance et droits, accompagnement de la personne, pilotage de l'établissement. 18 critères impératifs sont vérifiés.

Éditeur
Haute Autorité de Santé (HAS)
Champs exploités
Cotation globale (A à D), scores par chapitre (/4), nombre de critères impératifs atteints (/18), date de visite, statut juridique.
Fréquence
Trimestrielle (bulk data.gouv.fr)
Clé de jointure
FINESS EJ (entité juridique, pas établissement — point d'attention technique documenté)
Source
data.gouv.fr

Alim'confiance

Résultats des inspections sanitaires de la restauration collective, incluant les cuisines d'EHPAD. Quatre niveaux : « Très satisfaisant », « Satisfaisant », « À améliorer », « À corriger de manière urgente ». Un EHPAD facturant 150 €/jour avec une cuisine « À corriger » est une information que les familles méritent de connaître.

Éditeur
Ministère de l'Agriculture et de la Souveraineté alimentaire — DGAL
Champs exploités
Niveau d'hygiène (4 niveaux), date d'inspection, SIRET de l'établissement, adresse.
Fréquence
Hebdomadaire
Clé de jointure
SIRET (exact) puis correspondance par nom normalisé en fallback
Source
data.gouv.fr

Judilibre

En cours d'intégration

Base de données ouverte des décisions de justice françaises. Interrogeable par nom de groupe ou d'établissement pour identifier les condamnations prud'homales (indicateur de conditions de travail), les contentieux avec les familles et les procédures pénales. Source en cours d'intégration.

Éditeur
Cour de cassation
Champs exploités
Juridiction, date, type de contentieux, résumé, lien vers la décision complète.
Fréquence
Continue
Clé de jointure
SIRET ou nom de groupe
Source
data.gouv.fr

Logique de croisement

Le SIRET est l'identifiant pivot. Attribué par l'INSEE, il identifie de manière unique chaque établissement dans toutes les bases administratives françaises. Nous l'utilisons pour relier les données FINESS, Alim'confiance et les futures sources Pappers (gouvernance d'entreprise) et Judilibre (jurisprudence).

Un point d'attention technique : la HAS indexe ses évaluations par numéro FINESS de l'entité juridique (EJ), pas de l'établissement (ET). La jointure HAS se fait donc sur le FINESS EJ, tandis que les autres sources utilisent le FINESS ET ou le SIRET. Ce piège, identifié lors du prototypage initial, est géré automatiquement par notre pipeline.

Quand le SIRET est absent ou invalide dans la source FINESS (cas observé sur certains établissements publics), le pipeline log un avertissement et tente une correspondance par SIREN (9 premiers chiffres). L'EHPAD reste dans la base, mais les enrichissements dépendant du SIRET ne sont pas appliqués — plutôt une fiche incomplète qu'une fiche fausse.

Comment nous vérifions les données — protocole en 7 étapes

Chaque fiche d'établissement publiée sur SeniorVigil passe par sept étapes de vérification, automatisées et reproductibles. Le code source du pipeline est public, les données d'entrée sont des jeux ouverts data.gouv.fr, le résultat est vérifiable de bout en bout.

  1. 1 Téléchargement des sources avec horodatage. Chaque dataset public (FINESS, CNSA, HAS Qualiscope, Alim'confiance, Judilibre) est téléchargé depuis son URL canonique data.gouv.fr avec sa date de publication, sa licence et son hash SHA-256 pour traçabilité. Aucune donnée n'est récupérée par scraping ou par moyen non documenté.
  2. 2 Validation structurelle. Chaque enregistrement est validé contre un schéma typé (identifiants FINESS/SIRET/SIREN au bon format, dates ISO, codes catégories autorisés). Les lignes invalides sont logguées et écartées avec une trace d'erreur, pas silencieusement ignorées.
  3. 3 Croisement par clés de jointure. Le SIRET (14 chiffres INSEE) est l'identifiant pivot pour 4 sources sur 5. Pour les évaluations HAS, indexées par FINESS EJ (entité juridique), une jointure secondaire FINESS EJ → SIRET → FINESS ET est appliquée. Les conflits de jointure (exemple : un EJ avec plusieurs ET) sont arbitrés par adresse postale normalisée.
  4. 4 Détection automatique des alertes. Des règles déterministes écrites en Python déclenchent les red flags : cotation HAS C ou D, critères impératifs non atteints, niveau Alim'confiance dégradé, prix supérieur au 90e percentile départemental. Aucune pondération subjective, aucun score composite, aucune IA générative. Les règles sont versionnées dans le code source.
  5. 5 Attribution de source par champ. Chaque donnée affichée sur une fiche EHPAD indique la source d'origine (FINESS, CNSA, HAS, Alim'confiance) et la date de la dernière exploration. Aucun champ n'est inventé, dérivé sans formule explicite, ou enrichi par modèle probabiliste. Quand une donnée manque, le champ est absent ou marqué « non publié », jamais inféré.
  6. 6 Génération statique et balisage Schema.org. Le site est généré statiquement (Astro SSG) à partir des JSON sortis du pipeline, avec balisage Schema.org/NursingHome, Review HAS, Dataset et FAQPage. Les structured data sont validées en continu par un workflow GitHub Actions qui teste 9 URLs sentinelles à chaque déploiement et fait échouer le build en cas de régression.
  7. 7 Mécanisme de signalement et correction. Toute erreur d'attribution (mauvais SIRET, doublon, EHPAD fermé non détecté) peut être signalée à contact@seniorvigil.com avec le numéro FINESS concerné. Traitement sous 7 jours ouvrés. Une contestation portant sur la donnée elle-même (évaluation HAS, tarif CNSA) doit être adressée à l'autorité émettrice, pas à SeniorVigil — nous n'avons aucun pouvoir de modification des sources amont.

Couverture des données — chiffres au 16 mai 2026

Toute information est vérifiable. Voici l'état exact de la couverture des sources publiques au moment où vous lisez cette page, calculé automatiquement à partir des 703 EHPAD d'Île-de-France référencés dans FINESS.

Évaluation HAS
63 %
441 / 703 EHPAD cotés
Tarifs CNSA
26 %
186 / 703 EHPAD avec prix publié
Alim'confiance
0 %
0 / 703 EHPAD inspectés

Distribution des cotations HAS

A
181
B
165
C
90
D
5
Non cotés
262

Ces chiffres reflètent l'état de l'open-data publique, pas notre qualité de service. Quand un EHPAD n'est pas évalué par la HAS, ce n'est pas notre fiche qui manque de qualité — c'est l'évaluation publique qui n'a pas encore eu lieu ou n'a pas été publiée.

Red flags et indépendance

Un red flag est un signal factuel, pas un jugement. Il est déclenché automatiquement par des règles déterministes appliquées aux données source : note HAS C ou D, critères impératifs non atteints, niveau d'hygiène alimentaire dégradé. Chaque red flag indique sa source et sa sévérité.

Les établissements n'ont aucun moyen de supprimer, contester ou modifier un red flag sur SeniorVigil. Les données proviennent d'autorités publiques indépendantes (HAS, DGAL, ARS) et sont traitées sans intervention humaine. Si un établissement conteste une évaluation, c'est auprès de l'autorité compétente, pas auprès de nous.

Corollaire : nous ne monétisons pas les fiches EHPAD. Un établissement ne peut pas payer pour apparaître en premier, pour masquer un red flag, ni pour ajouter du contenu promotionnel à sa fiche. Notre modèle économique repose sur des services périphériques (aide à domicile, accompagnement juridique) sans lien avec l'évaluation des établissements.

Données structurées et transparence algorithmique

SeniorVigil est conçu pour être lu par des humains et par des machines. Chaque fiche d'établissement est générée statiquement (SSG) à partir de fichiers JSON structurés, eux-mêmes produits par un pipeline ETL déterministe et reproductible. Le code source du pipeline est public. Les données d'entrée sont des jeux de données ouverts hébergés sur data.gouv.fr. Le résultat est vérifiable de bout en bout.

Architecture du pipeline : téléchargement des sources (FINESS, CNSA, HAS, Alim'confiance) → parsing structurel avec validation des identifiants → croisement par clés de jointure (SIRET, FINESS EJ/ET) → détection des red flags par règles déterministes → export en JSON (1 fichier par établissement + index global) → génération statique du site avec balisage Schema.org/NursingHome.

Le référentiel FINESS est la source de vérité pour l'existence légale d'un établissement. Le SIRET est l'identifiant pivot pour le croisement inter-sources. Chaque donnée affichée est attribuée à sa source d'origine avec date de dernière mise à jour. Aucun modèle probabiliste, aucune inférence, aucune pondération subjective n'intervient dans la production des fiches.

Ce que vous lisez sur une fiche SeniorVigil est exactement ce que les autorités publiques ont publié — ni plus, ni moins.

Limites connues

La couverture des données n'est pas uniforme. En avril 2026, sur les 703 EHPAD d'Île-de-France référencés dans FINESS : 54 % disposent d'une évaluation HAS, 27 % ont leurs tarifs publiés par la CNSA (couverture complète prévue courant 2026), et 58 % ont un contrôle Alim'confiance rattachable.

Les activités, les animations et la qualité de la relation humaine avec les résidents ne sont couvertes par aucune source de données publique. C'est le principal angle mort de toute approche basée sur l'open data. Nous ne prétendons pas le combler.

Les évaluations HAS sont des photographies à un instant donné. Un établissement noté D peut avoir corrigé ses défaillances depuis. Nous affichons systématiquement la date de l'évaluation pour que le lecteur puisse juger de la fraîcheur de l'information.

Questions fréquentes sur la méthodologie

D'où viennent les données affichées sur SeniorVigil ?

Exclusivement de 5 sources publiques officielles françaises : FINESS (Ministère de la Santé / DREES), CNSA (Caisse Nationale de Solidarité pour l'Autonomie), HAS Qualiscope (Haute Autorité de Santé), Alim'confiance (DGAL - Ministère de l'Agriculture) et Judilibre (Cour de cassation). Toutes sont publiées sous Licence Ouverte Etalab 2.0 et accessibles sur data.gouv.fr. Aucune donnée ne provient des établissements eux-mêmes.

Comment vérifiez-vous l'identité des établissements ?

Chaque EHPAD est identifié par deux numéros officiels INSEE : le SIRET (14 chiffres, identifiant unique d'établissement) et le FINESS ET (Établissement, 9 chiffres). Pour les évaluations HAS, qui indexent par FINESS EJ (Entité Juridique), une jointure secondaire est appliquée. Si le SIRET est absent ou invalide dans FINESS, une correspondance par SIREN (9 premiers chiffres) est tentée, sinon la fiche reste incomplète plutôt que fausse.

Comment déclenchez-vous une alerte qualité (red flag) ?

Par règles déterministes appliquées automatiquement aux données source, sans intervention humaine. Exemples : cotation HAS C ou D, critères impératifs HAS non atteints (sur 18), niveau Alim'confiance "À améliorer" ou "À corriger de manière urgente". Chaque red flag affiche sa source, sa date d'évaluation et sa sévérité. Aucun red flag n'est pondéré dans un score composite : ce sont des signaux factuels binaires.

À quelle fréquence les données sont-elles mises à jour ?

Le pipeline ETL s'exécute chaque lundi à 6h UTC pour les sources hebdomadaires (Alim'confiance, FINESS) et mensuellement pour CNSA. Une veille automatique surveille quotidiennement la disponibilité des sources et déclenche un re-build complet si une source publique change. La date de dernière exploration de chaque source est tracée et affichée sur les fiches concernées.

Que faire en cas d'erreur ou de désaccord sur une donnée ?

Toute donnée affichée provient d'une source publique vérifiable. Pour contester une évaluation HAS, l'interlocuteur officiel est la Haute Autorité de Santé. Pour un tarif CNSA, le département concerné. Pour un contrôle Alim'confiance, la DGAL. SeniorVigil n'a aucun pouvoir de modification des sources amont. En revanche, pour signaler une erreur d'attribution (mauvais SIRET, doublon, EHPAD fermé non détecté) : contact@seniorvigil.com avec le numéro FINESS concerné, traitement sous 7 jours.

Êtes-vous indépendants des établissements ?

Oui. Aucun établissement EHPAD ne peut payer pour apparaître en premier, masquer un red flag, modifier sa fiche ou ajouter du contenu promotionnel. SeniorVigil ne perçoit aucune commission, aucune affiliation, aucun lien financier avec un groupe d'EHPAD. Le modèle économique repose sur des services périphériques (aide aux démarches, accompagnement administratif) sans lien avec l'évaluation des établissements eux-mêmes.

Puis-je utiliser vos données pour mon propre projet ?

Oui, sous Licence Ouverte Etalab 2.0 avec mention de source. Les datasets agrégés et croisés sont publiés sur seniorvigil.com/datasets/ au format CSV téléchargeable. Citation requise : « SeniorVigil — Baromètre transparence EHPAD IDF 2026 ». Journalistes, chercheurs, étudiants, associations d'aidants et acteurs publics sont les bienvenus.

Pour les journalistes, chercheurs et associations

Nos jeux de données agrégés sont publiés sous Licence Ouverte Etalab 2.0 et téléchargeables au format CSV. Citation requise pour réutilisation : « SeniorVigil — Baromètre transparence EHPAD IDF 2026 ».

Une demande d'extraction sur-mesure (par département, par groupe gestionnaire, par tranche tarifaire) est possible via contact@seniorvigil.com. Réponse sous 48 h ouvrées. Service gratuit pour la presse, la recherche académique et le monde associatif.