Suite

Cartographier des points de données sur plusieurs étages d'un bâtiment


Je suis nouveau dans la cartographie Web et je planifie et étudie des moyens de tracer et de visualiser au mieux le flux d'utilisateurs à travers un bâtiment sur plusieurs étages.

Nous prévoyons de suivre l'emplacement des utilisateurs en fonction de la proximité des iBeacons. Chaque point de données suivra à la fois l'heure et l'emplacement (en fonction de la proximité de l'iBeacon). Nous envisageons de créer une visualisation du couple pour montrer comment les utilisateurs circulent et utilisent le bâtiment.

Comment recommanderiez-vous de visualiser au mieux ces données et de représenter les multiples (4) étages pour voir le flux d'utilisateurs autour du bâtiment (espérons-le sur une seule carte).


CartoDB ne connaît pas une "dimension z", mais vous pourrez construire quelque chose de similaire en jouant avec les niveaux de zoom.

Directement dans l'éditeur : Construit une carte de catégorie de couple par une colonne qui contient les étages. Ensuite, vous pouvez utiliser un code comme le suivant pour masquer les autres étages dans le zoom spécifié à définir pour un étage.#table[value=2] { marker-fill: #1F78B4; #table[zoom=7] { marqueur-largeur : 0 ; } }

Vous pouvez ensuite utiliser CartoDB.js pour verrouiller le niveau de zoom maximum et minimum (pour éviter que les utilisateurs n'aillent à des niveaux de zoom qui ne correspondent pas à vos étages), et, par exemple, au lieu de changer le zoom avec le scroll, changez-le avec quelques boutons, vous pouvez construire.


Comment le CSIM peut faciliter les communications de crise

Il est pratiquement acquis que les décisions que prennent les organisations pendant la période entre le début d'une situation d'urgence et l'arrivée des forces de l'ordre sont cruciales. Malheureusement, le temps qu'il faut pour réagir peut ne pas permettre le type de prise de décision intelligente qui améliorerait les résultats en cas de crise.

Selon le Bureau of Justice Statistics, le temps moyen de réponse de la police aux situations d'urgence varie de 11 minutes à une heure. Les recherches du Department of Homeland Security révèlent que la durée moyenne d'un incident de tir actif dans une école est de 12,5 minutes, tandis que le temps moyen nécessaire pour que les forces de l'ordre arrivent est de 18 minutes. (DHS)

Lorsque vous travaillez pour résoudre une situation, une communication et une coordination efficaces entre plusieurs sources incluent la collecte de données de capteurs à partir de plusieurs points de vue, la corrélation des données, puis l'interprétation et l'envoi de ces informations aux premiers intervenants. Le temps qu'il faut pour réagir à une situation d'urgence peut faire la différence entre la vie et la mort. C'est là qu'une plate-forme de gestion convergente de la sécurité et de l'information (CSIM) permet aux organisations de minimiser le temps nécessaire pour trier les données, déterminer les actions appropriées et réagir.

Tout est question de données

Les données sont sans aucun doute l'un de nos outils les plus puissants. Cependant, un déluge de données sans contexte est écrasant et inefficace. Afin de faciliter les communications pendant une crise, les décideurs doivent être en mesure de collecter et d'interpréter des données pour extraire les données les plus utiles et exploitables du bruit - et agir sur ces informations.

La technologie CSIM rassemble une image opérationnelle commune et une connaissance de la situation de tous les actifs organisationnels. Sur la base de règles et réglementations personnalisées, les organisations peuvent définir des paramètres pour ce qui doit être signalé comme un « risque ». Le premier signe d'avertissement est généralement une activité inhabituelle ou inattendue, que ce soit physiquement sur le campus de votre organisation ou virtuellement sur votre système informatique.

En collectant des données à partir de capteurs, dispositifs, systèmes et sous-systèmes disparates, les outils logiciels sont capables d'identifier des modèles inhabituels pour tout dispositif de surveillance ou de capteur.

Protégez vos frontières

Les organisations peuvent créer un environnement plus sûr grâce à la mise à disposition d'un système de contrôle d'accès robuste. Plus un bâtiment est sécurisé, plus il faudra de temps à un intrus pour entrer dans les locaux. Des mesures de protection telles que moins de points d'accès, un accès sécurisé aux différentes parties d'un bâtiment, la RFID et, dans certains cas, la biométrie, sont toutes des étapes que les gestionnaires de bâtiments et les organisations doivent prendre en compte.

Les systèmes de sécurité avancés peuvent suivre où se trouvent les employés et les visiteurs dans un bâtiment et restreindre certaines zones à des niveaux spécifiques de personnel. Si nécessaire, ces systèmes peuvent également verrouiller les entrées et les sorties d'un bâtiment.

Les systèmes d'information géographique (SIG) peuvent également être utiles aux intervenants en fournissant une carte d'informations ou votre emplacement, tout en surveillant les modèles pour fournir des réponses exploitables en temps réel. Dans le cas d'un intrus, le SIG peut fournir un plan d'étage du bâtiment, identifier les points d'entrée pour les intervenants et aider à identifier le mouvement de l'individu à l'intérieur du bâtiment. Cela permet aux équipes de sécurité et aux forces de l'ordre de prendre des décisions éclairées avant d'agir. Toutes ces informations sont affichées via une seule vitre à travers une plate-forme CSIM.

La vidéo facilite la reconnaissance visuelle

Les flux vidéo en direct sont cruciaux pour toute organisation, car ils fournissent un outil de suivi visuel pour déterminer les détails importants des incidents. Lorsqu'une alarme est déclenchée, les caméras vidéo situées le plus près de ce site particulier affichent automatiquement des images en direct au centre de commande. La vidéo fournit des informations inégalées sur le nombre de participants actifs impliqués, l'endroit où ils sont entrés dans le bâtiment et leur emplacement actuel.

Le CSIM rassemble les données vidéo ainsi que d'autres informations provenant du contrôle d'accès, des capteurs, des alarmes, de la gestion des identités, du SIG et d'autres sources de données pour créer une perception holistique de la situation et fournir des actions appropriées pour une véritable gestion de la situation.

Alors que les capteurs de sécurité et les séquences vidéo peuvent aider à sécuriser une organisation, les entreprises peuvent également tirer parti d'une technologie puissante pour intégrer leurs données et recevoir des informations automatisées et intelligentes qui éliminent le risque d'erreur humaine et facilitent le processus de sécurité, ce qui permet à votre organisation d'économiser de l'argent, du temps et d'augmenter la sécurité publique.

A propos de l'auteur: James I. Chong est PDG et co-fondateur de Vidsys. Il a lancé Vidsys en 2005 avec sa plateforme logicielle transformationnelle de sécurité et de gestion de l'information. Chong a plus de 20 ans d'expérience en gestion et en technologie dans les domaines des logiciels, de l'informatique, de la vidéosurveillance, de la sécurité et des systèmes complexes et est un expert en la matière, un entrepreneur et un innovateur de classe mondiale. Sa vision du développement d'une entreprise hautement spécialisée axée sur les produits et axée sur des segments de marché verticaux spécifiques a conduit au développement de plusieurs applications logicielles de pointe, notamment VidShield, RiskShield et Intelligent Traffic Management System (ITMS).


RÉSUMÉ

Dans un exemple de mode de réalisation, un système pour fournir des audits énergétiques virtuels peut comprendre au moins une mémoire de base de données, une mémoire d'outils d'audit et un processeur d'au moins un serveur d'analyse du système. La ou les mémoires de base de données peuvent comprendre une base de données de caractéristiques de bâtiment ayant une structure d'enregistrement qui stocke un ensemble prédéfini de données de caractéristiques de bâtiment correspondant à un bâtiment cible, une base de données d'utilisation d'énergie de série chronologique ayant une structure d'enregistrement qui stocke des données d'utilisation d'énergie de série chronologique pour le bâtiment cible, et une base de données de marqueurs de construction sur laquelle sont stockés des marqueurs de construction associés à des caractéristiques de construction. La mémoire d'outils d'audit peut comprendre une base de données de modèles prédictifs sur laquelle est stocké au moins un modèle prédictif, et une base de données de fonctions de marqueur de construction sur laquelle est stocké un ensemble d'instructions qui implémentent des fonctions pour déterminer les marqueurs de construction. Le processeur d'au moins un serveur d'analyse du système peut être en communication avec la mémoire de la base de données et la mémoire des outils d'audit et peut être configuré pour exécuter des instructions lisibles par ordinateur stockées dans la mémoire des outils d'audit qui, lorsqu'elles sont exécutées par le processeur, provoquent la processeur pour récupérer des données météorologiques correspondant au bâtiment cible à partir d'un serveur météorologique couplé au au moins un serveur d'analyse, récupérer des données d'utilisation d'énergie correspondant au bâtiment cible à partir d'un serveur utilitaire couplé au au moins un serveur d'analyse, récupérer l'ensemble prédéfini de données de caractéristiques de bâtiment à partir de la base de données de caractéristiques de bâtiment, appliquer une fonction de trame de données aux données météorologiques et aux données d'utilisation d'énergie pour générer un ensemble de variables qui incluent des statistiques météorologiques locales et des statistiques d'utilisation d'énergie correspondant au bâtiment cible, identifier une pluralité de marqueurs de bâtiment pour le bâtiment cible sur la base des données d'entrée, y compris les données météorologiques, la consommation d'énergie dat a, les données de caractéristiques du bâtiment et l'ensemble de variables, stockent la pluralité de marqueurs de bâtiment dans la base de données de marqueurs de bâtiment, génèrent des diagnostics d'efficacité de bâtiment sur la base de la pluralité de marqueurs de bâtiment, et envoient les diagnostics d'efficacité de bâtiment à afficher sur une interface utilisateur d'un dispositif client couplé au au moins un serveur d'analyse. Les diagnostics d'efficacité du bâtiment peuvent estimer les caractéristiques du système de chauffage/refroidissement du bâtiment cible.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à prétraiter les données d'entrée pour générer des données d'entrée prétraitées en générant un premier ensemble d'étiquettes définissant les jours pour lesquels les données complètes de la météo des données et les données d'utilisation d'énergie sont disponibles, identifier et remplacer les valeurs manquantes des données d'entrée, détecter et remplacer des points de données anormaux en effectuant une décomposition en série chronologique des données d'entrée pour produire une série chronologique décomposée, identifier les valeurs aberrantes de la série chronologique décomposée, et supprimer et remplacer les valeurs aberrantes identifiées, et imputer des points de données manquants à partir des données d'entrée en appliquant une imputation linéaire à des ensembles de quatre points de données manquants consécutifs ou moins, et en appliquant une méthode de prévision basée sur l'analyse d'indice de diffusion à des ensembles de cinq données manquantes consécutives ou plus points.

Dans certains modes de réalisation, la pluralité de marqueurs de construction peut comprendre un ou plusieurs parmi un marqueur de construction de temps de mise en marche du système de chauffage/refroidissement, un marqueur de construction de temps de mise hors tension du système de chauffage/refroidissement, un marqueur de construction de puissance de mise en marche du système de chauffage/refroidissement, un indicateur diurne marqueur de bâtiment de modèle, un marqueur de bâtiment d'opportunité d'économies de rééchelonnement, un marqueur de bâtiment de changement d'utilisation d'énergie, un marqueur de bâtiment de type chauffage, un marqueur de bâtiment de type refroidissement, un marqueur de bâtiment de taille de système de chauffage/refroidissement, un marqueur de bâtiment de condition surdimensionnée de système de chauffage/refroidissement, un ou plusieurs modèles de fonctionnement du bâtiment marqueurs de bâtiment, un marqueur de bâtiment de charge de base, un marqueur de bâtiment d'intensité d'utilisation d'énergie du bâtiment, un marqueur de bâtiment de jours d'utilisation d'énergie anormale, un marqueur de bâtiment de variabilité de l'utilisation d'énergie et/ou un marqueur de bâtiment de valeur R efficace les caractéristiques du système de refroidissement peuvent être dérivées, par le processeur, du marqueur de construction de l'heure de mise en marche du système de chauffage/refroidissement, le système de chauffage/refroidissement éteignez le marqueur de bâtiment de temps, le marqueur de bâtiment de condition surdimensionnée du système de chauffage/refroidissement et le marqueur de bâtiment de taille de système de chauffage/refroidissement.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, peuvent en outre amener le processeur à générer le marqueur de construction du temps d'activation du système de chauffage/refroidissement, le marqueur de construction du temps d'arrêt du système de chauffage/refroidissement, et le marqueur de construction du temps de mise en marche du système de chauffage/refroidissement, le système allume le marqueur de bâtiment en watts en calculant une dérivée des données d'utilisation d'énergie pour produire un ensemble de données dérivé définissant les changements d'utilisation d'énergie entre les horodatages des données d'utilisation d'énergie, identifie les heures d'allumage du système de chauffage/refroidissement à partir de l'ensemble de données dérivé, identifiant le chauffage/refroidissement temps d'arrêt du système à partir de l'ensemble de données dérivé, identification identifier un premier mode des temps d'allumage du système de chauffage/refroidissement identifiés, identifier un deuxième mode des temps d'arrêt du système de chauffage/refroidissement identifiés, réglage de la puissance d'allumage du système de chauffage/refroidissement bâtiment marqueur basé sur les changements observés dans la consommation d'énergie se produisant aux heures de mise en marche du système de chauffage/refroidissement, en réglant la mise en marche du système de chauffage/refroidissement n marqueur de construction de temps égal au premier mode, et en réglant les temps d'arrêt du système de chauffage/refroidissement égaux au deuxième mode.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de construction d'un modèle diurne en appliquant un test de périodogramme chi carré aux données d'utilisation d'énergie pour identifier le modèle diurne.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment d'opportunité d'économies de replanification en appliquant un procédé analytique aux données d'utilisation d'énergie pour identifier quand le bâtiment cible est inoccupé, déterminant que le le système de chauffage/refroidissement est actif lorsque le bâtiment cible est inoccupé sur la base des données d'utilisation d'énergie, générant une recommandation pour ajuster un point de consigne de température du système de chauffage/refroidissement du bâtiment cible, et générant une estimation des économies de coûts associées à l'ajustement du point de consigne de température selon la recommandation. La méthode analytique peut être choisie parmi une transformation en ondelettes, un test t à deux échantillons et un test t apparié.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment de changement d'utilisation d'énergie en séparant les données d'utilisation d'énergie en une pluralité de sous-ensembles d'une année, pour chaque année représentée dans la pluralité de sous-ensembles d'une seule année, identifiant les points de changement significatifs des données d'utilisation d'énergie qui se sont produits au cours de cette année, déterminant qu'une corrélation entre les premier et deuxième points de changement significatifs des points de changement significatifs est inférieure à un seuil prédéterminé, et signalant le premier et le deuxième point de changement significatif correspondant à un temps de rénovation pour le bâtiment cible.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment de type chauffage et le marqueur de bâtiment de type refroidissement en supprimant des points de données des données de consommation d'énergie et des données météorologiques correspondant aux jours fériés et aux week-ends. pour produire des données d'utilisation d'énergie modifiées et des données météorologiques modifiées, appliquer un modèle de régression linéaire par morceaux aux données d'utilisation d'énergie modifiées et aux données de température extérieure de séries temporelles des données météorologiques modifiées pour produire une ligne de tendance de saison de chauffage et une ligne de tendance de saison de refroidissement, déterminer une première pente de la ligne de tendance de la saison de chauffage, détermination d'une seconde pente de la ligne de tendance de la saison de refroidissement, comparaison de la première pente à un premier seuil prédéterminé pour déterminer le type de chauffage du bâtiment cible, comparaison de la seconde pente à un second seuil prédéterminé pour déterminer le type de refroidissement du bâtiment cible, en définissant le marqueur de bâtiment de type de chauffage égal au d type de chauffage déterminé et en définissant le marqueur de bâtiment du type de refroidissement égal au type de refroidissement déterminé.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de construction de la taille du système de chauffage/refroidissement en générant le marqueur de construction de l'heure de mise en marche du système de chauffage/refroidissement, définissant un sous-ensemble de la consommation d'énergie données sous la forme d'un ensemble de points de données correspondant au marqueur de construction de l'heure de mise en marche du système de chauffage/refroidissement, détermination des valeurs de demande d'énergie pour chacun de l'ensemble de points de données, détermination d'un mode des valeurs de demande d'énergie et définition du marqueur de construction de la taille du système de chauffage/refroidissement égal au mode.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de construction d'état surdimensionné du système de chauffage/refroidissement en identifiant un premier sous-ensemble des données d'utilisation d'énergie correspondant à une saison de chauffage, en identifiant un deuxième sous-ensemble des données d'utilisation d'énergie correspondant à une saison de refroidissement, appliquer un filtre passe-bas au premier sous-ensemble pour générer un premier signal, appliquer le filtre passe-bas au deuxième sous-ensemble pour générer un deuxième signal, générer un premier signal vers -rapport de bruit du premier signal au premier sous-ensemble, générant un second rapport signal/bruit du second signal au second sous-ensemble, déterminant que le premier rapport signal/bruit est inférieur à un premier rapport signal/bruit moyen rapport de bruit correspondant à des bâtiments similaires pendant la saison de chauffage, déterminant que le second rapport signal/bruit est inférieur à un second rapport signal/bruit moyen correspondant aux bâtiments similaires dans le coo saison de pêche, et régler le marqueur de construction surdimensionné du système de chauffage/refroidissement pour indiquer que le système de chauffage/refroidissement est surdimensionné.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le ou les marqueurs de construction de modèles d'opération de bâtiment en supprimant des points de données correspondant aux vacances des données d'utilisation d'énergie pour produire des données d'utilisation d'énergie filtrées, diviser les données d'utilisation d'énergie filtrées en sept sous-ensembles, chacun correspondant à un jour de la semaine différent, déterminer une longueur minimale parmi les sept sous-ensembles, définir des longueurs de chacun des sept sous-ensembles égales à la longueur minimale, effectuer une analyse de cluster hiérarchique sur les sept sous-ensembles pour produire un dendrogramme en grappes, en déterminant qu'un rapport d'une hauteur maximale du dendrogramme en grappes à une hauteur minimale du dendrogramme en grappes est inférieur ou égal à un seuil prédéterminé, et en définissant le marqueur de construction de modèles d'opération de construction pour indiquer un modèle correspondant au seuil prédéterminé.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment de charge de base en appliquant un filtre passe-bas aux données d'utilisation d'énergie pour produire des données d'utilisation d'énergie filtrées, identifiant l'utilisation d'énergie minimale quotidienne valeurs des données d'utilisation d'énergie filtrées, trier les valeurs d'utilisation d'énergie minimales quotidiennes par ordre de grandeur pour produire des valeurs d'utilisation d'énergie minimales quotidiennes triées, en supprimant tous les points de données à valeur anormale et/ou négative des valeurs d'utilisation d'énergie minimales quotidiennes triées pour produire nettoyé, trié quotidiennement des valeurs d'utilisation d'énergie minimales, le calcul d'une moyenne d'un nombre prédéterminé de valeurs les plus basses des valeurs d'utilisation d'énergie minimales quotidiennes nettoyées et triées, et l'établissement du marqueur de construction de base égal à la moyenne.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment d'intensité d'utilisation d'énergie du bâtiment en définissant le marqueur de bâtiment d'intensité d'utilisation d'énergie égal à une quantité d'énergie utilisée par pied carré par an sur la base des données d'utilisation d'énergie et de l'ensemble prédéfini de données de caractéristiques de bâtiment, et comparer le marqueur de bâtiment d'intensité d'utilisation d'énergie à un marqueur de bâtiment d'intensité d'utilisation d'énergie moyenne correspondant à un ensemble de bâtiments. Une première zone climatique de l'ensemble de bâtiments et une seconde zone climatique du bâtiment cible peuvent être identiques, et un premier type de bâtiment de l'ensemble de bâtiments et un second type de bâtiment du bâtiment cible peuvent être identiques.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment des jours d'utilisation d'énergie anormale en divisant les données d'utilisation d'énergie en sous-ensembles, en appliquant un regroupement hiérarchique aux sous-ensembles pour produire des données de cluster, en identifiant des jours anormaux correspondant à une consommation d'énergie aberrante sur la base des données de cluster, et en signalant les jours anormaux identifiés.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment de variabilité d'utilisation d'énergie en générant une boîte à moustaches d'été à partir des premiers points de données des données d'utilisation d'énergie correspondant à une période d'heure d'été, en générant un boîte à moustaches d'hiver à partir de deuxièmes points de données des données d'utilisation d'énergie correspondant à une période d'heure d'hiver, générant un ensemble de boîtes à moustaches contiguës pour chaque heure représentée dans la boîte à moustaches d'été et la boîte à moustaches d'hiver, et calcul d'une moyenne régulière des valeurs d'utilisation d'énergie pour chaque heure dans été comme hiver.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer le marqueur de bâtiment de valeur R efficace en désagrégeant les données d'utilisation d'énergie en un ensemble de données de chauffage/refroidissement et un ensemble de données de charge, déterminant un chauffage intérieur charge pendant une période sélectionnée sur la base de l'ensemble de données de charge, détermination d'une quantité d'énergie retirée de l'espace climatisé du bâtiment cible sur la base de l'ensemble de données de chauffage/refroidissement pour la période sélectionnée, détermination d'une température extérieure du bâtiment cible pour la période de temps sélectionnée sur la base des données météorologiques, en estimant la température intérieure du bâtiment cible pour la période de temps sélectionnée dans une plage prédéterminée, et en définissant le marqueur de bâtiment de valeur R efficace correspondant à une qualité d'isolation thermique du bâtiment cible sur la base de la la quantité d'énergie retirée, la charge de chauffage intérieure, la température extérieure et la température intérieure. La période de temps sélectionnée peut correspondre à une période de temps pendant laquelle une température intérieure du bâtiment cible est sensiblement inchangée.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer des données de pronostic sur la base des données d'entrée, les données de pronostic comprenant des recommandations de mesures de conservation d'énergie et des impacts estimés de la mise en œuvre des recommandations de mesures de conservation d'énergie, génèrent des pronostics d'économie d'énergie sur la base des données de pronostic et de la pluralité de marqueurs de bâtiment, et envoyer les pronostics d'économie d'énergie à afficher sur l'interface utilisateur du dispositif client.

Dans certains modes de réalisation, les données de pronostic sont générées en traitant les données météorologiques et les données d'utilisation d'énergie à l'aide d'au moins un modèle prédictif. Le ou les modèles prédictifs peuvent être sélectionnés parmi un modèle de réseau neuronal, un modèle de forêt aléatoire, un modèle de machine à vecteur de support, un modèle GBRT et un modèle d'indice de diffusion.

Dans certains modes de réalisation, les instructions lisibles par ordinateur, lorsqu'elles sont exécutées par le processeur, amènent en outre le processeur à générer les pronostics d'économie d'énergie en générant une recommandation pour une mesure d'économie d'énergie correspondant à une action qui pourrait être entreprise pour améliorer l'efficacité énergétique du bâtiment , identifié sur la base d'au moins un des marqueurs de bâtiment, générant une prédiction d'un effet que la mesure de conservation d'énergie aurait sur l'efficacité énergétique du bâtiment, et envoyant la recommandation et la prédiction à afficher sur l'interface utilisateur du dispositif client .

Dans certains modes de réalisation, l'au moins un des marqueurs de construction comprend le marqueur de construction de valeur R efficace.

Dans un exemple de mode de réalisation, un procédé pour fournir des audits énergétiques virtuels peut comprendre des étapes pour récupérer, par un processeur d'un serveur d'analyse, des données météorologiques correspondant à au moins un bâtiment cible à partir d'un serveur météorologique couplé au serveur d'analyse, recevant, par le processeur , des données d'utilisation d'énergie de service correspondant au au moins un bâtiment cible, obtenant un ensemble de données caractéristiques spécifiques au bâtiment correspondant au au moins un bâtiment cible, combinant les données météorologiques, les données d'utilisation d'énergie de service et les données caractéristiques spécifiques au bâtiment dans un ensemble de données d'audit énergétique, détermination d'une pluralité de marqueurs de bâtiment pour au moins un bâtiment cible sur la base de l'ensemble de données d'audit énergétique, génération de données de pronostic sur la base de l'ensemble de données d'audit énergétique et des marqueurs de bâtiment, les données de pronostic comprenant des recommandations de conservation d'énergie et des impacts estimés de la mise en œuvre du recommandations de conservation de l'énergie, générant des diagnostics d'efficacité des bâtiments basés sur les pluralité de marqueurs de bâtiment, et envoyer les diagnostics d'efficacité du bâtiment et les recommandations de conservation d'énergie à afficher sur une interface utilisateur d'un dispositif client couplé au serveur d'analyse. Les diagnostics d'efficacité de bâtiment peuvent comprendre des caractéristiques de système de chauffage/refroidissement estimées du au moins un bâtiment cible.

Dans certains modes de réalisation, la pluralité de marqueurs de construction comprend un ou plusieurs parmi un marqueur de construction de temps de mise en marche de système de chauffage/refroidissement, un marqueur de construction de temps de mise hors tension de système de chauffage/refroidissement, un marqueur de construction de puissance de mise en marche de système de chauffage/refroidissement, un modèle diurne marqueur de bâtiment, un marqueur de bâtiment d'opportunité d'économies de rééchelonnement, un marqueur de bâtiment de changement d'utilisation d'énergie, un marqueur de bâtiment de type chauffage, un marqueur de bâtiment de type refroidissement, un marqueur de bâtiment de taille de système de chauffage/refroidissement, un marqueur de bâtiment de condition surdimensionnée de système de chauffage/refroidissement, un ou plus de modèles de fonctionnement du bâtiment marqueurs de bâtiment, un marqueur de bâtiment de charge de base, un marqueur de bâtiment d'intensité d'utilisation de l'énergie du bâtiment, un marqueur de bâtiment de jours d'utilisation d'énergie anormale, un marqueur de bâtiment de variabilité de l'utilisation de l'énergie et/ou un marqueur de bâtiment de valeur R efficace.

Dans certains modes de réalisation, le procédé peut comprendre en outre des étapes de prétraitement de l'ensemble de données d'audit énergétique pour générer un ensemble de données d'audit énergétique prétraité en générant un ensemble d'étiquettes définissant les jours pour lesquels des données complètes des données météorologiques et des données d'utilisation d'énergie sont disponibles. , l'identification et le remplacement des valeurs manquantes de l'ensemble de données d'audit énergétique, la détection et le remplacement de points de données anormaux par, l'exécution d'une décomposition en séries chronologiques de l'ensemble de données d'audit énergétique pour produire une série chronologique décomposée, l'identification des valeurs aberrantes de la série chronologique décomposée, et la suppression et le remplacement des des valeurs aberrantes identifiées à partir de l'ensemble de données d'audit énergétique, en imputant des points de données manquants à partir de l'ensemble de données d'audit énergétique en appliquant une imputation linéaire à des ensembles de quatre points de données manquants consécutifs ou moins, et en appliquant une méthode de prévision basée sur l'analyse de l'indice de diffusion à des ensembles de cinq données manquantes consécutives ou plus points.

Dans certains modes de réalisation, le au moins un bâtiment cible peut comprendre une pluralité de bâtiments cibles. Les diagnostics d'efficacité de bâtiment peuvent comprendre une pluralité de sous-ensembles de diagnostics d'efficacité de bâtiment. Les recommandations d'économie d'énergie peuvent comprendre une pluralité de sous-ensembles de recommandations d'économie d'énergie. Chacun de la pluralité de bâtiments cibles peut correspondre à un sous-ensemble respectivement différent de diagnostics d'efficacité de bâtiment de la pluralité de sous-ensembles de diagnostics d'efficacité de bâtiment. Chacun de la pluralité de bâtiments cibles peut correspondre à un sous-ensemble respectivement différent de recommandations d'économie d'énergie de la pluralité de sous-ensembles de recommandations d'économie d'énergie. Le procédé peut en outre comprendre des étapes pour quantifier une valeur d'opportunité d'économie respective pour chacun de la pluralité de bâtiments cibles afin de produire une pluralité de valeurs d'opportunité d'économie, les recommandations d'économie d'énergie comprenant la pluralité de valeurs d'opportunité d'économie, générant une liste ordonnée de la pluralité de bâtiments cibles qui sont classés sur la base de la pluralité de valeurs d'opportunités d'économies, identifiant un sous-ensemble de bâtiments cibles de la pluralité de bâtiments cibles associés aux valeurs d'opportunités d'économies les plus élevées de la pluralité de valeurs d'opportunités d'économies, et envoyant la liste ordonnée et le sous-ensemble identifié des bâtiments cibles à afficher via l'interface utilisateur de l'appareil client.

Dans certains modes de réalisation, chacune des données météorologiques et l'ensemble de données caractéristiques spécifiques au bâtiment peuvent être générés hors site à partir du au moins un bâtiment cible. Les données d'utilisation d'énergie peuvent être générées uniquement par au moins un compteur du au moins un bâtiment cible.

Dans certains modes de réalisation, les données caractéristiques spécifiques au bâtiment peuvent être limitées à un ou plusieurs de la superficie du bâtiment, le nombre d'étages du au moins un bâtiment cible, l'emplacement géographique du au moins un bâtiment cible, et/ou un rapport hauteur/largeur de le au moins un bâtiment cible déterminé à partir de la superficie en pieds carrés et du nombre d'étages du au moins un bâtiment cible.

Dans certains modes de réalisation, le procédé peut en outre comprendre des étapes pour obtenir le consentement d'un propriétaire de bâtiment pour recevoir des données de services publics, et obtenir au moins un an de données d'utilisation d'énergie de services publics directement auprès d'un ou plusieurs fournisseurs de services énergétiques pour le au moins un bâtiment cible.


Cartographie des points de données sur plusieurs étages d'un bâtiment - Systèmes d'Information Géographique

Les systèmes d'information géographique (SIG) font référence aux systèmes d'information qui manipulent les données (géo) spatiales. Le processus de manipulation des données peut aller de la simple agrégation de données à des méthodes sophistiquées d'analyse spatiale et d'apprentissage automatique. Un exemple de processus d'agrégation de données consiste à calculer la température moyenne quotidienne de chaque emplacement sur une carte. Une méthode d'analyse spatiale utilise des principes de statistiques spatiales pour modéliser des données dans l'espace afin de comprendre le processus de génération de données ou de faire des prédictions, par exemple, le krigeage (Cressie 1990) et la régression pondérée géographiquement (Brunsdon et al. 1996). Une méthode d'apprentissage automatique, similaire aux méthodes d'analyse spatiale, exploite les propriétés (géo)spatiales des données pour faire des inférences ou des prédictions en utilisant des données existantes pour des données invisibles. Dans cet article, ces processus de manipulation de données qui utilisent des données (géo)spatiales sont appelés processus (géo)spatiaux.

Les applications (logicielles) SIG traditionnelles sont souvent des SIG génériques et polyvalents, qui prennent en charge une variété de processus (géo)spatiaux pour analyser et visualiser des données (géo)spatiales dans divers formats sur un ordinateur local. Les progrès récents de la puissance de calcul et des outils de développement de logiciels ont permis un large éventail d'applications SIG, y compris de puissantes applications SIG génériques et des applications personnalisées pour des missions spécifiques (par exemple, la visualisation des données de trafic). En général, les applications SIG peuvent être classées en applications de bureau ou en nuage en fonction des caractéristiques de leurs ressources informatiques (par exemple, stockage de données, puissance de calcul, accès au réseau). Les applications de bureau, telles que ArcGIS Desktop et QGIS d'Esri, ne nécessitent souvent pas de connexion Internet, mais ne peuvent gérer qu'une petite quantité de données en raison de la puissance de calcul et du stockage limités d'un seul ordinateur. En revanche, les applications basées sur le cloud, telles qu'ArcGIS Online d'Esri, peuvent traiter des données volumineuses (souvent sur un grand cluster d'ordinateurs) mais nécessitent un accès au réseau (soit Internet, soit un réseau d'entreprise privé).

En plus de la distinction dans les ressources informatiques, les applications SIG peuvent avoir une variété de modalités basées sur la conception de leurs stratégies d'interaction homme-machine (IHM), telles que les applications SIG mobiles, les applications SIG Web et les API SIG en ligne (interfaces de programmation d'applications ). Les applications SIG mobiles sont des applications logicielles exécutées sur des appareils mobiles et, plus important encore, peuvent exploiter des services basés sur la localisation (LBS) pour résoudre un problème pratique (par exemple, l'enregistrement de trajectoires mobiles). Par exemple, Esri Collector est une application SIG mobile qui permet une collecte de données efficace à l'aide d'un appareil mobile. Les applications Web SIG s'exécutent dans un navigateur Web, sur un appareil mobile ou de bureau. Le principal avantage des applications Web SIG est que les navigateurs Web existent de manière omniprésente sur divers types d'appareils et que les utilisateurs n'ont donc pas à installer d'applications logicielles supplémentaires. Les applications SIG Web nécessitent souvent un SIG cloud back-end. Un SIG Web pris en charge par un SIG cloud peut prendre en charge un large éventail de fonctionnalités, telles que la visualisation de données cartographiques existantes ou fournies par l'utilisateur et l'exécution de processus (géo)spatiaux complexes. Un exemple d'applications SIG Web est CARTO, qui permet aux utilisateurs de personnaliser des ensembles de données et de publier des cartes interactives sur le Web. Google Maps est à la fois une application mobile et Web SIG qui affiche des informations de localisation, y compris le trafic, les réseaux routiers et les points d'intérêt, sur des appareils mobiles ou sur le Web. Les API SIG en ligne sont des processus informatiques exécutés sur un serveur. Ils sont accessibles sur Internet à l'aide de protocoles spécifiques (par exemple, les services RESTful conformes à l'architecture logicielle REpresentational State Transfer (REST)). Par exemple, le Spatial Sciences Institute de l'Université de Californie du Sud fournit une API de prévision de la qualité de l'air, et Google met ses services de géocodage à disposition sous forme d'API en ligne.

Les applications SIG peuvent également être distinguées par leurs types de données (géo)spatiales pris en charge, qui déterminent souvent la capacité des processus (géo)spatiaux de l'application et la modalité de l'application. Par exemple, supposons qu'une application SIG nécessite la production hebdomadaire de valeurs de qualité de l'air agrégées spatialement à partir d'emplacements ponctuels. Ensuite, la meilleure modalité est une application basée sur le cloud (ou serveur) utilisant une base de données spatiale. Si l'application implique des processus (géo)spatiaux plus sophistiqués que l'agrégation de données, l'architecture logicielle sur le cloud devrait pouvoir héberger des bibliothèques de programmation (géo)spatiale ou des cadres d'apprentissage automatique, par exemple, Tensor Flow (Lin et al. 2018)

Deux types de données (géo)spatiales courants sont le type de données vectorielles et le type de données raster. Les données vectorielles représentent la géométrie des objets (géo)spatiaux à l'aide de points, de lignes et de polygones. De plus, les données vectorielles sont souvent accompagnées d'un composant tabulaire décrivant les métadonnées (attributs) des géométries. Les formats vectoriels populaires incluent le fichier de formes Esri (Esri 1998), GeoJSON et le texte bien connu de l'Open Geospatial Consortium (OGC), le binaire bien connu et le KML (Keyhole Markup Language). Le fichier de formes Esri stocke la géométrie des objets et leurs attributs (par exemple, les noms d'emplacement, les adresses). GeoJSON est un format vectoriel léger principalement pour les SIG Web et d'autres applications SIG qui gèrent de petits ensembles de données. Well-Known Text et Well-Known Binary sont des formats de données courants pour les bases de données spatiales (par exemple, PostGIS) provenant de l'OGC. Leurs définitions sont incluses dans la norme ISO/IEC 13249-3:2016. KML (actuellement maintenu par l'OGC) contient les géométries et les attributs des objets et comment ces géométries doivent être visualisées dans une application (par exemple, Google Earth et Google Maps Android Software Development Kit). Les données vectorielles permettent une petite taille de fichier et des représentations précises de points, de squelettes et de limites de choses (géo) spatiales.

Contrairement aux données vectorielles qui stockent explicitement des informations géométriques, les données raster utilisent une structure de grille pour représenter des éléments spatiaux à l'aide d'une surface continue sur l'espace. Chaque cellule de la grille couvre une partie de l'espace et peut contenir un ensemble de variables en tant que métadonnées de la cellule. Le type de données géographiques raster le plus courant est l'imagerie, telle que l'imagerie satellite et les photos aériennes. Les formats raster standard incluent GeoTIFF et NetCDF (Network Common Data Form). GeoTIFF est une norme de métadonnées permettant de décrire des images géoréférencées au format TIFF (Tagged Image File Format). NetCDF prend en charge les données multidimensionnelles et comprend un ensemble de formats et de bibliothèques pour représenter et accéder aux données multidimensionnelles. NetCDF est couramment utilisé dans la communauté géoscientifique pour stocker divers phénomènes spatio-temporels. Les données raster ont l'avantage que leur représentation de données n'est pas limitée à une limite prédéfinie par rapport aux données vectorielles. La plupart des bibliothèques de traitement d'images (par exemple, OpenCV) peuvent gérer les données raster en traitant chaque cellule raster comme des pixels d'image.

En somme, la modalité des applications SIG a un large éventail. Les types de données pris en charge et les processus (géo)spatiaux peuvent aller de la simple visualisation de données ponctuelles à la reconnaissance d'images sophistiquées. Le large éventail de modalités et de capacités rend difficile l'utilisation d'une méthodologie unique pour concevoir, développer, tester et déployer des applications SIG (c'est-à-dire le cycle de vie de développement des systèmes, SDLC, pour les applications SIG). Plus précisément, les SDLC doivent inclure des considérations sur l'instrument, le problème, le domaine et les personnes (parties prenantes) d'une application SIG. Néanmoins, toutes les applications SIG doivent consommer, traiter et produire des données (géo)spatiales. Par conséquent, cette entrée se concentre sur les décisions critiques dans chaque phase du cycle de vie du développement du SIG (GiSDLC) concernant les exigences de stockage, d'accès et d'analyse des données (géo) spatiales pour l'application cible. Le reste de cet article vise à introduire diverses considérations dans le GiSDLC, notamment la conception, le développement, les tests et le déploiement d'applications, du point de vue du stockage, de l'accès et de l'analyse des données. La section 2 donne une brève introduction au SDLC, notamment en expliquant le rôle des données (géo)spatiales dans chaque phase du SDLC. La section 3 utilise deux applications existantes du monde réel comme exemple pour mettre en évidence les considérations critiques à chaque étape du GiSDLC. La section 4 fournit un résumé général.

Un cycle de vie du développement des systèmes (SDLC) définit les activités et les jalons du développement des systèmes d'information. En général, un SDLC peut comprendre cinq à dix phases. Par exemple, un SDLC en sept phases comprend les phases d'identification des problèmes, de planification, de conception, de développement, de test, de déploiement et de maintenance. Pour maintenir une discussion concise, sans perte de généralité, cette entrée se concentre sur un SDLC en cinq phases, comprenant les phases de conception, de développement, de test, de déploiement et de maintenance (où les phases d'identification des problèmes, de planification et de conception sont combinées en une seule phase de conception). En plus des phases SDLC, une méthodologie ou un modèle SDLC guide l'exécution de ces phases. Bien que le choix d'un SDLC pour les applications SIG soit similaire à celui d'autres applications logicielles, chaque phase du cycle de vie de développement du SIG (GiSDLC) doit accorder une attention supplémentaire aux données et processus (géo)spatiaux requis. Cette section explique d'abord deux méthodologies SDLC représentatives (c.

2.1 Méthodologies SDLC

Une variété de SDLC a été proposée dans la communauté du génie logiciel à différentes organisations, équipes de développement et projets, tels que Waterfall, Agile, Spiral et V-shaped. Les méthodes traditionnelles incluent le modèle Waterfall, une méthodologie séquentielle qui nécessite de terminer toutes les activités de chaque phase avant de passer à la phase suivante (McCormick 2012), et le modèle Agile, une méthodologie itérative qui contient de nombreuses itérations, chacune complétant un sous-ensemble d'activités pour chaque phase (Edeki 2015). D'autres méthodes sont souvent utilisées dans des scénarios spécifiques par exemple, le modèle en V est principalement pour les projets de petite et moyenne taille, où les exigences sont strictement prédéfinies. Cette section présente le processus du modèle Waterfall et Agile et compare leurs avantages et inconvénients.

Dans le modèle Waterfall, chaque phase doit être terminée avant le début de la phase suivante. Un processus d'examen à la fin de chaque phase détermine si le projet est sur la bonne voie. Le modèle Waterfall offre un moyen simple de gérer le projet de développement puisque chaque phase a un livrable spécifique et une revue
traiter. Par conséquent, cela fonctionne généralement bien pour les projets où les exigences peuvent être clairement définies et bien comprises. Cependant, une faiblesse est qu'une fois qu'un projet est en phase de test, il est difficile de changer quelque chose qui n'a pas été bien pensé lors des étapes précédentes. Il n'y a pas de logiciel fonctionnel ou de démo produit avant la fin du cycle de vie, donc la méthode Waterfall n'est pas adaptée aux projets à long terme et complexes. Un autre inconvénient du modèle Waterfall est que très peu d'interactions avec les parties prenantes sont impliquées dans l'ensemble du cycle de vie, ce qui signifie que le produit ne peut être démontré aux parties prenantes que lorsqu'il est prêt à la fin du cycle (Mahalakshmi et Sundararajan 2013).

La méthode Agile est un type de développement logiciel incrémental avec des cycles rapides et itératifs. Plus précisément, l'ensemble du processus de développement d'applications est divisé en plusieurs (souvent plusieurs) petits cycles. L'équipe de développement effectue chaque étape des phases de conception, de développement, de test et de déploiement de l'application dans chaque cycle. À la fin de chaque cycle, l'équipe doit livrer un sous-ensemble convenu du produit, et les parties prenantes peuvent voir un travail en cours. L'une des forces du modèle Agile est que les parties prenantes participent activement tout au long du projet. De cette façon, l'équipe de développement a la possibilité de vraiment comprendre la vision des parties prenantes avec leurs revues après chaque cycle.Le modèle Agile permet également des changements dans la prochaine itération, ce qui offre la possibilité d'affiner et de re-prioriser l'ensemble du produit en permanence. Cependant, avoir des interactions constantes avec les parties prenantes peut entraîner une gestion compliquée de la communication. Un manque de vision finale ou des changements trop fréquents peuvent désorganiser le projet. De plus, la documentation sera faible puisque les interactions avec les parties prenantes sont principalement verbales en raison de la nature de la communication fréquente.

2.2 SDLC concernant les données (géo)spatiales

Dans la phase de conception, l'équipe de développement effectue l'analyse des besoins avec les parties prenantes, sélectionne les outils logiciels (par exemple, les langages de programmation, les frameworks logiciels et l'architecture, les bibliothèques logicielles et les architectures système) et détermine l'environnement informatique (par exemple, le bureau par rapport au cloud). applications basées). Dans le cas des applications SIG, les décisions critiques doivent prendre en compte trois questions essentielles concernant les données et les processus (géo)spatiaux requis pour l'application cible :

  • Quels sont les types et les tailles requis de données (géo) spatiales (en tant qu'entrée et sortie du système) ?
  • Quels sont les processus (géo)spatiaux requis ?
  • Quel est le temps de réponse souhaité pour chaque processus (géo)spatial ?

Ces trois questions sont interdépendantes. Les types de données (géo)spatiales requis déterminent souvent les processus (géo)spatiaux applicables et les tailles de données potentielles, qui ont un impact significatif sur le temps de réponse du processus. Répondre à ces questions permet d'identifier une architecture logicielle et informatique adaptée
environnement.

Dans la phase de développement, l'équipe de développement construit les applications selon les exigences décrites dans la phase de conception. Une stratégie de développement commune consiste à développer indépendamment chaque module logiciel en utilisant l'entrée, le processus et la sortie prédéfinis de la phase de conception pour construire plusieurs modules dans
parallèle et les tester séparément dans la phase suivante. Par exemple, une manière privilégiée de développer des applications SIG est de séparer le module de prétraitement et de préparation des données du module d'analyse. Concernant une application SIG pour la prévision de la qualité de l'air, le module de prévision peut prédéfinir le format d'entrée et le système de coordonnées et laisser toute la collecte, le nettoyage et la transformation des données au module de prétraitement.

Dans la phase de test, l'équipe de développement utilise une variété de scénarios pour tester l'application construite. Par exemple, la phase de test comprendrait le traitement de grandes quantités de données de différents types sur divers systèmes d'exploitation ou le fait que les utilisateurs commettent intentionnellement des erreurs lors de l'utilisation de l'application. Pour SIG
applications, les données de test doivent inclure des données (géo)spatiales provenant de divers systèmes de coordonnées et échelles pour assurer une transformation et une intégration correctes des données (géo)spatiales provenant de sources hétérogènes. La phase de test doit montrer que l'application construite peut gérer des scénarios typiques et inattendus (par exemple, des erreurs dans les données d'entrée).

Dans la phase de déploiement, l'équipe de développement intègre l'application construite avec les frameworks logiciels, les bibliothèques et les architectures requis dans un environnement de production et fournit un accès aux applications aux parties prenantes. L'équipe de développement crée généralement un package d'installation pour l'application construite sur le système d'exploitation cible (par exemple, Windows Installer pour Microsoft Windows) et doit parfois publier le package d'installation sur un marché d'applications (par exemple, Apple App Store).

Après le déploiement d'une application, l'équipe de développement doit s'assurer que l'application continue d'être fonctionnelle. Par exemple, pour une application basée sur le cloud, le serveur doit être réactif sans aucun temps d'arrêt. De plus, à chaque phase, l'équipe de développement doit créer une documentation d'application pour faciliter le processus de développement, permettre la maintenance future et fournir le manuel d'utilisation. Les besoins opérationnels supplémentaires peuvent inclure la diffusion de la documentation au public afin qu'un large éventail d'utilisateurs (comme les scientifiques des données et les géoscientifiques) puissent accéder et utiliser les applications ainsi que fournir un support technique (voir Yang et al. 2019).

Le système de gestion des données de trafic archivées (ADMS) (Anastasiou et al. 2019) est un grand entrepôt de données de transport développé par l'Integrated Media Systems Center (IMSC) de l'Université de Californie du Sud, en partenariat avec la Los Angeles Metropolitan Transportation Authority (LA Metro) et METRANS. ADMS fusionne et analyse les données de capteurs de trafic à très grande échelle et à haute résolution (à la fois spatiale et temporelle) provenant de diverses autorités de transport du sud de la Californie, notamment le California Department of Transportation (Caltrans), le Los Angeles Department of Transportation (LADOT), California Highway Patrol (CHP) et Long Beach Transit (LBT). Cet ensemble de données comprend à la fois des données historiques et en temps réel. Les données en temps réel ont un taux de mise à jour aussi élevé que toutes les 30 secondes pour les capteurs de trafic autoroutier et artériel (14 500 détecteurs en boucle) couvrant 4 300 milles, 2 000 bus et train localisation automatique des véhicules (AVL). Les données en temps réel incluent également les incidents, tels que les accidents, les dangers de la circulation, les fermetures de routes signalées (environ 400 par jour) par le Los Angeles Police Department (LAPD) et le CHP, et les compteurs de rampe. ADMS collecte et archive en continu des ensembles de données au cours des neuf dernières années. ADMS, avec une croissance annuelle de 15 Go, est l'entrepôt de données de capteurs de trafic le plus massif construit à ce jour en Californie du Sud. Cette section explique les applications sur ADMS et traite de la méthode SDLC utilisée dans le processus de développement global d'ADMS.

3.1 Applications sur ADMS

ADMS est une architecture multicouche fonctionnant sur la plate-forme cloud IMSC (Figure 1). L'architecture multicouche comprend la couche de collecte de données, la couche de gestion des données, la couche d'analyse en ligne et hors ligne, la couche d'apprentissage et d'intelligence, la couche de service et la couche de présentation. Ensemble, l'architecture multicouche prend en charge divers types d'applications qui nécessitent le traitement de données (géo)spatiales. Par exemple, IMSC a développé des approches et des applications basées sur les données (géo)spatiales pour la prévision du trafic (Li et al. 2018) et les estimations de fiabilité des performances des véhicules publics (Nguyen et al. 2018) en plus de l'infrastructure AMDS. Les deux applications résident dans la couche d'intelligence d'apprentissage et s'appuient sur des modules de nettoyage et de transformation des données dans d'autres couches pour accéder aux données d'entrée requises et préparer les données dans un format spécifique. L'architecture multicouche d'ADMS est flexible et facile à entretenir puisque chaque couche a un format d'entrée et de sortie structuré prédéfini individuel. Chaque couche contient des composants modularisés qui peuvent être mis à jour rapidement lorsque de nouvelles technologies sont disponibles sans reconstruire l'ensemble de l'infrastructure.

Figure 1. L'architecture multicouche dans ADMS (Archived Traffic Data Management System). Source : auteurs.

L'application de prévision du trafic (Li et al. 2018) est un nouveau réseau de neurones à convolution graphique (GCRNN) qui modélise la dépendance temporelle complexe et la dépendance topologique du flux de trafic pour la prévision du trafic. L'application peut prévoir le trafic à diverses résolutions spatiales (par exemple, régions individuelles, segments de route ou capteurs) et temporelles (par exemple, 5 minutes et 30 minutes suivantes). Pendant la période de prévision, l'application consomme des mises à jour du trafic en temps réel à partir de la file d'attente des messages de la couche d'analyse en ligne hors ligne et en ligne, ce qui garantit un flux de données continu pour les prévisions horaires. Ensuite, un module de la couche de gestion des données stocke les résultats des prévisions. Une API dans la couche de service consomme les résultats de prévision stockés et transmet les résultats à un tableau de bord SIG Web dans la couche de présentation. Les parties prenantes peuvent accéder au tableau de bord du SIG Web et cliquer sur des segments de rue pour visualiser les résultats des prévisions de trafic.

L'application d'estimation de l'heure d'arrivée du bus (Nguyen et al. 2018) utilise de grandes quantités d'ensembles de données historiques de trajectoire de bus stockés à la fois dans HDFS et PostGIS dans la couche de gestion des données. L'application utilise la capacité de traitement parallèle hors ligne dans la couche d'analyse pour générer des statistiques d'heure d'arrivée historiques pour des itinéraires de bus individuels afin d'estimer le retard pour chaque arrêt de bus à différents moments de la journée. Comme l'application de prévision du trafic, les résultats d'estimation sont stockés dans la couche de gestion des données avec une API dans la couche de service pour fournir un accès public à partir d'un tableau de bord SIG Web. En plus des estimations de l'heure d'arrivée, le tableau de bord du SIG Web affiche également les emplacements des bus en temps réel en utilisant l'API de localisation des bus dans la couche de service.

Les deux applications nécessitent un accès aux données de trafic hors ligne et en temps réel. L'application de prévision du trafic nécessite un cadre d'apprentissage automatique, tandis que l'application d'estimation des performances du bus repose sur un processus d'agrégation de données simple sur plusieurs téraoctets de données historiques. En construisant ces applications, le
L'équipe de développement construit et teste des modules individuels sur des couches distinctes indépendamment en utilisant l'entrée, le processus de module et la sortie prédéfinis, ce qui permet un prototypage rapide et la détection d'erreurs potentielles.

3.2 SDLC d'ADMS

Le SDLC d'ADMS suit généralement le modèle Agile dans lequel le processus de développement comprend plusieurs itérations. Dans la première itération, l'équipe de développement construit la fonctionnalité initiale de chaque couche pour s'assurer que le pipeline de données de la couche de collecte de données à la couche de présentation est fonctionnel pour prendre en charge une application de bout en bout. Dans l'itération suivante, l'équipe de développement ajoute de nouvelles fonctionnalités à chaque couche pour prendre en charge des applications sophistiquées. À chaque itération, l'équipe de développement construit chaque couche de manière séquentielle. Ici, nous discutons brièvement de la stratégie ADMS SDLC.

Dans la première itération, l'objectif est d'avoir un ADMS entièrement fonctionnel mais de ne gérer que quelques flux de données critiques pouvant prendre en charge les estimations de l'heure d'arrivée du bus. Les exigences déterminées comprennent 1) la collecte des flux de données de LA Metro pour la vitesse et les volumes des véhicules en temps réel à partir de milliers de capteurs de trafic et d'emplacements de bus à partir de centaines de bus, et 2) le stockage des données collectées en fonction de leurs types d'utilisation. Les données récemment collectées (par exemple, les mois) nécessitent des opérations spatiales fréquentes (par exemple, une jointure spatiale). Les données collectées en temps quasi réel (par exemple, les minutes) nécessitent un accès rapide aux données. Les données historiques à long terme nécessitent des opérations d'agrégation et de filtrage de données pouvant gérer de grands ensembles de données.

Après la phase de conception, l'équipe implémente la couche de collecte de données avec quelques adaptateurs modulés critiques. La mise en œuvre de l'adaptateur modulé permet au système d'accueillir facilement de nouveaux flux de données (par exemple, des informations météorologiques dans les quartiers) avec des adaptateurs supplémentaires dans la prochaine itération Agile. La sortie de cette couche de collecte de données est constituée des flux de données provenant de diverses sources de données. Ensuite, l'équipe de développement respecte les exigences pour mettre en œuvre la couche de gestion des données, y compris les systèmes de stockage de données spécialisés pour accéder 1) aux données récentes nécessitant des opérations spatiales robustes (PostGIS), 2) aux données en temps quasi réel nécessitant un accès rapide aux données à l'aide de données en mémoire stocker (redis) et 3) toutes les données historiques nécessitant un calcul distribué pour l'agrégation et le filtrage des données (Hadoop Distributed File System, HDFS). Ensuite, l'équipe de développement construit le cadre de base pour la couche de service, la couche d'apprentissage et d'intelligence et la couche de présentation pour permettre le déploiement d'applications de bout en bout. La couche de service comprend plusieurs API d'accès aux données pour la consommation de données dans ADMS (y compris les résultats des applications déployées dans la couche d'apprentissage et d'intelligence, par exemple, l'estimation de l'heure d'arrivée du bus). La couche de présentation contient des tableaux de bord et des cartes Web pour visualiser et diffuser les données ADMS et les sorties des modèles d'apprentissage automatique.

L'équipe de développement utilise l'estimation de l'heure d'arrivée du bus pour tester le pipeline de données de bout en bout et la visualisation Web dans la phase de test. En particulier, la phase de test s'avère que la mise en œuvre a répondu aux exigences déterminées lors de la phase de conception. En phase de déploiement, l'équipe de développement ouvre l'application au grand public et génère des manuels d'utilisation et des vidéos tutorielles. Dans la phase de maintenance, l'équipe de développement organise des heures de bureau hebdomadaires pour aider à résoudre les problèmes des utilisateurs. L'équipe de développement installe également un logiciel pour surveiller l'état d'ADMS et s'assurer qu'ADMS dispose d'une disponibilité proche de 100 % pour consommer des données en temps réel et générer des résultats en temps quasi réel en continu.

Dans la deuxième itération, l'équipe de développement répète le même SDLC que dans la première itération avec des considérations supplémentaires pour concevoir, développer, tester, déployer et maintenir l'application de prévision du trafic. Par exemple, l'exigence de la deuxième itération inclut la prise en charge d'un cadre d'apprentissage automatique avancé dans la couche d'apprentissage et d'intelligence. Dans l'ensemble, le développement d'ADMS et bénéficie de l'utilisation du modèle AGILE afin que les parties prenantes puissent examiner une application de bout en bout après chaque itération. Au cours de chaque itération, l'équipe de développement peut ajouter des fonctionnalités supplémentaires (modules de calcul) dans chaque couche d'architecture ADMS.

Cet article a présenté divers types d'applications SIG et les considérations dans le cycle de vie du développement du SIG, du point de vue du stockage, de l'accès et de l'analyse des données (géo) spatiales. L'article présentait également deux applications réelles existantes pour mettre en évidence les considérations critiques à chaque étape du GiSDLC.

Anastasiou, C.J. Lin, C. He, Y.-Y. Chiang, et C. Shahabi. (2019). Admsv2 : une architecture moderne pour la gestion et l'analyse des données de transport. Dans l'atelier international ACM SIGSPATIAL sur les progrès des villes résilientes et intelligentes, 2019.

Brunsdon, C., A. S. Fotheringham et M. E. Charlton. (1996), Régression pondérée géographiquement : une méthode d'exploration de la non-stationnarité spatiale. Analyse géographique, 28(4):281-298.

Clarke, K.C. (2010). Initiation aux Systèmes d'Information Géographique. Pearson, 2010. ISBN 9780131494985.

Cressie, N. (1990). Les origines du krigeage. Géologie mathématique, 22(3):239-252.

Edeki, C. (2015) Méthodologie de développement logiciel agile. European Journal of Mathematics and Computer Science, 2 (1), 2015.

ESRI. (1998). Description technique du shapele Esri. Rapport technique, ESRI.

Li, Y., R. Yu, C. Shahabi et Y. Liu. (2018). Réseau de neurones récurrents convolutifs de diffusion : prévisions de trafic basées sur les données. Dans Conférence internationale sur les représentations de l'apprentissage, 2018.

Lin, Y., N. Mago, Y. Gao, Y. Li, Y.-Y. Chiang, C. Shahabi et J.L. Ambite. (2018). Exploiter les modèles spatio-temporels pour une prévision précise de la qualité de l'air à l'aide de l'apprentissage en profondeur. Dans ACM SIGSPATIAL, pages 359-368.

McCormick, M. (2012). Waterfall vs. méthodologie agile. MPCS.

Nguyen, K., J. Yang, Y. Lin, J. Lin, Y.-Y. Chiang, et C. Shahabi. (2018). Analyse des données du bus du métro de Los Angeles à l'aide de la trajectoire GPS et des données d'horaire (papier de démonstration). Dans Actes de la 26e Conférence internationale ACM SIGSPATIAL sur les progrès des systèmes d'information géographique, pages 560-563.

Yang, C., M. Yu, Y. Li, F. Hu, Y. Jiang, Q. Liu, D. Sha, M. Xu et J. Gu. (2019). Analyse de données Big Earth: Une enquête. Données Big Earth, 3(2):83-107.


Permettre l'exploration des données

L'octroi de licences a été simplifié grâce à la licence Open Government (OGL), qui permet aux clients d'en faire plus. Et nous avons créé une licence d'exploration de données pour les produits qui ne sont pas inclus dans le portefeuille de données ouvertes. Cela a donné à quiconque un accès gratuit aux données de système d'exploitation premium, telles que OS MasterMap, pour explorer comment cela pourrait bénéficier à leurs propres produits ou à leur entreprise.

Notre désir de faire partie de la révolution des données ouvertes a vu naître Geovation en 2010, avec une série de défis annuels conçus pour amener les entrepreneurs à travailler avec les données ouvertes et la géographie.

Et en 2015, nous avons ouvert le Geovation Hub à Clerkenwell, Londres. Le Hub exécute le programme Geovation pour aider les start-ups utilisant des données de propriété ou de localisation tierces à accélérer et à se développer.

Nous avons parcouru le pays avec des masterclass OS OpenData, montrant aux gens comment travailler avec des données ouvertes et les intégrer dans leurs propres produits et services. Nous avons lancé un kit de développement logiciel pour permettre aux utilisateurs de connecter plus facilement les données aux applications et aux mobiles.

Nous avons également publié des données ouvertes dans des formats alternatifs, notamment la création d'une carte Minecraft de la Grande-Bretagne qui a eu plus de 250 000 téléchargements.


Zones géographiques d'accès et d'activation

Entente géographies d'accès et d'activation fournit des informations importantes sur la distribution des technologies et des services essentiels à la communication, à la participation et à la représentation numériques. Plus précisément, l'accès à Internet est une condition préalable à la plupart des types d'engagement numérique, et il est donc essentiel d'illustrer les modèles mondiaux de (dé)connectivité. La figure 1 utilise les données de 20113 3 Au moment de la rédaction, les données de 2011 étaient l'ensemble de données le plus complet disponible.
sur les utilisateurs d'Internet et les ensembles de données sur la population totale de la Banque mondiale, qui a suivi les utilisateurs d'Internet et les connexions Internet par pays depuis les années 1990. Dans la suite de l'article, les termes « population Internet » et « utilisateurs d'Internet » font référence au segment de la population d'un pays qui a accès à Internet. Ceci est calculé en utilisant la pénétration d'Internet d'un pays (selon les définitions et les données de la Banque mondiale).

Les données sont visualisées avec un cartogramme en forme d'hexagone dans lequel la taille de chaque pays est déterminée par sa population d'internautes (chaque hexagone représentant un tiers de million d'internautes). Les pays avec moins de 333 333 utilisateurs ne sont pas sur la carte. L'ombrage de chaque pays reflète son taux de pénétration d'Internet : les nuances plus foncées indiquent des niveaux plus élevés d'utilisation d'Internet par habitant dans la population. La distorsion dans le cartogramme met en évidence les concentrations d'utilisateurs au niveau des pays, la Chine possédant la plus grande population Internet au monde avec plus d'un demi-milliard et les États-Unis, l'Inde et le Japon étant les deuxièmes nations les plus peuplées d'utilisateurs d'Internet.

Cette liste met également en évidence deux tendances importantes. Premièrement, l'émergence de l'Asie en tant que principale composante de la population Internet mondiale avec 42% des internautes dans le monde, ce qui signifie en d'autres termes que la combinaison de la Chine, de l'Inde et du Japon compte plus d'internautes que l'Europe et l'Amérique du Nord réunies. Deuxièmement, peu de pays comptant un grand nombre d'utilisateurs se classent dans le quintile supérieur (80 %) de pénétration d'Internet et certains, comme l'Inde, appartiennent à la catégorie la plus basse avec moins de 20 % de sa population sur Internet. En d'autres termes, dans bon nombre des plus grands pays Internet du monde, il existe encore une marge de croissance substantielle.

Un autre modèle géographique clé de pénétration d'Internet est que tous les pays sauf quatre (Canada, Nouvelle-Zélande, Qatar et Corée du Sud) avec des taux de pénétration supérieurs à 80 % se trouvent en Europe. En revanche, l'Amérique latine, qui dans son ensemble accueille désormais presque autant d'internautes que les États-Unis, affiche des taux de pénétration de 40 à 60 %. Le cas de l'Afrique est le plus varié, certains pays connaissant une forte croissance, tandis que d'autres ont peu évolué. Presque tous les pays d'Afrique du Nord ont doublé leur population d'internautes (l'Algérie est une exception notable) au cours des trois dernières années, et le Kenya, le Nigeria et l'Afrique du Sud ont également connu une croissance massive. Cependant, plus de 20 pays d'Afrique subsaharienne ont une pénétration d'Internet inférieure à 10 % avec une faible croissance ces dernières années. Il est donc essentiel de se rappeler que malgré le rôle massif d'Internet dans la vie quotidienne en Europe occidentale - où ce document a été écrit et publié - la plupart des gens sur notre planète restent sans accès.

Abordabilité du haut débit

En plus de l'inégalité de la géographie de l'accès à Internet, le coût relatif de l'accès varie considérablement d'un endroit à l'autre.La figure 2 illustre ce point en cartographiant les coûts des frais d'abonnement au haut débit fixe publiés par l'Union internationale des télécommunications (UIT 2013 )4 4 L'UIT ( 2013 ) définit l'indicateur comme suit : frais d'abonnement mensuel au service Internet haut débit fixe (filaire). Le haut débit fixe (filaire) est considéré comme toute connexion dédiée à Internet à des vitesses descendantes égales ou supérieures à 256 kbit/s. Si plusieurs offres sont disponibles, il convient de privilégier la connexion à 256 kbit/s. » Nous avons utilisé les chiffres de l'abonnement mensuel d'entrée de gamme le moins cher et multiplié par 12 pour obtenir le coût annuel. Nous avons également choisi d'utiliser le haut débit plutôt que les statistiques du haut débit mobile en raison des incohérences actuelles dans la collecte de ces données. Cependant, l'abordabilité du haut débit mobile est un élément sur lequel les recherches futures devraient se concentrer.
rapport au revenu national brut par habitant5 5 Ceci est fait en utilisant la « Méthode Atlas » de la Banque mondiale qui réduit l'impact des fluctuations des taux de change dans les données (https://datahelpdesk.worldbank.org/knowledgebase/articles/378832-what- est-la-méthode-de-l'atlas-banque-mondiale).
.

La figure 2 met en évidence l'un des thèmes centraux de la fracture numérique mondiale : le coût relatif de la connexion à Internet. L'Europe et l'Amérique du Nord ont des coûts absolus élevés, allant d'environ 10 à 40 USD par mois, mais ont des coûts relatifs parmi les plus bas au monde : quelques heures de travail par mois suffisent pour qu'un travailleur moyen puisse payer le coût de connectivité. Ceci, en partie, aide à expliquer certains des schémas illustrés dans la Figure 1 : comme le fait que le coût d'une connexion à large bande dans la plupart des régions d'Afrique est prohibitif pour la plupart des gens puisque dans une grande partie du continent, le coût varie entre 10% et 250 % du revenu moyen. En revanche, les utilisateurs nord-américains et sud-américains et européens peuvent obtenir des connexions à large bande pour moins (et souvent beaucoup moins) de 10 % de leurs revenus, une distinction partagée par seulement cinq pays d'Afrique subsaharienne.

Le problème réside davantage dans les faibles revenus moyens des Africains que dans les coûts élevés du haut débit. En effet, grâce à une série de câbles posés autour du continent africain en 2009, le coût moyen d'une connexion internet en Afrique est aujourd'hui la moitié de ce qu'il était il y a 4 ans. Le Kenya et le Nigeria, par exemple, ont des coûts de large bande 2011 qui sont de 21% et 8% des niveaux de 2008 (UIT 2013) : des chiffres qui ont sans aucun doute contribué à la croissance significative du nombre d'utilisateurs d'Internet dans les deux pays. Bien entendu, il ne s'agit pas simplement d'un mécanisme de marché à l'œuvre, car les régimes réglementaires en vertu desquels le haut débit est mis à disposition façonnent également les conditions d'accès des utilisateurs.

Cependant, les coûts restent un obstacle majeur dans de nombreux endroits, comme en Érythrée, où un abonnement annuel coûte l'équivalent de près de 50 ans d'un salaire moyen : toute une vie de travail pour un an d'accès Internet haut débit. Même les pays avec des baisses considérables du coût du haut débit comme le Burkina Faso (de 1700 $ US par mois en 2008 à 55 $ US par mois en 2011) sont confrontés à la situation où l'accès au haut débit représente 100 % du salaire d'un travailleur moyen dans le pays une situation partagée par 14 autres pays d'Afrique subsaharienne ainsi que l'Afghanistan et le Tadjikistan. En revanche, l'Inde et le Sri Lanka ont les tarifs d'accès à large bande les moins chers, avec des coûts aussi bas que 6 USD par mois.

Les données présentées dans les figures 1 et 2 sont parmi les plus importantes pour comprendre les géographies de l'information actuelles. Sans la capacité et les moyens de se connecter, toute chance de participer ou de contribuer aux représentations de leurs localités est tout simplement impossible. Pourtant, malgré ces géographies inégales, il est important de se rappeler qu'il y a maintenant près de 3 milliards d'internautes qui ont une forme d'accès. Dans cet esprit, cet article explore la propension relative de ces utilisateurs à créer et partager du contenu, et à représenter et annoter notre monde.


Оздание арты из айла Excel

еренести табличные данные на карту ри помощи BatchGeo очень легко. оворим об Excel, поскольку это наиболее распространённая рограмма для работы с ектронными таблицами, нограмма для работы с ектронными таблицами, носрамма для работы с электронными таблицами, носрамма для работы с электронными таблицами, носост с ектронными таблицами, носост

анные о местоположении олжны содержаться в одном столбце. то могут быть почтовые индексы или названия городов, а могут быть и полные адреса. ем больше у вас данных, тем лучше для геокодера.

Тобы начать создание карты, олните следующие аги:

  1. ткройте свою ектронную таблицу.
  2. ерите (Ctrl+A et Cmd+A) et скопируйте (Ctrl+C et Cmd+C) се аши данные.
  3. ткройте раузер и зайдите на веб-сайт batchgeo.com.
  4. ажмите на поле вставки анных с образцом и вставьте (Ctrl+V или Cmd+V) свои собственные данные.
  5. едитесь, что в данных присутствует столбец с данными о местоположении, нажав «роверка и настройки».
  6. ерите нужный столбец с данными о местоположении ри помощи раскрывающегося списка.
  7. ажмите «Создать карту» et ожете понаблюдать за работой геокодера.

осле того, ак все строки таблицы будут еокодированы, нажмите «охранить и продолжить», затем введоините охранить и продолжить», затем введоините дохранить и продолжить», затем введоинит и продолжить' ажите её название, и, если хотите, краткое описание. Pour plus d'informations

еперь нажмите «Сохранить карту», ​​после чего вы будете перенаправлены на уникальную страницу своей карты.


Chapitre 2 - Statistiques sur l'état des transports

Le système de transport américain, l'un des plus importants au monde, dessert 284 millions d'habitants et 7 millions d'établissements commerciaux dispersés dans le quatrième plus grand pays (par superficie). Ce système complexe permet l'activité économique, permettant même aux petites villes ou aux entreprises de se connecter physiquement avec le reste du monde, et offre aux citoyens un degré élevé de mobilité, facilitant l'accès aux biens, aux services, au travail, aux loisirs et aux activités sociales. Le système doit continuellement s'adapter aux changements des conditions externes, tels que l'évolution des marchés, la concurrence mondiale, l'évolution démographique, les problèmes de sécurité, les conditions météorologiques, les contraintes énergétiques et environnementales et les besoins de sécurité.

Étant donné la nature du système, une bonne information est essentielle à une prise de décision efficace en matière de transport, que ce soit par les gouvernements, les entreprises ou les consommateurs. Avoir les bonnes données et informations disponibles sous la bonne forme, au bon moment peut affecter des décisions aussi différentes en échelle et en importance que l'itinéraire à choisir pour le trajet du matin, les modes à utiliser pour expédier les marchandises, où localiser les installations de transport, et comment allouer les investissements publics ou privés pour le transport.

Avec des utilisations si différentes des données et informations sur les transports, le système de collecte, d'analyse et de diffusion de ces données et informations est lui-même complexe, impliquant de multiples entités publiques et privées. Une partie de la complexité découle de l'unicité des données clés sur le transport (encadré 1). L'accès du public à certaines informations, en particulier celles collectées par les agences gouvernementales, n'est souvent pas difficile, tandis que les informations collectées par ou à partir de sources privées sont souvent protégées ou confidentielles. Les États, les organisations de planification, les localités et les autorités chargées des transports collectent de nombreuses données, souvent à des fins opérationnelles et de planification, mais leur utilité au-delà de l'emplacement spécifique peut être limitée, car elles ne sont pas disponibles sous une forme permettant à d'autres de les utiliser facilement, par exemple , un format standard. Le gouvernement fédéral obtient souvent des données des États ou d'autres organismes publics et recueille des données par le biais d'enquêtes et d'autres moyens, à ses propres fins.

Avec toutes ces données, plusieurs questions se posent :

  • Les données couvrent-elles les bons sujets ?
  • Les données sont-elles pertinentes pour les besoins de prise de décision ?
  • Les données sont-elles fiables et exactes ?
  • Les données sont-elles compréhensibles, accessibles et opportunes pour la prise de décision ?

Dans le but d'améliorer le système d'information sur les transports, le Congrès a autorisé en 1991 la création du Bureau of Transportation Statistics (BTS). Les mandats du BTS ont été réaffirmés par une loi de réautorisation en 1998. Dans le cadre de ce mandat, le Congrès a demandé au BTS d'évaluer à la fois l'état du système de transport et l'état des statistiques de transport dans un rapport annuel sur les statistiques de transport. Plus précisément, le rapport doit inclure « . . . des recommandations pour améliorer l'information statistique sur les transports ». Ce chapitre, en réponse au mandat du Congrès du BTS, se concentre sur les dimensions publiques des statistiques de transport.

L'importance des données

Le besoin de données a été un thème récurrent tout au long de la longue histoire des statistiques sur les transports (encadré 2). Une longue période d'intérêt croissant pour les statistiques des transports a atteint son apogée en 1977 avec d'importantes activités de collecte de données dans tous les modes de transport, la publication d'analyses complètes des besoins nationaux de transport et d'un atlas national des transports, et un programme conjoint de collecte de données multimodales par le ministère des Transports (DOT) et le Census Bureau du ministère du Commerce.

Les statistiques sur les transports sont entrées dans une période de déclin après 1977 alors que la déréglementation et la réduction des budgets ont mis fin à de nombreux programmes fédéraux. Le gouvernement fédéral n'a pas effectué d'analyses nationales complètes des transports entre 1979 et 1989. Les données multimodales nationales sur les flux de marchandises n'ont pas non plus été recueillies entre 1977 et 1993. Cependant, la demande pour ces informations est restée forte, comme en témoignent les divers mandats confiés au BTS. lorsqu'il a été établi par la Loi sur l'efficacité du transport intermodal de surface, puis réautorisé par la Loi sur l'équité en matière de transport pour le 21e siècle.

L'importance des données sur les transports est sous-jacente au fait que les données sont des outils clés pour le travail de la communauté des transports : pour prendre des décisions politiques éclairées soutenant les règles et les normes créer, évaluer et modifier des programmes planifier et mener des recherches efficacement. Fondamentalement, sans de bonnes données, le système de transport ne peut pas être correctement évalué et les changements stratégiques appropriés apportés pour améliorer sa performance.

Parce que les changements ne peuvent pas toujours attendre de bonnes données et l'analyse appropriée qui en découle, les décisions de transport sont parfois prises aujourd'hui en utilisant des données de qualité inférieure. Sachant cela, BTS s'est efforcé tout au long de ses 10 années de changer cette situation, pour s'assurer que les données de transport sont pertinentes, opportunes, comparables, complètes, de haute qualité et utiles. De mauvaises données peuvent signifier des décisions erronées. À l'inverse, lorsque les données sont irréprochables, elles renforcent l'objectivité et attirent l'attention sur des questions qui pourraient autrement passer inaperçues. De bonnes données peuvent focaliser des débats politiques controversés.

Pourtant, de bonnes données ne sont souvent pas disponibles parce qu'elles sont coûteuses à collecter. La Commodity Flow Survey (CFS), le programme fédéral de base pour la collecte de données sur le mouvement des marchandises, coûte plusieurs millions de dollars à produire. Malgré son coût relativement élevé et les efforts déployés pour l'améliorer, le CSA a de sérieuses limites. Il ne couvre pas tous les mouvements de fret, manque de détails géographiques importants et n'est disponible que tous les cinq ans. Le SCF attire l'attention sur un problème auquel sont confrontés d'autres efforts importants de collecte de données dans les transports : comment évaluer les avantages d'un plus grand nombre ou de nouveaux efforts de collecte de données par rapport aux coûts de la collecte de données elle-même. Un argument fort peut souvent être avancé que le coût d'une erreur due à des données indisponibles ou erronées peut être bien plus élevé que le coût de développement de systèmes de données appropriés. Un seul projet d'autoroute, par exemple, peut coûter des millions de dollars de plus que le coût de la collecte d'un ensemble complet de données nationales sur les flux d'expéditions de fret. Avec mes excuses à Roger Bacon : Celui qui n'a pas de données ne peut pas apprendre les autres sciences. . . et ce qui est pire, ils ne connaissent pas leurs propres défauts ni leurs remèdes appropriés. 1 Bacon faisait référence aux mathématiques, mais, sans données, les décideurs peuvent ne pas connaître les lacunes de leurs politiques ou comment construire des remèdes appropriés.

L'évaluation des coûts et des avantages de la collecte de données constitue un défi pour les organismes statistiques qui sont les producteurs, les dépositaires et les diffuseurs des données. Un organisme statistique relativement nouveau comme le BTS, chargé par le Congrès d'identifier ce que pourrait être un système complet de statistiques sur les transports, doit juger non seulement quelles données pourraient être utiles, mais aussi si les avantages justifient les coûts. Dans les transports, il faut souvent supposer des avantages, surtout en l'absence de données pouvant les révéler.

Pour produire de bonnes données, la nature fragmentaire des institutions de transport doit être surmontée. Bon nombre des principaux problèmes de transport aujourd'hui transcendent les modes et les frontières politiques. La résolution de ces problèmes peut nécessiter des solutions multimodales, notamment des transferts intermodaux ou une meilleure allocation des flux origine-destination (O-D) entre les modes concurrents. Par exemple, l'augmentation de la congestion a actuellement un impact sur le mouvement rentable des personnes et des marchandises, avec des effets négatifs ultérieurs sur l'économie, l'environnement et la consommation d'énergie. Les solutions durables à l'atténuation de la congestion impliqueront également plusieurs modes, et l'identification des solutions les plus prometteuses signifiera la recherche de meilleurs moyens de combiner les sources de données entre les différents modes.

Ceux qui collectent des données sur les transports sont souvent contraints par l'histoire passée. De nombreuses données locales, étatiques et nationales ne peuvent pas être fusionnées pour produire des images plus larges de l'état et des besoins des transports. Il existe des données sur les accidents et les décès routiers, aériens, ferroviaires et maritimes, mais les comparaisons sont risquées car les définitions des données et les méthodologies de collecte diffèrent. Des données sur les passagers et le fret existent, mais pas pour chaque mode de manière comparable. Les institutions peuvent s'élever au-dessus de cette « accumulation » de données sur les transports en trouvant, par exemple, des moyens de coopérer véritablement les unes avec les autres, mais il y a souvent des désincitations à apporter les changements nécessaires. Il faudra du temps et des ressources pour mettre en place un système de données de transport plus intégré, mais des économies s'accumuleront à long terme.

Enfin, un bon système de données doit être agile. Il doit produire des données en temps opportun et être suffisamment flexible pour ajuster son orientation au fur et à mesure que les besoins des transports évoluent.Une grande partie du transport relève du secteur privé où le rythme du changement peut être rapide. Dans un tel contexte, des données opportunes axées sur les changements dans la combinaison de modes, la géographie et la demande de transport par rapport à l'offre n'ont jamais été aussi importantes.

Le système de données sur les transports d'aujourd'hui

Le système actuel de statistiques sur les transports se compose d'un ensemble de systèmes de données construits chacun à des fins spécifiques, parfois restreintes. Ces systèmes existent un peu comme une collection de pièces de différents puzzles de la même image. Les pièces répondent bien à certaines questions mais laissent beaucoup d'autres sans réponse ou partiellement ou mal répondues. Les pièces ne constituent pas un tout en raison d'un certain nombre de facteurs, y compris les utilisateurs de données contradictoires ont besoin de définitions incompatibles diverses méthodes de collecte et les chevauchements de données, les omissions, l'actualité, la couverture et les incohérences apparentes. Bon nombre des problèmes de données de transport les plus urgents rencontrés par les décideurs lorsque BTS a été formé il y a une décennie ont été résolus. La discussion suivante et son contraste avec un système visionnaire suggèrent que des défis importants demeurent.

Utilisateurs de données

La communauté des transports compte un ensemble très diversifié d'utilisateurs de données (encadré 3) dont les besoins ne se complètent pas toujours, en fait, ils peuvent parfois être en conflit. Personne ne peut fournir de manière réaliste toutes les données sous toutes les formes accessibles à tous les utilisateurs, ni ne peut facilement sélectionner un sous-ensemble optimal d'utilisateurs sur lequel concentrer les efforts de données. Cependant, en se concentrant sur la recherche de solutions globales aux besoins de données, les fournisseurs pourraient être en mesure de satisfaire de nombreux utilisateurs. Par exemple, un système de transport intelligent peut capturer des informations qu'un opérateur peut utiliser pour gérer le flux de trafic urbain. Ces données peuvent également être utilisées pour mesurer les performances du réseau routier et pour valider des modèles de planification. Ensuite, si les données sont archivées, elles permettraient aux planificateurs routiers d'identifier les zones de congestion excessive pour déterminer les priorités du projet ou aux chercheurs de déterminer les paramètres pour développer des modèles de flux de circulation.

Cette approche suggère que le processus d'identification des besoins en données soit un processus collaboratif impliquant toutes les parties prenantes potentielles. En outre, cela signifie s'éloigner du concept de propriétaires de données qui créent et maintiennent des systèmes à leurs propres fins et ne considèrent qu'à contrecœur les besoins des autres. Au lieu de cela, les gestionnaires de données pourraient se concentrer sur la conception de systèmes avec une contribution aussi large que possible dans le but ultime de partager les données dans toute la mesure du possible. Même alors, certains conflits sont inévitables. Par exemple, le public peut être en faveur d'avoir des systèmes de surveillance routière qui permettent aux opérateurs de réacheminer le trafic en réponse à un incident. Ils peuvent même accepter que ces mêmes données soient archivées afin que les planificateurs puissent identifier les points chauds nécessitant des ajustements d'infrastructure. Mais le public est souvent réticent à laisser les responsables de l'application de la loi avoir accès à ces mêmes données si l'intention est de les utiliser pour identifier et suivre les mouvements d'individus spécifiques.

Définitions standard

Les problèmes de comparabilité des données abondent et peuvent provenir de différences de niveaux de détail et d'objectifs entre les collecteurs de données. Le gouvernement fédéral peut être principalement intéressé par des données au niveau national, tandis que les gouvernements étatiques et locaux peuvent vouloir des données similaires, mais sur une base régionale ou locale. Les données locales et régionales peuvent ne pas permettre l'agrégation pour l'analyse des caractéristiques et des tendances nationales. Ces données sont souvent développées d'une manière qui conduit à des incompatibilités entre les localités ou les régions. Les collections fédérales, qui sont également souvent élaborées sans consulter un éventail complet d'utilisateurs, ont tendance à manquer de données suffisamment spécifiques, en contenu ou en quantité, pour répondre aux besoins locaux. Les données internationales peuvent ne pas être comparables entre les pays, ce qui rend les comparaisons trompeuses même si elles sont souvent faites.

Les secteurs public et privé ont besoin et collectent des données, souvent le même type d'informations, mais pas toujours aux mêmes fins. Chacun peut être réticent à partager avec l'autre. L'industrie peut ne pas vouloir que le gouvernement, en particulier les organismes de réglementation, en sache plus que ce que la loi dit que le gouvernement a le droit de savoir. Ils craignent également que les concurrents obtiennent des informations susceptibles de faire la lumière sur leurs opérations ou leurs plans. Les régulateurs peuvent ne pas vouloir que le secteur privé ait accès aux données opérationnelles. Les entreprises et les associations professionnelles qui collectent, emballent et vendent des données sont parfois en concurrence avec des gouvernements qui facturent moins ou ont tendance à divulguer des données.

Une grande partie de l'énigme sur la comparabilité des données se résume aux normes. Une perception erronée courante au sujet des normes est que tout doit être identique : le matériel, les logiciels et les systèmes de communication. Dans le monde d'aujourd'hui de la technologie de l'information, ce n'est pas vrai. Le problème critique tourne autour du manque de définitions standard pour les données. Les exemples sont nombreux. Il n'existe pas de définition commune d'un décès dans les transports pour tous les modes de transport. Les bus sont définis différemment par diverses administrations du DOT. Différentes organisations maritimes utilisent une variété de systèmes de classification des navires. Sans définitions standard, combiner ou comparer des éléments de données est extrêmement difficile, voire impossible. Le logiciel peut être capable de faire correspondre des ensembles de données qui rapportent des données dans différents formats, mais ce n'est pas si facile lorsque les relations ne sont pas simples. La coordination et la coopération sont essentielles. Un accord entre les collecteurs de données, les gestionnaires et les utilisateurs sur des définitions, des éléments de données et une structure communs résoudrait la plupart des problèmes d'incompatibilité.

Données sous-optimales

Il existe un certain nombre de façons dont la collecte de données aboutit à des données sous-optimales. Deux exemples sont les mandats du gouvernement fédéral qui exigent la soumission de données sans fonds pour couvrir le coût de la déclaration ou qui ne fournissent rien en retour de l'effort de déclaration. Alors que le DOT fournit souvent des fonds de transport aux États, ces fonds sont rarement liés aux exigences en matière de données. Ainsi, les États développent des systèmes de données qui correspondent à leurs propres besoins et budgets, résultant en des données qui ne peuvent que généralement se conformer au mandat.

Les industries ou autres sont tenues par la réglementation de soumettre certaines données, dont certaines peuvent déjà être collectées individuellement pour leurs propres besoins. Cependant, si le gouvernement ne fournit pas un accès facile aux données de l'ensemble de l'industrie qui résultent du mandat ou n'est pas en temps opportun pour rendre les données disponibles, alors le secteur privé obtient peu en retour, le laissant avec une incitation minimale à fournir des données autres que pour éviter des mesures punitives. Pour améliorer la disponibilité des données, la nouvelle base de données TranStats de BTS est destinée à fournir un "guichet unique" pour les données de transport. En tant que tel, cela pourrait fournir à l'industrie un retour tangible sur les efforts déployés pour se conformer aux exigences de déclaration de données obligatoires.

Des données sous-optimales peuvent également survenir lorsque la collecte de données n'est pas l'objectif principal de ces responsabilités de collecte. Par exemple, le policier sur les lieux d'un accident automobile doit s'assurer de la sécurité des victimes et des biens, de la protection des preuves potentielles et de la gestion de la circulation avant de recueillir des données sur la sécurité routière. Cela suggère que les procédures de collecte de données devraient être conçues, dans la mesure du possible, de manière à ne pas interférer avec d'autres tâches plus importantes. Même dans ce cas, la collecte peut entraîner des lacunes ou des inexactitudes dans les données. Dans le domaine de la sécurité, les lacunes dans les données communément connues comprennent le manque de détails sur les scènes d'accidents de véhicules à moteur, les personnes impliquées, les causes des accidents et la gravité des blessures. Cependant, la recherche de méthodes et de sources alternatives de collecte de données peut être plus appropriée plutôt que d'ajouter des charges aux intervenants sur les sites d'accidents. Les compagnies d'assurance et les prestataires de services médicaux, par exemple, peuvent être des sources de données plus détaillées sur les dommages et les blessures, bien que les problèmes de confidentialité devront probablement être résolus avant que les données puissent être partagées.

Rentabilité

Les budgets de données doivent rivaliser avec d'autres priorités au sein des agences gouvernementales, de l'industrie ou d'autres organisations. Les difficultés à évaluer les résultats positifs de l'utilisation des données peuvent conduire à des niveaux de financement minimes. L'entité qui paie s'attendra à avoir le dernier mot sur quoi, où, quand et comment les données sont collectées et utilisées. Cela peut aboutir à des systèmes de données cloisonnés où le développeur optimise la conception pour répondre à ses besoins organisationnels et prête peu d'attention aux autres utilisations possibles des données. Des efforts de coopération peuvent aider à éviter cela, comme l'illustre l'Enquête nationale sur les déplacements des ménages. Ce projet, qui interroge 25 000 ménages pour dresser un tableau national des habitudes et des habitudes de déplacement, est financé et géré conjointement par la Federal Highway Administration et le BTS. Bien que l'enquête ne soit pas assez large pour assurer une couverture adéquate pour l'analyse bien en deçà du niveau national, l'instrument d'enquête est mis à la disposition des États et des organisations de planification métropolitaine (MPO) pour collecter des données plus régionalisées. L'État ou le MPO finance un ajout à l'enquête et obtient les données souhaitées à moindre coût que s'il développait et administrait sa propre enquête comparable. Cette approche permet également des comparaisons entre MPO et les données nationales.

Lorsque les décideurs n'ont pas de bonnes données, ils s'en passent. Les projets sont toujours approuvés et financés, et un certain niveau d'amélioration des transports se produit. Les dépenses liées à la collecte et à l'analyse de données supplémentaires peuvent donc ne pas sembler nécessaires. Cependant, des données de mauvaise qualité ne se traduisent généralement pas par les solutions les plus rentables. Une situation Catch-22 peut en résulter. Sans preuve que les données seraient bénéfiques, une meilleure collecte de données pourrait ne pas être approuvée. Sans les meilleures données, la preuve de son utilité peut ne pas exister.

La fréquence

Quelle est la bonne fréquence pour les collectes de données ? La réponse facile est que cela dépend de l'utilisation des données, mais il y a d'autres facteurs. Le CFS est une enquête nationale auprès des expéditeurs menée par le Census Bureau en partenariat avec BTS. À ce jour, l'enquête a généré des données sur le transport de marchandises pour 1993 et ​​1997, et la prochaine série de données (couvrant 2002) sera publiée en 2003. Certains disent que ce cycle de cinq ans est suffisant puisque le gouvernement fédéral produit un recensement économique tous les cinq ans. ans, la réautorisation législative du DOT a lieu environ tous les cinq ans et le processus de planification s'étend sur une période de cinq ans. Disposer d'informations sur les flux de marchandises tous les cinq ans pour mesurer la façon dont le réseau de transport national est utilisé par tous les modes et pour déterminer si le rendement s'améliore ou diminue est, de ce point de vue, adéquat. Cependant, ceux qui ont besoin d'informations sur les flux de marchandises pour évaluer les infrastructures locales ou pour élaborer une stratégie commerciale ne sont pas d'accord, car les données vieilles de cinq ans sont trop périmées pour leurs processus de prise de décision.

Une façon de surmonter cette différence d'opinion serait de mener plusieurs enquêtes : une enquête nationale tous les cinq ans pour le gouvernement fédéral et d'autres plus fréquemment réalisées par les gouvernements étatiques ou locaux et par l'industrie. Cependant, cette proposition est coûteuse et peut entraîner des problèmes d'incompatibilité des données, comme discuté précédemment. Encore une fois, une approche coordonnée impliquant des utilisateurs de données à différents niveaux de gouvernement et dans l'industrie pourrait produire des données moins coûteuses mais unifiées qui répondent à une variété de besoins des utilisateurs. Un EFC modifié avec un échantillon plus petit, collecté plus fréquemment, peut répondre au besoin de données plus actuelles et être agrégé à des intervalles de cinq ou six ans pour fournir une image plus complète des flux de fret. Cette approche nécessite de rompre avec la tradition et d'adopter des solutions innovantes mais a le potentiel de répondre à plus de besoins à un coût raisonnable.

Comparabilité

Lorsque les utilisateurs de données obtiennent une réponse différente à la même question, ils se plaignent à juste titre du manque de comparabilité des données. La raison, cependant, est souvent liée à des sources différentes et à l'état des données plutôt qu'à des problèmes fondamentaux avec les données.

Plusieurs sources de données qui couvrent le même sujet ne donneront pas nécessairement la même réponse. Par exemple, un utilisateur peut obtenir des informations sur le commerce étranger d'origine hydrique à partir du rapport sur le commerce international des biens et services du Bureau du recensement des États-Unis et du rapport Journal du Commerce Base de données du service de rapport d'importation/exportation des ports (PIERS). Les données du recensement sont générées à partir de données commerciales, tandis que les Revue de Commerce les données proviennent des manifestes des navires. Les données provenant de différentes méthodes de collecte peuvent être utilisées pour vérifier la qualité de chaque système, tandis que la distribution centralisée des données peut réduire la confusion des utilisateurs. L'Office of Management and Budget a désigné le U.S. Army Corps of Engineers comme organisme central de collecte du programme américain de statistiques sur les transports maritimes à l'étranger. Le Corps a accès à la fois aux données commerciales et aux données sur les manifestes, connaît les forces et les faiblesses de chacune et peut combiner les informations des deux sources pour donner l'image la plus complète du mouvement des marchandises d'importation et d'exportation.

Un type différent d'incohérence résulte de l'utilisation de données préliminaires par rapport aux données finales. Les publications de données préliminaires permettent d'obtenir des données plus opportunes mais de moindre qualité. La National Highway Traffic Safety Administration (NHTSA) publie chaque printemps une évaluation précoce des accidents mortels de la circulation couvrant l'année civile précédente. Ces données sont révisées à une date ultérieure lorsque toutes les informations sur les décès ont été signalées et que les données ont été soumises au processus de validation de la qualité des données de la NHTSA. Les données préliminaires sont extrêmement précieuses pour ceux qui ont besoin d'informations à des fins de suivi des performances ou de planification. Des indicateurs opportuns peuvent identifier les domaines problématiques et entraîner des interventions précoces. Les décisions peuvent être prises plus tôt avec des estimations préliminaires, étant entendu que la rapidité est mise en balance avec une plus grande précision.

Omissions

Les données manquantes surviennent pour un certain nombre de raisons (encadré 4 et encadré 5) et donnent une image incomplète de qui et de ce qui est transporté. Les collectes de données existantes sont souvent soit trop générales pour être réduites au niveau de spécificité souhaité par les utilisateurs, soit elles ne couvrent pas de manière adéquate les sujets d'intérêt. Par exemple, on sait peu de choses sur certains aspects de l'utilisation des véhicules publics, tels que les ambulances, les véhicules de police ou les camions à ordures, les véhicules de vente au détail, tels que les camions de livraison ou les voitures particulières utilisées comme véhicules de livraison. Les données sur les transporteurs aériens de banlieue et le fret aérien ne sont pas aussi complètes ou cohérentes avec celles recueillies auprès des grands transporteurs aériens de passagers, mais les avions de banlieue et les opérations de fret aérien sont devenus des éléments importants du système de transport aérien. L'aviation générale et la navigation de plaisance, après les véhicules routiers, représentent le plus grand nombre de décès liés aux transports, mais les données sur l'exposition sont limitées.

Les éléments manquants génèrent des questions auxquelles il est impossible de répondre : Quels sont les modes de déplacement des personnes âgées, des personnes handicapées, des ménages à faible revenu, des piétons, des cyclistes, des plaisanciers, etc. Comment peut-on calculer l'exposition au risque si la fréquence et la quantité de voyage ne sont pas connues ? Combien de gros camions, de livraisons, de véhicules d'urgence et de véhicules de service ont-ils lieu chaque jour ? Quand surviennent-elles et quelles routes empruntent-elles ? Comment peut-on calculer leur impact sur la congestion si la fréquence et la durée de leurs déplacements sont inconnues ?

Ces questions reflètent l'intérêt des utilisateurs de données à cibler des segments spécifiques de la population et des utilisateurs des transports afin de s'assurer que leur impact sur le système de transport et l'impact du système sur eux peuvent être mesurés et que des mesures appropriées sont prises. Il est important de combler les lacunes dans les données comportementales : aux gouvernements fédéral, étatiques et locaux pour déterminer l'allocation des ressources aux entreprises et à l'industrie pour déterminer la stratégie de marché et la politique d'exploitation et au public pour résoudre les problèmes d'équité et de sécurité des services de transport. De nouvelles collectes de données ou une modification des méthodes existantes seront nécessaires pour fournir une image plus complète des habitudes de voyage aux États-Unis.

Intermodalisme

Le mouvement efficace des personnes et des marchandises peut impliquer plusieurs modes de transport. Ces types de déplacements sont peu représentés dans les données actuelles sur les transports. Parfois, cela peut se produire en raison de la façon dont les questions sur les voyages sont posées. Avant septembre 2001, les décideurs étaient très préoccupés par la congestion croissante apparente des voyages aériens entraînant des retards de vols aériens. BTS s'est concentré sur l'amélioration de la collecte et de la diffusion des données sur cette question spécifique. Cependant, une partie du transport aérien consiste à se rendre des centres-villes ou d'autres origines aux aéroports par d'autres modes de transport. C'est la combinaison des modes et la manière dont ils sont intégrés qui déterminent la durée réelle d'un voyage pour un individu. De même, plusieurs modes de transport sont couramment utilisés pour déplacer les expéditions de fret de leur origine initiale à leur destination finale. Cependant, ces données intermodales ne sont pas facilement disponibles. Chaque portion modale est souvent saisie mais dans des systèmes de données avec des formats, des définitions et des éléments de données différents, ce qui rend difficile l'intégration des données dans un seul voyage (encadré 6).

Focus sur les données : prévention contre survie

Les ensembles de données sont généralement collectés avec un objectif particulier, et généralement étroit, à l'esprit. Cette focalisation étroite fournira des réponses à certaines questions, mais peut ignorer des problèmes connexes importants. Les meilleurs exemples de cette situation se trouvent dans le domaine des données de sécurité. Tous les modes de transport saisissent de nombreuses données de sécurité, en particulier sur les accidents, cependant, chaque mode peut s'y prendre de différentes manières à des fins différentes.

Les accidents d'aviation sont peu nombreux mais entraînent souvent des pertes de vie. Le National Transportation Safety Board (NTSB), en conséquence, fait un travail exhaustif d'enquête sur les accidents pour déterminer pourquoi ils se sont produits. D'un autre côté, il y a tellement d'accidents de la route chaque année (allant des accidents mineurs aux accidents mortels) qu'une grande attention a été accordée à la collecte d'informations sur la capacité de survie. Cette focalisation disparate a laissé les deux modes avec des lacunes dans les données. Des données limitées sont capturées sur la capacité de survie des passagers aériens, ce qui empêche les analystes du NTSB de mener des recherches approfondies sur la façon de rendre les avions plus sûrs pour les passagers lors d'accidents. Inversement, si des données limitées sont recueillies sur les causes des accidents de la route, les chercheurs en sécurité routière pourraient se retrouver avec une mauvaise compréhension de la façon de prévenir les accidents de la route.

Données de sécurité et sécurité des données

La superposition de tous ces problèmes de données de transport aujourd'hui consiste à trouver un équilibre entre le besoin de données de sécurité et la sécurité des données. Il existe actuellement une pénurie de données sur la sécurité des transports disponibles, en particulier de manière consolidée, sur les coûts, les incidents et les infrastructures critiques. Avant septembre 2001, les préoccupations en matière de sécurité concernant les infrastructures de transport se concentraient sur les déploiements militaires, c'est-à-dire de s'assurer que les routes pour acheminer le personnel militaire et les fournitures vers des destinations à l'étranger étaient maintenues ouvertes. Désormais, les problèmes de sécurité sont centrés sur les perturbations potentielles des infrastructures et les impacts sur le bien-être physique et économique du pays. Cette nouvelle orientation nécessite des informations plus complètes sur les itinéraires de transport, la capacité du système et les vulnérabilités.

Pendant ce temps, les inquiétudes concernant les utilisations potentiellement dommageables des données ont conduit à des restrictions, à des fins de sécurité, sur la divulgation des données. Les données sur les infrastructures de transport, en particulier les informations géographiques, ne sont plus aussi facilement accessibles qu'elles l'étaient autrefois. Après septembre 2001, la Maison Blanche a publié une note demandant aux agences fédérales d'examiner les informations qu'elles mettent à disposition sur Internet pour protéger les données potentiellement sensibles. Plus généralement, les agences suivent désormais les directives du ministère de la Justice lors de l'examen des demandes en vertu de la Freedom of Information Act.

BTS : un leader dans les statistiques de transport

Le rôle principal de BTS, tel qu'exprimé dans son énoncé de mission, est « ... 2 La législation accordait au BTS un rôle de chef de file dans le domaine des statistiques des transports, mais pas l'autorité sur les programmes de données d'autres administrations des transports. Alors que BTS consacre près de la moitié de son budget à la collecte de données, la majeure partie des données sur les transports est collectée par d'autres administrations du DOT, des agences fédérales et des entités non fédérales, publiques et privées. Ainsi, le BTS joue un rôle de coordination, aidant à surmonter les complexités de l'intégration entre les niveaux (par exemple, local, national et international) et les types de données et de données qui recoupent les modes.

Coordination des systèmes de données

Étant donné la nature décentralisée inhérente au système national de données sur les transports, une plus grande coordination entre les utilisateurs et les collecteurs de données est nécessaire. Le BTS et les autres agences fédérales doivent jouer un rôle de premier plan en veillant à ce que les données recueillies par les agences étatiques et locales utilisent des définitions nationales comparables.

Au cours des dernières années, le BTS a assumé un certain nombre de fonctions visant à la coordination, notamment : le développement de TransStats, la base de données sur le transport intermodal les systèmes d'information géographique (SIG) pour les transports et la Safety Data Initiative. En outre, pour améliorer la coordination et le flux de données et d'informations entre les producteurs et les utilisateurs de données, BTS gère la Bibliothèque nationale des transports (NTL).

TranStats, la base de données sur le transport intermodal. TranStats est un portail basé sur un réseau vers la richesse des données liées au transport collectées par le DOT ainsi que d'autres en dehors du DOT. L'objectif est un guichet unique pour les données de transport et, en fin de compte, en conjonction avec le NTL, un guichet unique pour toutes les informations nécessaires pour effectuer des recherches sur les transports. Le principe est assez simple. En réduisant le temps global nécessaire à la collecte de données, plus de temps est disponible pour l'analyse, et en fournissant des liens faciles entre les ensembles de données, de nouvelles informations sont facilitées. Le fait de disposer de toutes les données au même endroit offre également des avantages (et des défis) secondaires. Il expose potentiellement des divergences dans les définitions, des différences dans les schémas et des lacunes dans les données, offrant de nouvelles opportunités pour améliorer la qualité, la comparabilité et la couverture des données. Il offre également la possibilité de développer plus facilement des normes de présentation et de documentation, afin de rendre les données de transport plus utilisables.

La caractéristique la plus marquante de TranStats est la portée de ses données. BTS prévoit d'inclure à terme tous les principaux ensembles de données au sein du DOT, ainsi qu'une variété de données démographiques, économiques et sociales, pour permettre des analyses de grande envergure. TranStats contiendra également de puissants outils Web pour examiner les données, y compris la possibilité de construire des tableaux, des graphiques et des cartes et d'effectuer des téléchargements sélectifs.

Systèmes d'information géographique. En raison de la nature spatiale du transport, les affichages géographiques sont un moyen idéal pour analyser les données de voyage et peuvent présenter des images convaincantes pour les décideurs. BTS crée, maintient et distribue des données géospatiales via le programme National Transportation Atlas Database. Ces données sont obtenues à partir de plusieurs sources et comprennent le réseau national de planification routière, un réseau ferroviaire national, des aéroports et des pistes à usage public et des gares Amtrak. Dans un avenir proche, des couches seront ajoutées pour l'utilisation des terres, les voies navigables et le transport en commun. Ensemble, les données constituent la couche de transport de l'infrastructure nationale de données spatiales. BTS distribue des géodonnées de transport et a. nombre de fichiers de référence géographique, y compris les limites des États, des comtés, des districts du Congrès et des régions statistiques métropolitaines.

Pour coordonner le développement des données, des normes et des outils SIG au sein du DOT, BTS a créé un groupe de travail sur l'information géographique. BTS travaille également en partenariat avec d'autres agences fédérales pour partager des données géospatiales sur Internet et intègre des systèmes d'information géographique dans la conception de TranStats pour fournir une cartographie dynamique des informations statistiques.

Initiative sur les données de sécurité. BTS était l'agence principale dans un effort à l'échelle du DOT pour améliorer les données de sécurité. Quatre groupes de travail ont été établis avec des membres de l'équipe de tous les modes de transport (c. Les groupes de travail ont élaboré des plans pour 10 projets de recherche.

Bibliothèque nationale des transports. BTS gère une bibliothèque électronique « virtuelle », la NTL, accessible via Internet. La bibliothèque offre un large accès à la documentation nationale sur la recherche et la planification des transports. Actuellement, NTL contient plus de 150 000 documents et résumés pour un autre demi-million. NTL gère également le moteur de recherche DOTBOT, indexant les documents de 170 sites Web DOT. Grâce à son partenariat avec le Transportation Research Board, NTL donne accès à plus de 420 000 notices bibliographiques dans la base de données en ligne des Transportation Research Information Services (TRIS).

Collecte de données

Comme cela a été mentionné, de bonnes données sont nécessaires pour une prise de décision efficace en matière de transport à tous les niveaux de la société. Les données sur les mouvements de marchandises et de passagers par mode, par exemple, permettent aux décideurs d'estimer les besoins d'investissement, de suivre les tendances économiques et d'évaluer la santé financière et la performance du système de transport.

Le BTS est responsable de plusieurs ensembles de données au niveau national. L'Enquête nationale sur les déplacements des ménages (NHTS) est menée pour 2001-2002 en partenariat avec la Federal Highway Administration. L'enquête sur les flux de marchandises de 2002 est réalisée en partenariat avec le Census Bureau, à la suite des données du SCF produites pour 1993 et ​​1997. Pour améliorer les données sur le fret, le BTS a envisagé une enquête annuelle sur le fret, qui fournirait des flux de marchandises OD plus opportuns, plus complets et plus détaillés. données et d'autres types de données sur le volume du trafic de fret et les coûts d'expédition. Cette nouvelle enquête inclurait les secteurs maintenant exclus de l'EFC et fournirait des données plus détaillées à l'échelle métropolitaine que celles actuellement disponibles. Dans un premier temps, l'agence a demandé au Transportation Research Board de mener une étude de 12 mois, « Données sur le transport de marchandises : un cadre pour le développement », afin d'offrir des conseils d'experts sur l'élaboration de la nouvelle enquête.

Au niveau international, le BTS compile, analyse et diffuse des données mensuelles sur les flux commerciaux terrestres en Amérique du Nord, qui sont collectées par le U.S. Customs Service et traitées par le Census Bureau. Ces données fournissent des informations sur le type de produit par mode de transport de surface (rail, camion, pipeline, courrier et autres). En outre, ils comprennent des détails géographiques pour les exportations américaines vers et les importations en provenance du Canada et du Mexique. Les informations sont utilisées pour surveiller les changements de flux de marchandises dans le cadre de l'Accord de libre-échange nord-américain, ainsi que pour les études sur les corridors commerciaux, la planification des infrastructures de transport, les analyses de marketing et de logistique, et à d'autres fins. De même, le BTS compile, analyse et diffuse les données mensuelles sur le passage des frontières et l'entrée des passagers collectées par le service des douanes. Ces données fournissent des informations sur le nombre de passagers et de véhicules entrant aux États-Unis par les frontières nord et sud.

Pour les voyages de passagers aériens et les mouvements de fret, BTS (par l'intermédiaire de son Office of Airline Information) collecte et publie des données mensuelles sur les compagnies aériennes à temps, ainsi que des données d'exploitation mensuelles plus complètes pour les compagnies aériennes nationales et étrangères. BTS collecte également des statistiques financières détaillées pour les compagnies aériennes nationales et diverses statistiques sur la qualité de service. La déclaration des données est rendue obligatoire par la loi, et plusieurs problèmes entraînent actuellement des changements dans la réglementation en matière de déclaration. Avant septembre 2001, les inquiétudes du public concernant les retards des compagnies aériennes ont conduit à une législation exigeant de meilleures données sur les causes des retards, et à la mi-2002, BTS en était aux dernières étapes de l'élaboration de règles sur la collecte de données qui couvriraient les informations causales. BTS travaille également depuis un certain temps à moderniser le programme de collecte de données, en le mettant à jour avec les changements survenus dans l'industrie du transport aérien et avec les progrès des technologies de l'information.

Les données des compagnies aériennes collectées et compilées par BTS comprennent :

  • Statistiques financières des transporteurs aériens américains (trimestriels et annuels)
  • Statistiques du trafic des transporteurs aériens américains (mensuelles, trimestrielles et annuelles)
  • Données sur l'origine, la destination, l'itinéraire et le prix des billets des transporteurs aériens américains (mensuelles, trimestrielles et annuelles
  • statistiques du trafic des transporteurs aériens étrangers (mensuel)
  • Statistiques sur l'activité des aéroports américains (trimestriels et annuels) et
  • Données sur la ponctualité et les retards de vol des principaux transporteurs aériens américains (mensuels).

BTS a soutenu le bureau du secrétaire du DOT dans son examen des demandes et des décisions concernant les paiements aux transporteurs aériens en vertu de la loi sur la sécurité du transport aérien et la stabilisation du système, promulguée après les attentats terroristes du 11 septembre 2001, pour aider l'industrie du transport aérien. Le support BTS comprenait le traitement des données, l'examen des réclamations et la validation et l'analyse des données. Au milieu de 2002, le DOT avait autorisé le paiement de près de 4,3 milliards de dollars aux transporteurs aériens.

BTS, par l'intermédiaire de son Office of Motor Carrier Information, gère un programme obligatoire de collecte de données de statistiques financières et d'exploitation. 3 Toutes les entreprises de camionnage dont les revenus d'exploitation annuels bruts sont de 3 millions de dollars ou plus sont tenues de déposer des rapports annuels, et celles dont les revenus d'exploitation sont de 10 millions de dollars ou plus sont également tenues de déposer des rapports trimestriels. De plus, toutes les compagnies d'autobus ayant des revenus bruts d'exploitation de 5 millions de dollars ou plus sont tenues de déposer des rapports annuels. Les types de données recueillies auprès des entreprises de camionnage comprennent :

  • nom de l'entreprise et numéros d'identification des transporteurs routiers
  • segment de l'entreprise de l'industrie du camionnage (« groupe de produits à revenu »)
  • revenus annuels, dépenses et revenu net
  • salaire annuel des chauffeurs et aides
  • milles annuels parcourus, nombre total d'expéditions et tonnes-milles et
  • le nombre de conducteurs avec et sans permis commerciaux employés et le nombre de camions et de camions-tracteurs que l'entreprise exploite (en propriété ou en location), à la fin de l'année de déclaration.

Ces données sont largement utilisées dans les secteurs privé et public par les transporteurs routiers pour l'analyse comparative et les analyses concurrentielles, les universitaires pour les analyses savantes et pour former les futurs cadres de l'industrie du camionnage, les cabinets d'avocats pour les témoignages d'experts dans les affaires judiciaires, les agences gouvernementales fédérales et étatiques pour les études de la l'industrie du camionnage, les sociétés de conseil et les revues spécialisées et autres publications pour afficher les classements et les informations commerciales des entreprises de camionnage individuelles. BTS prévoit de rendre les données des rapports annuels (1999 et suivantes) disponibles par voie électronique via TranStats. Les utilisateurs de données seront alors en mesure d'extraire les données dont ils ont besoin par entreprise individuelle et par segment d'industrie ou d'accéder à l'intégralité de la série de données annuelles pour analyse à l'aide d'un logiciel d'analyse statistique.

Le mensuel Sondage général est coordonné par BTS pour les bureaux du DOT, permettant la collecte de données sur le système de transport, comment il est utilisé et comment les utilisateurs le voient. L'enquête fournit des données opportunes et de haute qualité sur des questions liées à la sûreté, la sécurité, la mobilité et l'accès, l'environnement humain et naturel et la croissance économique pour soutenir une planification et une prise de décision éclairées. En plus des questions de base mensuelles couvrant les objectifs stratégiques du DOT, les administrations peuvent ajouter des questions à l'enquête. Ces questions couvrent généralement des événements spécifiques ou des problèmes d'intérêt pour les différentes administrations du DOT ou mesurent la réaction du public à des problèmes tels que les prix fluctuants du carburant, l'utilisation de la ceinture de sécurité, le service aérien ou la sécurité nautique. En plus de Sondage omnibus, BTS mène occasionnellement des enquêtes sur des sujets spéciaux. Par exemple, après les attentats terroristes de septembre 2001, BTS a mené une enquête pour évaluer les intentions du public de voyager pendant les vacances et leurs choix de modes attendus et, au début de 2002, a sondé les points de vue du public sur les efforts du gouvernement pour améliorer la sécurité des transports.

Compilation, analyse et diffusion

BTS compile de nombreuses données provenant de diverses sources dans des collections pertinentes pour les décideurs et autres utilisateurs de données sur les transports. Ces compilations vont d'ensembles de tableaux de données à des présentations de données avec des analyses, et comprennent :

  • Rapport annuel sur les statistiques des transports, préparé dans le cadre du mandat législatif du BTS, couvre près de 100 sujets de transport, analysant les données de séries chronologiques et les développements récents.
  • Indicateurs de transport, disponible mensuellement sur le site du BTS, 4 pistes sur 130 indicateurs.
  • Statistiques nationales des transports, une publication annuelle avec plus de 250 tableaux de données, est organisée en quatre grandes catégories (c'est-à-dire système, sécurité, économie et énergie/environnement) et est disponible en version papier et sur le site Web du BTS.
  • Guide de poche des transports, un livret annuel de poche contenant des données clés sur les transports présentées sous forme de tableaux et de figures.
  • Tendances du commerce et des voyages en Amérique du Nord (2001), une présentation de données et d'analyses sur les tendances récentes du commerce américain et des voyages de passagers avec le Canada et le Mexique.
  • Tendances des voyages et des transports internationaux aux États-Unis (2002), un aperçu des tendances des voyages internationaux et régionaux aux États-Unis entre 1990 et 2000, ainsi que des changements importants dans les voyages en avion depuis septembre 2001.
  • Commerce et transport maritimes (2002), une vue d'ensemble avec des données et une analyse des questions maritimes.
  • Profils de transport d'État, présentations de données de transport d'État individuelles provenant de sources de données fédérales et d'autres sources nationales. La première édition de cette série, couvrant les 50 États et le District de Columbia, sera publiée en 2002 et 2003.
  • Statistiques financières des transports publics (2002), une analyse des tendances des recettes et des dépenses de transport fédérales, étatiques et locales est disponible sur le site Web du BTS.

En plus de l'analyse menée pour ces publications et d'autres BTS, l'agence est engagée dans un certain nombre d'études ciblées sur les transports. Il s'agit notamment d'études sur les principaux indicateurs de transport, les mesures de la productivité dans divers secteurs des transports et la disponibilité du transport en commun. BTS travaille également à développer des mesures d'étalement, ainsi que des mesures pour les objectifs de résultat stratégique du DOT. Ces dernières mesures couvrent, entre autres, les décès et les blessures liés au transport, l'accès aux systèmes de transport pour les utilisateurs individuels, les coûts et les temps de déplacement, la position concurrentielle internationale des États-Unis dans les biens et services de transport et la dépendance des transports à l'égard des approvisionnements en carburant étrangers.

BTS et le Bureau of Economic Analysis (BEA) du département américain du Commerce ont développé des comptes satellites des transports (TSA), qui fournissent des informations détaillées sur la contribution des transports au produit intérieur brut (PIB). Une caractéristique clé est l'estimation de la valeur ajoutée à l'économie par le secteur du transport interne (transport effectué par des entreprises du secteur hors transport de l'économie, comme les camions possédés et exploités par les chaînes d'épicerie). Avant l'élaboration des CUT, des estimations fiables de cette valeur ajoutée n'étaient pas disponibles. BTS et BEA ont également développé une méthode de comptabilisation du stock de capital pour mesurer la valeur de l'infrastructure de transport du pays, comme le prescrit la Transportation Equity Act for the 21st Century (TEA-21.)

Combler les lacunes dans les données

Les lacunes dans les données peuvent impliquer l'absence de données, des données de mauvaise qualité ou des données collectées mais non fournies en temps opportun ou sous une forme utilisable par un décideur. Par exemple, une lacune majeure connue dans les données est l'absence de bonnes données O-D intérieures couvrant le trafic circulant dans le commerce international. En 2001 et 2002, BTS a évalué de manière exhaustive les lacunes dans les données de transport ainsi que les avantages et les coûts des solutions possibles. Ce projet a été mené en consultation avec les principales parties prenantes, y compris celles du DOT et parmi le personnel du Congrès, les DOT des États, les organisations de planification métropolitaine, l'industrie des transports et les organismes de recherche.

Des solutions à plusieurs problèmes de données critiques sont en cours de planification ou en cours dans BTS. Des enquêtes sur les déplacements à vélo et à pied et sur les personnes handicapées fourniront des informations sur les groupes démographiques pour lesquels peu de données ont été recueillies dans le passé. L'enquête américaine sur le fret prévue comblera les lacunes dans la couverture pour fournir des données sur les flux de fret qui n'ont pas été saisies dans les enquêtes précédentes. Il collectera des informations sur les coûts et les temps de déplacement afin d'identifier les goulots d'étranglement vitaux dans le cadre de la compétitivité nationale et sur la conteneurisation utile à des fins de sécurité. L'Enquête nationale sur les déplacements des ménages fournira des données améliorées sur les déplacements de 50 à 100 milles. La mise en œuvre des recommandations de la Safety Data Initiative réorganisera les systèmes de données de sécurité afin de réduire la redondance et d'améliorer la qualité et la rapidité d'exécution. Cela se traduira par une déclaration uniforme des données sur les décès et les accidents et permettra la comparabilité entre les modes de transport.

Cependant, d'autres lacunes existent et des solutions doivent encore être conçues. Il reste une image incomplète du transport des matières dangereuses en raison du manque de données identifiant les expéditeurs, les transporteurs et la main-d'œuvre du transport impliquée dans l'industrie. Il faut également de meilleures données sur l'évolution rapide des besoins de transport des industries de services et les effets du commerce électronique sur les systèmes de livraison juste à temps sur ces secteurs et d'autres de l'économie génératrice de fret. Il existe peu de données sur les caractéristiques de déplacement des personnes pratiquant la navigation de plaisance. Le nombre, les caractéristiques et leur contribution aux flux de circulation sont inconnus pour certains types de véhicules à moteur tels que ceux qui fournissent des services municipaux, par exemple, les ambulances, les camions à ordures municipaux et les parcs automobiles gouvernementaux. Les heures de travail de la main-d'œuvre des transports ne sont pas saisies pour tous les segments de l'industrie des transports, ce qui rend difficile la réalisation d'analyses des problèmes économiques ou des problèmes de sécurité, comme la fatigue. Ces lacunes, ainsi que plusieurs autres, seront comblées dans le Données Rapport final sur les lacunes devrait être achevé en 2003.

Assurer la qualité des données, les bonnes pratiques statistiques et la mesure des résultats

La législation exige que le BTS publie des directives pour la collecte de données DOT afin de garantir que les données de transport sont exactes, fiables, pertinentes et sous une forme permettant une analyse systématique.En outre, le Bureau de la gestion et du budget a imposé en 2001 aux agences d'élaborer des directives sur la qualité de l'information. En tant que participant actif au groupe de travail du Conseil interagences pour la politique statistique, BTS a le rôle principal dans l'élaboration de ces directives pour l'ensemble du DOT.

Dans le cadre de ces responsabilités, BTS a développé la partie des nouvelles directives d'information du DOT qui couvre les informations statistiques. Ces lignes directrices s'appliquaient à l'ensemble du DOT à compter du 1er octobre 2002. De plus, BTS utilisera les lignes directrices comme base pour une analyse plus complète Guide de bonnes pratiques statistiques. Ce guide sera un manuel pour les gestionnaires et analystes de programmes de données sur les transports sur tous les aspects de la qualité des données, y compris la planification, la collecte, le traitement, l'analyse, l'interprétation, la diffusion et l'évaluation des systèmes de données.

BTS a également un projet d'évaluation de la qualité des données en cours. En 2001, l'agence a évalué 5 systèmes de données du DOT (conjointement avec le Plan d'action sur les données de sécurité) et prévoit d'en évaluer 10 autres en 2002. Les bases de données examinées en 2001 comprenaient les incidents liés aux matières dangereuses et les mesures d'application, les voyages des passagers aériens, la sûreté et la sécurité des transports en commun. , et la sécurité aérienne. En outre, BTS a aidé le bureau du secrétaire aux transports dans un examen des données soumises par les transporteurs aériens pour étayer les demandes d'indemnisation après la fermeture du système de la circulation aérienne le 11 septembre.

Conformément à la loi sur la performance et les résultats du gouvernement, le DOT maintient un système de mesure de la performance. BTS fournit un support technique pour le développement de mesures de performance, l'analyse des données de performance et l'évaluation de la fiabilité. Dans le cadre de ce travail, le BTS développe des plans de vérification et de validation et se coordonne avec les agences du DOT pour développer des « détails des données » qui décrivent la portée et les limites des éléments de données.

L'avenir

Dans la vision du futur de BTS, des données et des informations de haute qualité soutiendront toutes les décisions importantes en matière de politique de transport, faisant ainsi progresser la qualité de vie et le bien-être économique de tous les Américains. BTS prévoit d'être au centre de cette vision, de développer ses capacités de telle sorte que les gens viendront à BTS avant de commencer un effort de planification ou une étude de politique de transport, car le Bureau dispose de bonnes données et des informations dont ils ont besoin.

Pour être ce point focal, BTS disposera de données prêtes pour chaque analyse politique importante. BTS sera agile, garantissant que les données couvrent les tendances émergentes dans les transports. Les données seront bonnes, propres et opportunes. Les données seront également faciles à obtenir et à utiliser et seront complétées par une analyse. BTS y parviendra, non pas seul, mais en tant que membre d'une équipe ou d'un réseau de collecteurs et de fournisseurs de données, à la fois publics et privés.

Essentiellement, l'objectif du BTS est d'améliorer les transports afin d'améliorer les objectifs stratégiques du DOT : sécurité, sûreté, mobilité, croissance économique et environnement humain et naturel.

Notes de bas de page

1 Cette pensée rappelle le travail de Bacon, Sur la science expérimentale, publié en 1268.

2 U.S. Department of Transportation, Bureau of Transportation Statistics, « A Strategic Plan for Transportation Statistics (2000-2005) », mars 2000, disponible sur http://www.bts.gov, en mai 2002.

3 49 CFR 1420. L'Interstate Commerce Commission a collecté des données statistiques financières et d'exploitation depuis l'entrée en vigueur de la Motor Carrier Act de 1935 jusqu'en 1994, date à laquelle BTS a pris en charge la collecte des données.


Certificat en Systèmes d'Information Géographique

Le programme de certificat en systèmes d'information géographique est délivré par le Metropolitan Community College, mais coordonné au JCCC.

Il s'agit d'un certificat professionnel qui donne à l'utilisateur du SIG les outils nécessaires pour attirer un bon emploi dans le domaine passionnant du SIG ou pour progresser dans le domaine de son choix. Il prépare également les étudiants à obtenir leur diplôme AA ou à être transférés dans un établissement de quatre ans. Les professionnels du SIG se trouvent dans les domaines des affaires des villes, des comtés et de l'État, de l'économie, des ressources naturelles, de la conservation, de la pollution, de l'industrie, des sciences, des planificateurs d'infrastructures, des travaux publics, des transports, des architectes, de l'éducation, des soins de santé, des voyages, de l'industrie spatiale.

Le programme de systèmes d'information géographique JCCC est offert aux résidents du comté de Johnson en coopération avec les Metropolitan Community Colleges de Kansas City. Des cours connexes sont suivis au JCCC. Vous devez être accepté en tant qu'étudiant au JCCC et accepté dans le programme par le MCC. Les étudiants doivent être résidents du comté de Johnson pour bénéficier des frais de scolarité de l'État. Consultez un conseiller JCCC pour plus d'informations.

Les cours du programme et les heures de crédit sont sujets à changement en raison des changements d'exigences dans l'établissement qui décerne le diplôme. Contactez www.mcckc.edu. Les cours de SIG requis sont enseignés dans les collèges communautaires MCC-Longview et MCC-Maple Woods en début de soirée. Visitez http://mcckc.edu/

Remarque : les étudiants du Johnson County Community College doivent demander conseil au personnel du programme MCC pour connaître le plan de cours et les numéros appropriés.

Les étudiants du Johnson County Community College doivent se référer aux informations sur le programme coopératif.


III. Mise en service et test

Une fois le montage et le câblage des composants du système du bâtiment terminés, le(s) contrôleur(s) 114 du système de construction 112 recherche et demande automatiquement l'association des composants sélectionnés avec l'outil IAC 102 (décrit plus en détail ci-dessous). Une méthode 1D pour la mise en service et le test des composants sélectionnés est illustré à la Fig. 1D. Cela peut être accompli en utilisant soit un protocole de découverte de service Web, soit en préconfigurant le contrôleur 114 avec l'adresse Web du référentiel distant et du moteur de traitement. A réception de la demande d'association du responsable du traitement 114, comme indiqué dans les encadrés 142 et 143, l'outil IAC 102 relie le responsable du traitement au compte client et au site correspondants. La liaison du contrôleur au compte client correspondant peut être basée soit sur un identifiant de contrôleur, l'identifiant de site reçu dans le cadre de la demande d'association, l'association du numéro de série du contrôleur au compte client par saisie manuelle, ou par l'utilisation d'un scan outil. Comme indiqué dans la boîte 144, l'outil IAC 102 serait alors en mesure de télécharger les emplacements de montage et les informations de configuration associées, qui ont été enregistrées lors de la phase de planification et de devis, vers le contrôleur. Dans un autre mode de réalisation, le dispositif mobile récupère les informations de configuration et l'adresse du contrôleur à partir du référentiel distant, puis se connecte directement au contrôleur sur le site pour télécharger la configuration de la tablette vers le contrôleur. L'outil IAC 102 permettrait également à un technicien de mise en service, qui peut être une personne distincte de l'installateur, d'utiliser l'appareil mobile pour ajouter, modifier et mettre à jour les informations de configuration lors de la mise en service du système sur le site, comme indiqué dans l'encadré 146. Le technicien utilise ensuite l'appareil mobile pour tester et vérifier le fonctionnement des différents composants, comme indiqué dans la boîte 148. Cela peut être fait en envoyant des commandes de test et en recevant des messages de test de l'appareil mobile au contrôleur directement ou via l'outil IAC 102. L'appareil mobile garde également une trace de l'état des tâches impliquées dans la phase de mise en service et de test du processus.

Après l'achèvement des trois étapes du processus, les contrôleurs installés dans le système du bâtiment restent associés à l'outil IAC 102 et envoyer des informations de diagnostic périodiques, par exemple la qualité de la liaison de communication locale entre les composants, l'état de la batterie, etc., pour aider à la maintenance du système. L'outil IAC 102 permet également à un technicien de maintenance de visualiser le système complet ainsi que la disposition du déploiement, la configuration et les modifications apportées à la configuration à distance lorsque cela est nécessaire pour résoudre les problèmes liés au système.

Lors de l'exécution d'installations ultérieures sur le même site, les techniciens de vente et d'installation peuvent réutiliser les informations du bâtiment en se connectant à l'outil IAC 102 et récupérer les informations relatives au compte client. L'outil IAC 102 permet d'ajouter de nouveaux composants à la conception du système existant, d'ajouter une configuration pour de nouveaux composants, de mettre à jour la configuration d'un composant existant, si nécessaire, et d'exécuter les étapes restantes du processus IAC pour les nouveaux composants comme décrit ci-dessus. L'outil IAC 102 permet également à un vendeur d'un revendeur ou d'une organisation VAR d'anonymiser les informations du bâtiment pour ses clients et de les utiliser pour solliciter des devis auprès d'autres organisations tierces pour les produits de système de construction non vendus par son organisation. Les commerciaux d'une autre organisation tierce peuvent utiliser un appareil mobile connecté à l'outil IAC 102 pour passer en revue et soumissionner sur le travail demandé. L'outil IAC 102 permet également de rechercher dans la base de données d'informations sur le bâtiment des bâtiments et/ou des clients avec des attributs spécifiques tels que la localité, la superficie du bâtiment, le nombre de pièces, la présence d'un garage ou d'un sous-sol, etc.

Comme indiqué ci-dessus, le système 500 et méthode 502, représenté schématiquement à la Fig. 5A, fournir des outils qui utilisent une interface utilisateur basée sur un plan d'étage sur un appareil mobile 504 comme une tablette, pour découvrir, localiser, autoriser, vérifier et enregistrer des appareils distribués 506 avec un panneau de commande système 508. Appareils exemplaires 506 comprennent des capteurs de mouvement, des caméras, des serrures, etc. Les outils décrits ici peuvent permettre une flexibilité totale en termes de séquence dans laquelle les dispositifs 506 sont installés et mis sous tension, et l'ordre dans lequel les étapes du procédé 502 sont effectuées. L'ordre des opérations dans la méthode 502 comme le montre la fig. 5A n'est qu'un exemple. L'homme de l'art comprendra aisément que tout autre ordre approprié peut également être utilisé. Wi-Fi, ZigBee, Z-Wave ou tout autre protocole approprié, filaire ou sans fil, propriétaire ou non, peut être utilisé pour la communication entre les appareils 506 et panneau 508, comme indiqué sur la Fig. 5A.

Méthode 502 comprend la découverte d'une pluralité de dispositifs 506 au panneau central ou au serveur 508, comme indiqué par la case 510. Cela permet au panneau de commande du système 508 pour découvrir les appareils distribués 506 Sur le terrain. Dans les scénarios où les appareils distribués 506 sont installés et mis sous tension avant le panneau de commande du système 508, les appareils peuvent diffuser une demande d'adhésion, qui comprend l'identifiant unique (ID) de l'appareil et la description de son profil d'exploitation (comme le type d'appareil, le type de profil d'application, les entrées d'application, les sorties d'application, les types de contenu autorisés et les formats de requête, et le comme), périodiquement jusqu'à ce qu'une réponse soit fournie. Tous les appareils alimentés par batterie parmi les appareils 506 peut économiser l'énergie de la batterie en dormant entre les demandes périodiques. Le taux de demande périodique peut être ajusté par les appareils 506 en fonction de la capacité de la batterie disponible et du nombre de tentatives d'enregistrement.

Comme le montre la Fig. 5B, le panneau de commande du système 508 passe en mode d'écoute immédiatement après son installation et sa mise sous tension. À la réception de la demande d'adhésion d'un appareil 506, panneau 508 recherche l'appareil dans sa table d'appareils 520, dont un exemple est représenté sur la Fig. 5C, pour voir si le drapeau d'autorisation 522 pour l'appareil 506 est cochée ou non. Si l'appareil 506 est autorisé, le panneau répond au dispositif avec un message de poursuite de l'adhésion ou d'autorisation accordée, qui comprend l'identifiant unique (ID) du panneau. Si l'appareil n'est pas trouvé dans le tableau des appareils, le panneau 508 crée une entrée pour le périphérique avec l'indicateur d'autorisation désactivé. Si l'appareil 506 n'est pas autorisé, la centrale répond à l'appareil avec un message d'autorisation en attente ou un message de rejet de la jointure.

A la réception du message d'attente d'autorisation, l'appareil 506 peut soit continuer à diffuser périodiquement la demande d'adhésion, pour voir si d'autres panneaux répondent, soit commencer à envoyer des messages d'enregistrement en monodiffusion au panneau 508 en attendant l'autorisation. Dans certains modes de réalisation, le dispositif de jonction 506 peut ne pas avoir besoin d'envoyer une demande d'adhésion spéciale. Tout message (avec ID unique de l'appareil) reçu d'un nouvel appareil 506 pour la première fois peut être considérée comme une demande d'adhésion par le panel 508. Si l'appareil 506 n'est pas autorisé, le panneau 508 ignore simplement tous les messages ultérieurs de l'appareil 506 jusqu'à ce qu'il soit autorisé. Dans un autre mode de réalisation, lorsque le dispositif 506 reçoit le message d'autorisation en attente de l'appareil 506 passe en mode faible consommation et attend un déclencheur externe (par exemple, un bouton enfoncé, une remise sous tension) pour redémarrer le processus d'enregistrement.

Dans un autre aspect, la méthode 500 peut inclure la comparaison d'un identifiant de périphérique dans chaque demande de jointure avec une table de périphériques 520 du panneau et l'envoi de procéder à joindre les signaux uniquement aux appareils 506 qui sont marqués comme autorisés dans le tableau des appareils 520. La table 520 avec des identifiants d'appareil peuvent être créés par le panneau 508 dès qu'il commence à recevoir des demandes d'adhésion ou peut être pré-téléchargé sur le panneau 508 via un appareil mobile 504 ou serveur, par exemple. Il convient de noter qu'un message de poursuite de l'adhésion dans certains cas peut ne pas être envoyé ou peut ne pas avoir besoin d'être envoyé car certains périphériques sont unidirectionnels.

Méthode 502 comprend également la localisation des appareils 506 comme indiqué par la case 512. Afin de localiser les appareils distribués 506 les uns par rapport aux autres dans un bâtiment, une application dans un appareil mobile 504 utilise le dessin du plan d'étage du bâtiment comme base. Le plan d'étage 524, représenté sur la Fig. 5A, peut être rendu à l'échelle sur un écran tactile de tablette, par exemple. Cela permet de déterminer les coordonnées pour n'importe quel point donné sur le plan d'étage 524. Le plan d'étage 524 peut être divisé en zones physiques distinctes (telles que des pièces ou des espaces ouverts) avec des balises d'emplacement uniques pour chaque zone (par exemple, la chambre principale, la salle à manger, le salon, etc.). Chacune des zones peut être encore divisée, par exemple, en huit octants, qui sont identifiés par les huit directions représentées sur la Fig. 5D. L'application sur mobile 504 permet à un installateur de planifier l'installation d'un système en ajoutant des icônes pour des appareils de différents types (identifiés par son unité de stockage (SKU), par exemple) sur le plan d'étage 524 puis faire glisser et déposer les appareils 506 aux emplacements sur le plan d'étage 524 où ils doivent être installés dans le bâtiment. Toute autre technique d'entrée appropriée peut également être utilisée.

À titre d'exemple, un installateur peut se rendre un par un aux endroits où les appareils 506 doivent être installés identifier les emplacements sur le plan d'étage 524 sur l'application de l'appareil mobile et scannez le code-barres, le code QR, la RFID ou autre sur l'appareil 506 en appuyant sur l'icône de l'appareil sur l'écran de l'appareil mobile 504, tout en pointant une caméra d'un appareil mobile 504 vers le code à barres, ou similaire, sur l'appareil 506, comme représenté schématiquement à la fig. 5E. La saisie manuelle du code est également envisagée. Cela permet à l'application d'apprendre simultanément l'identifiant de l'appareil et de localiser l'appareil 506 via un seul robinet sur le plan d'étage 524. Le code à barres, ou similaire, fournit l'identifiant unique de l'appareil qui est inclus par l'appareil 506 dans les messages de demande de jointure. En option, le code pourrait également fournir la clé de cryptage par défaut codée (à décoder par l'application de l'appareil mobile, pour authentifier les messages de l'appareil 506), le type d'appareil et les spécifications de l'appareil.

L'application pour appareil mobile reconnaît l'emplacement sur le plan d'étage 524 où l'installateur a tapé pour déterminer les coordonnées de l'emplacement correspondant sur le plan d'étage 524, et identifie également la zone et l'octant entourant les coordonnées. L'application de dispositif mobile associe ensuite les informations de localisation susmentionnées à l'identifiant de dispositif et aux autres informations de dispositif facultatives lues à partir du code. Les emplacements des appareils peuvent être représentés par les coordonnées des emplacements indiqués sur le plan d'étage 524. L'application de l'appareil mobile peut générer une erreur si le type d'appareil du code scanné ne correspond pas au type d'appareil de l'icône tapée sur le plan d'étage. L'application crée également un nom unique pour l'appareil numérisé en concaténant les champs d'informations suivants : <Zone Location Tag><Closest Direction><Device Type>, par exemple, Kitchen NE Motion. L'application crée ensuite une entrée pour le périphérique nouvellement analysé et localisé 506 dans la table des appareils 520 stocké sur l'appareil mobile 504, avec les champs pertinents renseignés, comme le montre la FIG. 5C.

Dans un autre mode de réalisation, l'application peut permettre à un installateur de scanner plusieurs appareils 506 avec des codes QR, ou similaires, successivement ou simultanément. L'application trie ensuite les informations sur l'appareil dans l'ordre croissant ou décroissant du champ d'identification de l'appareil et attribue automatiquement les informations sur l'appareil aux icônes d'appareil prévues sur le plan d'étage 524 dans le sens des aiguilles d'une montre, par exemple, à partir de la porte d'entrée tout en faisant correspondre le type d'appareil du code scanné au type d'appareil de l'icône sur le plan d'étage 524. Cela permet à un installateur d'apprendre les appareils hors site, par exemple, dans un back-office, avant d'arriver sur le site. Par exemple, si un salon dispose de deux contacts de porte/fenêtre et d'un capteur de mouvement, les trois capteurs peuvent être scannés simultanément en appuyant sur le salon affiché sur l'appareil mobile 504. L'application peut alors démarrer avec l'icône de l'appareil la plus proche de l'entrée du salon, par exemple un capteur de contact de porte, et lui attribuer le plus petit ID d'appareil avec le type d'appareil comme contact de porte/fenêtre. Ensuite, il peut se déplacer dans le sens des aiguilles d'une montre, par exemple, dans le salon pour trouver l'icône d'appareil la plus proche, par exemple un capteur de mouvement, et lui attribue le plus petit ID d'appareil avec le type d'appareil comme capteur de mouvement. L'application peut continuer à se déplacer dans le sens des aiguilles d'une montre et attribuer des ID d'appareil numérisés à des emplacements sur le plan d'étage 524 jusqu'à ce que tous les ID de périphérique analysés simultanément aient été mappés. L'application peut afficher les ID d'appareil sous les icônes correspondantes pour permettre à l'installateur de monter correctement les appareils sur le terrain. En option, l'application peut se connecter à une imprimante pour imprimer les noms de périphérique attribués sur des étiquettes pouvant être apposées sur les périphériques avec les ID de périphérique correspondants.

Un installateur peut commencer avec un plan d'étage non planifié 524 sans aucune icône de périphérique. Lors de l'installation d'un appareil 506 sur le terrain, l'installateur peut positionner le plan d'étage 524 de manière appropriée et peut ensuite scanner le code QR, ou similaire, sur l'appareil 506 en tapant à l'emplacement du plan d'étage où l'appareil est installé. L'application peut ensuite déterminer le type d'appareil (SKU) à partir des informations de l'appareil numérisées et peut placer l'icône de l'appareil correspondant sur le plan d'étage 524 à l'emplacement taraudé. L'application peut alors identifier les informations de localisation comme décrit ci-dessus, créer une nouvelle entrée dans la table des appareils 520, et remplissez les champs appropriés avec les informations d'emplacement et de périphérique pour le périphérique scanné 506, et peut définir les indicateurs d'autorisation pertinents sur yes. L'adresse/l'emplacement du site peuvent être obtenus et enregistrés à partir d'un récepteur GPS dans l'appareil mobile 504, par exemple.

Localiser les appareils 506 peut inclure l'acceptation d'entrées dans un appareil mobile 504 spécifier un emplacement respectif sur un plan d'étage 524 pour chacun des appareils 506. Par exemple, localiser les appareils 506 peut inclure d'abord la localisation de l'appareil mobile 504 dans le plan d'étage 524 puis localiser les appareils 506 par rapport à l'appareil mobile 504, par exemple en traitant la force relative de leurs signaux RF reçus par l'appareil mobile 504. Localiser les appareils 506 peut inclure l'affichage d'un plan d'étage 524 sur l'appareil mobile 504 et accepter simplement l'entrée d'un utilisateur, par exemple, l'installateur, indiquant les emplacements des dispositifs 506 sur le plan d'étage 524.

Méthode 502 comprend l'autorisation des appareils 506 avec appareil mobile 504 communiquer avec le panneau central 508 ou serveur, comme indiqué dans la case 512 des fig. 5A et 5B. Les appareils 506 peut être autorisé à s'inscrire auprès du panel 508 via l'application mobile. Comme le montre la Fig. 5A, l'application découvre d'abord le panneau 508 et se connecte au panneau 508 en utilisant une connexion sécurisée. L'application envoie alors une copie de sa table des appareils 520 au panneau 508, qui autorise alors tous les appareils 506 pour lequel le champ ID de l'appareil dans la table des appareils 520 est peuplé. Comme le montre la Fig. 5B, le panneau 508 synchronise également sa propre table de périphérique local avec la copie reçue de l'application de périphérique mobile. Une fois l'application de l'appareil mobile connectée au panneau 508, il peut autoriser immédiatement les appareils 506, p. 508. Il est également envisagé qu'un utilisateur, par ex. un installateur, pourrait autoriser les appareils 506 en acceptant manuellement les appareils découverts 506 via l'interface utilisateur du panneau. Une fois un appareil 506 a été autorisé au panel, le panel 508 envoie le message d'autorisation accordée en réponse à tout message d'enregistrement ultérieur ou demande d'adhésion du dispositif autorisé 506.

Méthode 502 peut inclure la vérification de la qualité du lien, comme indiqué dans la case 516, avec chacun des appareils 506 avant d'enregistrer les appareils, comme indiqué dans la case 518, avec le panneau central 508 en comparant la qualité du signal entre chaque appareil 506 et panneau central 508 avec un niveau de seuil prédéfini. A la réception du message d'autorisation accordée par la centrale 508, comme le montre la fig. 5B, l'appareil 506 peut lancer la séquence de vérification de marge de liaison pour vérifier que la qualité du signal des messages échangés entre le dispositif 506 et le panneau 508 est au-dessus d'un seuil prédéfini. Le panel 508 peut rejeter l'enregistrement de l'appareil si la qualité du lien de l'appareil 506 est inférieur au niveau prédéfini.

Méthode 502 comprend également l'enregistrement des appareils 506 avec le panneau central 508, comme indiqué dans la case 514. Une fois la vérification de la qualité de la liaison terminée avec succès, comme le montre la Fig. 5B, le panneau 508 peut terminer l'enregistrement de l'appareil 506 en envoyant le message enregistré de l'appareil à l'appareil 506. Après cela, le processus d'établissement des clés afin de sécuriser les communications entre le panneau 508 et appareils 506 commencerait.

En référence maintenant à la Fig. 5F, localisation des appareils 506 peut être automatisé. Un processus 600 pour automatiser la localisation des appareils 506 comprend la prédiction d'une empreinte de signal pour chaque appareil 506 en fonction de l'emplacement de chaque appareil respectif 506 sur un plan d'étage 524, comme indiqué par la case 602. Traiter 600 comprend également la mesure d'une empreinte digitale de signal pour chaque appareil, comme indiqué par la case 604, et déterminer l'emplacement de chaque appareil 506 dans un bâtiment réel sur la base d'une comparaison des empreintes de signaux prédites et des empreintes de signaux mesurées, comme indiqué dans la case 606.

Cette méthode de mappage automatique des ID d'appareil avec leurs emplacements physiques respectifs sur le plan d'étage 524 peut avoir lieu une fois qu'un installateur a monté et mis sous tension les appareils 506 sur le terrain conformément à la carte de déploiement prévue. Dans ce qui suit, une empreinte digitale fait référence aux caractéristiques des signaux échangés entre un appareil 506 et le reste des appareils 506 dans le plan du système. Par exemple, une empreinte digitale d'un appareil donné 506 peut être un vecteur contenant la force du signal reçu sur cet appareil à partir de tous les autres appareils 506 à un moment particulier. Comme le montre la Fig. 5F, le système 100 peut effectuer l'auto-localisation des appareils 506 sur le terrain en suivant trois étapes : prédiction des empreintes digitales 602, mesure des empreintes digitales 604, et correspondance et association 606 d'empreintes digitales prédites avec des empreintes digitales mesurées.

Système 500 peut utiliser la carte de déploiement d'appareils prévue 608 montré à la Fig. 5F pour générer les empreintes RF prévues en dBm pour chaque emplacement de périphérique, comme indiqué dans le tableau 610 de la fig. 5G, où l'empreinte digitale de chaque appareil répertorié dans la colonne de gauche est représentée par la valeur de la force du signal RF en dBm dans la rangée respective, où la valeur minimale de la force du signal est de -100 dBm et la valeur maximale n'est pas supérieure à 0 dBm . Le module de prédiction d'empreintes digitales peut utiliser un modèle de propagation RF spécifique au site, tel que le lancer de rayons, pour prédire l'intensité du signal RF reçu au niveau d'un dispositif donné. 506 emplacement, par exemple, LOC1, COL2, et ainsi de suite, à partir de tous les autres appareils 506 déployés à différents endroits représentés sur la carte de déploiement 608. Par exemple, la ligne intitulée « LOC0" En figue. La 5G montre la force prévue du signal RF reçu vue par un appareil 506 emplacement LOC0 de tous les autres appareils 506 sur la carte de déploiement 508, c'est-à-dire au LOC1 via LOC8. Le modèle RF spécifique au site utilise le plan d'étage 524, informations sur les matériaux de construction, puissance de sortie RF de l'appareil et diagrammes d'antenne pour générer des estimations haute fidélité pour les empreintes digitales prédites. Dans des modes de réalisation, les empreintes digitales collectées avec un appareil mobile 504 lors de la planification du système, sont utilisés pour étalonner le modèle de propagation RF spécifique au site qui prédit les empreintes digitales aux emplacements prévus des dispositifs.

Une fois que l'installateur a monté et allumé les appareils 506 à leurs emplacements respectifs sur le terrain, les appareils 506 peuvent commencer à échanger des paquets RF entre eux. Cela permet aux appareils 506 pour mesurer la force du signal reçu des paquets de tous les appareils voisins 506 et créer l'empreinte RF mesurée pour ses emplacements. Par exemple, la ligne 1 En figue. 5H montre la force du signal mesurée par l'appareil Dev0 de tous les autres appareils 506 Sur le terrain. Les appareils 506 peuvent périodiquement mettre à jour et signaler leur empreinte digitale mesurée à la passerelle (ou au panneau 508), qui collecte ces données d'empreintes digitales mesurées et les stocke dans une table 612, comme le montre la fig. 5H, dans laquelle la valeur d'intensité de signal minimale est de -100 dBm et la valeur maximale n'est pas supérieure à 0 dBm. Si le système 100 comprend des appareils alimentés par batterie, ils peuvent économiser l'énergie de la batterie en mesurant la force du signal reçu à partir des paquets de référence utilisés pour la synchronisation d'horloge (c'est-à-dire en tant que balises) et en entrant dans un état d'alimentation de veille pendant le reste du temps.

Une fois la table d'empreintes mesurées 612 a été créé au niveau de la passerelle ou du panneau 508, le module d'appariement et d'association calcule l'association un à un entre les dispositifs 506 et les emplacements sur la carte de planification (par exemple, LOC1, COL2, etc.). Ceci peut être accompli en faisant en sorte que le module d'appariement et d'association maximise la similitude globale entre les empreintes digitales prédites, comme le montre la Fig. 5G, et celles mesurées illustrées à la FIG. 5H. Dans des modes de réalisation, une matrice de coût est générée qui enregistre la similitude de chaque empreinte digitale prédite avec toutes celles mesurées (ou vice-versa). Les colonnes de la matrice sont les ID d'appareil Dev0 à Devm, les lignes sont les emplacements (LOC0, COL1, LOC2, etc.) et chaque entrée dans la matrice est la similitude entre l'empreinte digitale prédite liée à l'emplacement de la ligne relative et l'empreinte digitale du dispositif par rapport à la colonne. Dans un mode de réalisation, cette similitude est exprimée comme la distance euclidienne entre les deux vecteurs d'intensité de signal reçu par rapport aux empreintes digitales prédites et mesurées. L'association globale (association un à un entre les dispositifs et les emplacements prévus) peut être mesurée à l'aide de toute méthode d'association existante, telle que l'opération itérative illustrée à la Fig. 5I. Dans des modes de réalisation, la programmation dynamique (DP) est utilisée pour trouver l'association globale à l'aide de l'algorithme hongrois. Une itération sur tous les ordres possibles des appareils dans la matrice de coût est requise. A chaque étape du processus itératif représenté sur la Fig. 5I, un ordre des points d'accès est choisi et leurs valeurs relatives à partir de la matrice de la Fig. 5H sont copiés dans la matrice prédite (creuse) (la matrice de gauche sur la figure 5I). Les valeurs de la matrice (creuse) mesurée (la matrice du bas à droite sur la figure 5I) ne sont copiées qu'une seule fois au début de ce processus. Un algorithme de programmation est utilisé pour sélectionner le coût total de la meilleure association, par exemple, dans un tableau 614 comme le montre la fig. 5J. La configuration (ordre dans le tableau 614) des appareils 506 et l'association correspondant au coût le plus bas de toutes les itérations peut être sélectionnée comme association globale. FIGUE. 6 montre un exemple de la table des signaux mesurés et prédits, tiré d'un déploiement réel, et la matrice de distance après une seule itération.

Si deux emplacements ou deux appareils 506 ont des empreintes digitales similaires, le processus d'appariement et d'association 606 peut ne pas renvoyer l'association optimale. Cette ambiguïté peut être atténuée ou évitée en analysant les empreintes digitales prédites au moment de la planification (avant le déploiement). Cela peut être fait en calculant une matrice de similarité croisée (similaire à la matrice de coût utilisée pour l'association, mais avec des colonnes et des lignes correspondant toutes deux aux empreintes prédites). L'ambiguïté est détectée si au moins deux entrées dans n'importe quelle colonne/ligne sont similaires (ambiguës) et ne peuvent pas être résolues par une affectation globale. Par exemple, le placement sur la carte 608 peut être réorganisé, manuellement ou automatiquement, afin de rendre les empreintes digitales plus discriminantes. Dans une autre technique, l'un des dispositifs 506 provoquant l'ambiguïté (dans le cas où il existe deux dispositifs avec des empreintes digitales similaires) peut être ignoré dans une première phase d'association et ajouté plus tard, lorsque les nœuds restants sont associés. Ce processus peut être généralisé à un nombre quelconque de nœuds provoquant l'ambiguïté.

Une fois les emplacements des appareils 506 sur le terrain ont été identifiés, les informations peuvent être utilisées pour s'assurer que tous les dispositifs prévus ont été montés sur le terrain. Le schéma d'appariement et d'association permet également de détecter si l'un des appareils a été mal échangé lors du montage. Cela peut être fait en signalant les informations sur le type d'appareil avec les données d'empreintes RF mesurées. La carte de déploiement planifié peut déjà capturer le type d'appareil pour chaque appareil planifié. Si les données d'empreintes digitales mesurées signalées par un appareil de type A correspondent aux données d'empreintes digitales prévues à l'emplacement LOC1 là où l'appareil de type B était prévu, cela indique que l'appareil a été monté au mauvais endroit.

Les informations de localisation peuvent également être utilisées pour authentifier les appareils 506 demander à rejoindre le réseau. L'empreinte digitale mesurée signalée par un appareil peut également être utilisée pour accepter ou refuser sa demande d'adhésion au réseau. Si l'empreinte digitale mesurée signalée par l'appareil ne correspond à aucune des empreintes digitales prédites, cela indique que l'appareil peut être soit un voyou, soit provenir d'un déploiement voisin et n'appartient pas au réseau.

Les informations de localisation peuvent être utilisées pour configurer les appareils à distance. Une fois l'emplacement d'un appareil défini, la configuration de l'appareil, qui peut dépendre fortement de l'emplacement et du type d'appareil, peut être communiquée à l'appareil à partir du logiciel système via la passerelle.

Une autre utilisation des informations de localisation est la localisation d'appareils non sans fil 506. Si le système de bâtiment déployé se compose également d'appareils filaires 506 en plus ou à la place des appareils sans fil 506, la méthode d'autolocalisation décrite ci-dessus peut être adaptée pour inclure un appareil mobile 504 comme un appareil sans fil portable comme un smartphone ou une tablette qui échange des messages avec d'autres appareils de localisation sans fil installés temporairement dans le bâtiment pour faciliter la localisation. L'installateur peut scanner l'appareil 506, par exemple, à partir d'une étiquette sur l'appareil 506, après l'avoir monté et mis sous tension sur le terrain. L'appareil mobile 504 peut ensuite échanger des paquets avec les appareils sans fil de localisation temporaires montés dans le bâtiment pour mesurer l'empreinte RF à l'emplacement de montage et l'ajouter à l'ID scanné à partir de l'appareil, qui sert d'ID MAC pour cet appareil. Cela permet au système de mapper automatiquement le périphérique monté scanné à son emplacement sur le plan d'étage au lieu qu'un installateur le fasse manuellement.

Les informations de localisation peuvent également être utilisées pour identifier les dispositifs défectueux et les mauvaises configurations. Si le système de construction 100 signale une défaillance liée à un identifiant d'appareil particulier après la mise en service, les informations d'emplacement permettent au gestionnaire de l'installation d'identifier l'emplacement d'un tel appareil 506 dans le plan d'étage du bâtiment 524.

Une autre utilisation des informations de localisation des appareils est l'amélioration des systèmes d'aide à la décision. Un système d'information géographique peut être créé une fois que les identifiants de dispositifs sont associés à leurs emplacements physiques. Ce système peut être utilisé pour concevoir des systèmes d'aide à la décision, par exemple grâce à l'analyse de données volumineuses.

Une autre utilisation des informations de localisation est la création de rapports d'alarmes et d'événements plus intuitifs que dans les systèmes traditionnels. Le mappage d'identifiants d'appareils à des emplacements physiques peut être utilisé pour afficher des données d'appareils telles que des alarmes sur une interface utilisateur graphique basée sur un plan d'étage, par exemple un plan d'étage. 524 sur appareil mobile 504. Ce type d'interface graphique peut être beaucoup plus intuitif et interactif que les rapports textuels facilitant traditionnellement le travail de l'opérateur système.

Les systèmes et méthodes d'enregistrement des dispositifs distribués décrits ici offrent les avantages potentiels suivants par rapport aux systèmes traditionnels : flexibilité totale en termes de séquence dans laquelle les dispositifs sont installés et mis sous tension sur le terrain, flexibilité en termes de séquence dans laquelle la découverte de dispositifs, la localisation des appareils et l'autorisation des appareils sont effectuées, l'autorisation et la localisation des appareils en une seule touche, éliminant le besoin de faire des allers-retours entre le panneau et les appareils pendant l'enregistrement, l'autorisation simultanée des appareils pour faciliter l'autorisation et la localisation des appareils dans les back-offices, aucune inscription pour les appareils avec une mauvaise qualité de liaison garantit une réduction des rappels sur le terrain pour les installateurs, ainsi qu'une réduction du temps et des erreurs dans le processus d'apprentissage des appareils.

Une différence marquée entre les systèmes et les méthodes de localisation de dispositifs décrits ici et les systèmes traditionnels ne repose pas uniquement sur la force du signal reçu mesuré pour calculer directement les emplacements des dispositifs (c'est-à-dire par des techniques de triangulation). Il utilise à la place un modèle RF spécifique au site pour générer des empreintes RF prédites qui correspondent aux empreintes RF mesurées en utilisant un schéma d'appariement et d'association robuste n-à-n pour déterminer l'emplacement des appareils dans un bâtiment. Cela réduit les imprécisions de localisation des techniques existantes d'intensité du signal reçu car le problème est formulé comme un problème d'association plutôt qu'un simple problème de localisation.

Les systèmes et procédés de localisation décrits ici offrent les avantages potentiels suivants par rapport aux systèmes traditionnels : mappage automatique des dispositifs sans fil installés dans un bâtiment à leurs emplacements physiques sur le plan d'étage du bâtiment, économisant ainsi du temps et éliminant les erreurs, prenant en charge la localisation automatique des périphériques (câblés ou non) via l'utilisation d'un périphérique sans fil portable et de nœuds de localisation temporaires, offrant une flexibilité en termes de comment et quand le système est installé et configuré (par exemple, un installateur peut monter, câbler et mettre sous tension les périphériques et quitter, ou un technicien de mise en service peut mettre en service les appareils à distance ultérieurement), en veillant à ce que les appareils soient installés et montés comme prévu, en veillant à ce que seuls les appareils valides rejoignent le réseau.

Avec certains modes de réalisation illustrés décrits ci-dessus, il convient de noter que divers modes de réalisation non limitatifs décrits ici peuvent être utilisés séparément, combinés ou combinés sélectivement pour des applications spécifiques. En outre, certaines des diverses caractéristiques des modes de réalisation non limitatifs ci-dessus peuvent être utilisées sans l'utilisation correspondante d'autres caractéristiques décrites. La description qui précède doit donc être considérée comme simplement illustrative des principes, des enseignements et des exemples de modes de réalisation de cette invention, et non comme une limitation de celle-ci.

Il doit être compris que les agencements décrits ci-dessus sont uniquement illustratifs de l'application des principes des modes de réalisation illustrés. De nombreuses modifications et agencements alternatifs peuvent être imaginés par l'homme du métier sans s'écarter de la portée des modes de réalisation illustrés, et les revendications annexées sont destinées à couvrir de telles modifications et agencements.


Voir la vidéo: Kiinteistöjen digitalisaatio mitä hyötyä siitä on? (Octobre 2021).