Suite

Obtenir des segments de route à partir des données OSM et leur attribuer un ETA


J'ai un problème d'attribution d'ETA possible pour un itinéraire. Pour l'instant, j'ai les éléments suivants :

  1. Données OSM pour une ville.
  2. J'ai des données open source sur les pistes de taxi pour la même ville.

Maintenant, je prévois de diviser les données OSM en segments de route avec un identifiant unique pour chacun. Cela signifie que chaque segment est un itinéraire sans aucune autre intersection/dérivation d'itinéraire et une valeur sera attribuée.

Pour chaque segment, je chercherai dans mes données de taxi pour voir s'il a parcouru ce segment. Si oui, combien de temps cela a-t-il pris.

Je voulais savoir si cela avait déjà été fait. J'ai regardé GraphHopper dans lequel je peux obtenir des itinéraires, mais pas des segments.

Avant d'entrer dans pgRouting, je voulais demander s'il existe une meilleure solution open source disponible dans le commerce pour le même ?


Comme déjà commenté : si vous avez besoin d'estimer de meilleures vitesses pour chaque route à partir de vos pistes de taxi, cela est tout à fait faisable avec GraphHopper et ce composant de correspondance de carte open source pour cela.


On dirait que vous essayez de mettre en œuvre ce que l'on appelle Données de voiture flottantes (FCD) une analyse. Ce domaine a suscité beaucoup d'intérêt de la part des chercheurs puisque l'analyse est loin d'être triviale dans la plupart des cas. Il y a plusieurs problèmes que vous devez résoudre, y compris, mais sans s'y limiter, la correspondance de carte et le routage. Selon la résolution temporelle de vos pistes de taxi, certaines étapes peuvent être plus ou moins difficiles à mettre en œuvre. Pour autant que je sache, il n'existe actuellement aucun système FCD open source prêt à l'emploi.

Vérifiez Comment créer une carte OSM routable pour savoir comment créer un graphique de routage à partir d'OSM.


Si je vous ai bien compris, vous allez laisser Taxi-data (coûts enregistrés) avoir un impact sur un graphique déjà calculé avec des coûts fixes et influencer d'une manière ou d'une autre l'itinéraire pendant (ou avant ?) le calcul ? Vos données sont-elles déjà affectées à des OSM-Ids (chemins ?) ou, comme vous l'avez déjà mentionné, devraient plutôt être affectées à des segments (chemins partiels entre intersections) ? L'API d'osm2po est conçue pour être hautement personnalisable. Surtout pour ce genre de questions. Mais comme l'abréviation API l'implique, vous aurez besoin de petits morceaux écrits en Java pour réussir. Une question légèrement différente expliquant comment utiliser Eclipse avec osm2po peut être trouvée ici :

Comment étendre OSM2PO avec des durées de ferry ?

Et n'ayez pas peur du mot "Freeware", car il ne fait référence qu'au noyau, qui doit être considéré comme une sorte de système d'exploitation (fermé). Tous les autres éléments sont ouverts et enfichables. Pluggable signifie que vous n'avez pas affaire à des tonnes de code source étranger et/ou que vous êtes obligé de cloner/extraire des projets entiers. Concentrez-vous simplement sur votre tâche. Soit dit en passant, vous pouvez même regrouper vos données Taxi dans le fichier graphique d'osm2po (conteneur) si nécessaire et les déployer de cette façon.

Si c'est ce dont vous avez besoin, la première étape consiste à vous connecter à l'API et à personnaliser/écraser leDefaultJoinFilter, fusionnez les données Taxi et injectez votre implémentation dans osm2po.config ou directement en tant que paramètre de ligne de commande.

Pour des questions détaillées, s'il vous plaît contactez-moi par courrier.


Comment puis-je enregistrer ma position régulièrement dans un modèle SIG ?

J'ai un modèle SIG où un camion quitte un distributeur principal, visite plusieurs clients le long d'un itinéraire pour effectuer des livraisons, puis retourne au distributeur une fois qu'il est vide. L'itinéraire est choisi en fonction de la proximité des agents avec le distributeur principal et entre eux. J'essaie de comprendre comment enregistrer l'itinéraire emprunté par le camion pour effectuer les livraisons, même si je n'ai pas encore pu le faire. Toute aide est grandement appréciée. Merci!


Inclusion d'informations sur les accidents dans la planification automatique des itinéraires cyclables pour les zones urbaines

Entre 2005 et 2007, il y a eu 9071 accidents de la circulation impliquant des vélos à Londres et cet article démontre l'utilité des systèmes d'information géographique comme outil d'analyse et de visualisation de ces événements. Grâce à la liaison de ces emplacements spatiaux à un ensemble de données du réseau routier, il a été possible de créer une variété d'informations sur les types d'infrastructures routières où les accidents se produisent principalement. De plus, un algorithme de routage du réseau a été adapté pour tenir compte de la fréquence des accidents dans une série de trajets proposés. Cette application de routage pilote a comparé l'itinéraire le plus rapide avec un itinéraire pondéré pour éviter les accidents entre une série d'origines et de destinations. Les résultats ont démontré que les itinéraires évitant les zones à fort volume d'accidents n'augmentaient pas significativement la longueur du trajet, mais fournissaient un itinéraire « plus sûr » basé sur des preuves empiriques sur le volume d'emplacements d'accidents.

1. Introduction

Le vélo a gagné en popularité en tant que méthode de déplacement à Londres au cours des dix dernières années, Transport for London (TFL) estimant qu'environ 2% de tous les déplacements sont désormais effectués à vélo, ce qui représente une augmentation de 0,8% depuis l'an 2000. [1]. Bien qu'en termes de pourcentage, cela soit faible par rapport à tous les autres modes de déplacement disponibles, cela équivaut cependant à 545 000 trajets quotidiens individuels à vélo [2]. Le choix de faire du vélo ou non est complexe, et il existe une pléthore de littérature qui identifie de nombreux facteurs d'influence associés à ce processus de prise de décision. La littérature sur ce domaine est largement examinée ailleurs, et en tant que telle ne sera pas répétée ici [3]. Cet article concerne l'analyse spatiale des données détaillant les emplacements de tous les accidents de vélo à Londres entre 2005 et 2007. Ces données définissent un accident comme les incidents de cyclisme impliquant une blessure corporelle, survenus sur une voie publique et par conséquent signalés à la police. Au cours de la période 2005-2007, il y a eu un total de 9071 accidents de ce type à Londres, les accidents passant de 2977 en 2005 à 3058 en 2007 (

2,7 % d'augmentation). Parmi les accidents survenus en 2007, 461 ont entraîné la mort ou des blessures graves de l'usager de la route [4]. Le but de cette étude est de créer une série de cartes qui représentent la concentration spatiale des accidents survenant dans le réseau routier de Londres et d'utiliser davantage ces informations pour informer un service automatisé pilote qui fournit des options d'itinéraires cyclables qui évitent les zones de volumes d'accidents élevés enregistrés. .

Il existe une abondante littérature internationale sur les accidents de vélo. Cela concerne en grande partie l'évaluation des aspects de l'infrastructure routière ou de l'état des routes qui sont liés à une propension accrue aux accidents ou à la mort. Les infrastructures de transport communes considérées dans ces études comprennent les carrefours routiers [5, 6], le nombre de voies de circulation [7], les chaussées/trottoirs [8, 9], la taille des ronds-points [10, 11] et la présence ou l'absence de pistes cyclables surélevées [12]. Il a été démontré que d'autres facteurs influents incluent la vitesse des usagers de la route [13], la congestion [14], le niveau d'expérience des cyclistes [9], le niveau de privation dans la région [15] et le groupe démographique [16].

L'analyse présentée ici diffère de ces études précédentes [17] en considérant la répartition des accidents de vélo seuls sans tenir compte des facteurs environnementaux ou humains potentiels qui peuvent influencer leur occurrence. En tant que tel, le but de cette étude n'est pas d'ajouter à cette littérature explicative, mais plutôt de créer d'abord une représentation spatiale visuelle de la densité d'accidents au sein du réseau routier, et d'autre part, tenter d'utiliser cette information pour informer les cyclistes des itinéraires où de fortes nombre de cyclistes ont été impliqués dans des accidents, offrant alors des itinéraires alternatifs potentiels où ces risques pourraient être atténués. Cependant, cette information est avec la mise en garde que l'infrastructure routière elle-même n'est pas prise en compte dans cette analyse. Il a été démontré que les cyclistes tentent de minimiser le risque global perçu et que ce risque a un effet dissuasif sur le cyclisme potentiel [18, 19]. En tant que tel, si des informations peuvent être fournies sur les itinéraires cyclables qui ont une fréquence d'accidents enregistrée plus faible, cela pourrait avoir un effet positif en encourageant davantage de personnes à faire du vélo. Cependant, différents groupes de cyclistes peuvent réagir de différentes manières. Par exemple, il a été démontré que l'aversion au risque n'est pas un facteur clé de choix d'itinéraire pour de nombreux cyclistes pendulaires qui préfèrent les itinéraires qui s'écartent peu du chemin minimum et ont tendance à s'en tenir aux grands axes routiers [7], malgré ceux qui concernent l'infrastructure du réseau où plus les taux d'accidents sont enregistrés. Cependant, d'autres groupes de cyclistes ont démontré une plus grande sensibilisation aux risques. Par exemple, il a été démontré que certains groupes de cyclistes préfèrent les itinéraires avec une réglementation clairement définie du comportement des usagers de la route [20], tels que les échangeurs contrôlés par des feux de circulation plutôt que les ronds-points.

L'objectif global de cet article est de créer une représentation géographique des parties du réseau de transport londonien les plus sujettes aux accidents de vélo. Au minimum, ces informations pourraient être utilisées pour faire connaître les itinéraires où une vigilance accrue est requise par les cyclistes ou les autres usagers de la route ou pourraient être utilisées pour éclairer des politiques cyclables différenciées dans l'espace [21]. De plus, en démontrant comment ces informations pourraient être intégrées dans une application de planification d'itinéraire automatisée par pilote, elle vise à fournir des outils qui pourraient éventuellement être utilisés pour présenter des itinéraires alternatifs qui aident les cyclistes à éviter les zones à forte fréquence d'accidents.

Cependant, il y a un certain nombre de mises en garde à ces analyses. Premièrement, le risque, tel que défini dans cette étude, se concentre uniquement sur les accidents enregistrés, et en tant que tel, il pourrait y avoir une sous-déclaration inconnue des accidents qui ne sont pas capturés par l'ensemble de données. Au Royaume-Uni, la Royal Society for the Prevention of Accidents estime la sous-déclaration des accidents de vélo à 60-90% [22] cependant, ces chiffres sont basés sur une estimation de tous les accidents, et en particulier ceux qui sont mineurs, et en tant que tel moins préoccupant. De plus, dans toute représentation ou service qui vise à fournir des informations sur les niveaux de risque sur certains itinéraires, cela a le potentiel de créer un déplacement des accidents vers de nouveaux emplacements à mesure que les cyclistes empruntent de nouveaux itinéraires. En tant que telle, la promotion d'un service offrant des conseils sur les itinéraires dangereux ne devrait pas être indépendante de messages plus larges sur la sécurité ou la formation à vélo. Enfin, dans cet article, le « risque » est considéré comme la fréquence absolue des accidents plutôt que comme une mesure relative par rapport au volume de trafic, car il n'existe pas de données complètes et accessibles au public sur les flux de circulation au niveau de la rue pour Londres. Ce n'est pas idéal cependant, le manque d'informations signifie que cette étude doit se fonder sur des valeurs absolues. Cependant, en termes de fourniture d'informations sur l'utilisateur final, les valeurs absolues d'accidents peuvent toujours être utiles aux utilisateurs finaux, par exemple, en prenant l'exemple d'un carrefour très fréquenté qui a à la fois un flux de trafic élevé et un volume d'accidents correspondant élevé pour un cycliste. cherchant à éviter les zones à haut risque personnel, une mesure relative pourrait être trompeuse, et ils pourraient plutôt trouver que le niveau absolu d'accidents dans une zone particulière est plus utile. De plus, nous avons adopté une définition quantitative du risque dans cette étude, mais nous observons que d'autres ont soutenu que le risque perçu peut être socialement construit [23] et avoir un impact spécifique sur les réponses comportementales visant à atténuer le risque personnel.

2. Représentation spatiale des emplacements à risque d'accident

L'ensemble de données utilisé dans cette étude a été fourni par le ministère des Transports (le site Web du DfT est http://www.dft.gov.uk/) dans le cadre d'une initiative plus large qui permet au grand public d'accéder au secteur public brut dépersonnalisé données (voir http://innovate.direct.gov.uk/2009/03/10/pedalling-some-raw-data/). Ces données ne comprenaient aucune information d'attribut, mais elles détaillaient les coordonnées est et nord (GB National Grid) des emplacements des accidents pour une période d'enregistrement d'un an (2005, 2006, 2007). La disponibilité de ces données élargit la possibilité du type d'analyse spatiale à haute résolution qui fait généralement défaut dans la plupart des interprétations officielles des données sur les accidents à Londres (voir http://www.tfl.gov.uk/corporate/projectsandschemes/roadsandpublicspaces/ 2840.aspx pour les rapports officiels sur les victimes dans le Grand Londres). À l'examen de ces données, il a été constaté que des emplacements géographiques spécifiques contenaient de multiples cas d'accidents. Une explication potentielle de ces événements pourrait être si plusieurs cyclistes étaient impliqués dans un accident au même endroit, ou, si l'accident avait été entré dans la base de données source avec une fausse précision. Par exemple, un cycliste peut être en mesure d'identifier sur quelle route il a eu son accident, mais pas l'emplacement précis sur la route où l'accident s'est produit. Dans ces circonstances, l'emplacement du centroïde de la route ou d'autres identifiants communs peuvent être utilisés comme substitut. Afin de tester l'hypothèse selon laquelle les emplacements centraux des segments de route peuvent avoir été utilisés dans la procédure de géocodage, les points médians de chaque lien ont été extraits en tant qu'emplacements de points. L'emplacement de chaque accident a ensuite été comparé à ces emplacements de liaison centrale. Il a été constaté que dans les emplacements d'accidents avec un seul événement, environ 0,44 % s'est produit à moins d'un mètre et 11,16 % à moins de 5 mètres des emplacements médians de la liaison. Dans les endroits où de multiples accidents ont été enregistrés, 0,8 % se sont produits à moins d'un mètre et 16,4 % à moins de 5 mètres des emplacements médians de la liaison. Cela indique qu'il peut y avoir un certain degré d'erreur de codage pour les emplacements avec des accidents multiples, mais ceux-ci restent peu concluants étant donné qu'aucun accident n'a été enregistré à l'emplacement médian précis. Ces erreurs de géocodage peuvent être problématiques, mais particulièrement lorsque l'on considère les routes qui connaissent un grand nombre d'accidents de vélo. Des emplacements erronés pourraient donner une fausse indication des endroits où les accidents se produisent fréquemment et, par conséquent, mal informer les utilisateurs finaux potentiels de ces informations. L'ampleur des emplacements de points spatiaux avec des incidences d'accidents multiples est indiquée dans le tableau 1. Cela montre que 7,7 % des données de la base de données ont des accidents multiples par emplacement, cependant, l'ampleur des emplacements avec plus de deux multiples diminue considérablement avec l'occurrence d'accident.

Sans métadonnées détaillées relatives à la façon dont les accidents ont été géocodés, il est difficile de démêler ces informations. Ainsi, dans les analyses suivantes qui visent à démontrer différentes méthodes de visualisation applicables aux données d'accidents de vélo, ces emplacements de points avec deux accidents ou plus enregistrés ont été exclus, laissant un sous-ensemble de 7605 points de données. Le traitement spatial de ces données a été réalisé dans ArcGIS de ESRI Ltd (http://www.esri.com/) qui est un exemple de Système d'Information Géographique (SIG : [24]). Un SIG permet d'importer des données spatiales brutes, puis d'effectuer diverses manipulations, analyses et visualisations qui ne sont pas possibles, difficiles ou lentes dans les progiciels statistiques traditionnels. La première étape pour transformer ces données spatiales en informations compréhensibles consiste à créer une visualisation cartographique de base [25]. Il existe de nombreuses possibilités de complexité variable pour représenter visuellement des données spatiales et décrire des modèles géographiques. Plus simplement, les données peuvent être affichées sur une carte sous la forme d'une série de points (voir Figure 1).


Les informations véhiculées par cette carte sont d'une utilité limitée et soulignent principalement que davantage d'accidents se produisent dans le centre de Londres et sur les artères très fréquentées où le flux de cyclistes est susceptible d'être plus élevé. Il ne met pas en évidence efficacement l'intensité des points chauds d'accidents [26], ce qui peut être utile pour identifier les zones du réseau de transport qui nécessitent une étude plus approfondie. Une représentation alternative peut donc être créée en superposant une série de grilles et en comptant la fréquence des accidents au sein des cellules. Pour trois résolutions différentes de grilles, cette analyse est illustrée dans les figures 2(a)–2(c). Ces représentations illustrent le problème d'unité de surface modifiable (MAUP : [27]) qui est un phénomène affectant les relations statistiques entre les observations ponctuelles lorsqu'elles sont agrégées et considérées dans différentes régions de définition (dans ce cas des carrés). Bien qu'il faille prendre garde de ne pas impliquer une erreur écologique [28], on pourrait généralement conclure à partir de ces cartes qu'il existe une concentration d'accidents dans le centre de Londres, confirmant ainsi les conclusions d'études précédentes à visée régionale [26, 29].


(a) Grille de 1000 mètres
(b) Grille de 500 mètres
(c) grille de 300 mètres
(a) Grille de 1000 mètres
(b) Grille de 500 mètres
(c) grille de 300 mètres Points chauds des accidents de cycle identifiés dans une grille de 1000 mètres (a), 500 mètres (b) et 300 mètres (c) à travers Londres.

3. Création de la base de données du réseau routier des accidents

Bien que les cartes présentées à la figure 2 conviennent à l'examen des schémas désagrégés d'accidents de vélo, elles ne parviennent pas à fournir une représentation adéquate lorsqu'elles sont utilisées dans des analyses à l'échelle locale. Par exemple, la figure 3(a) montre la grille de 500 mètres pour une zone du centre de Londres avec le réseau routier et les emplacements des points des accidents de vélo en superposition. On peut voir que dans les cellules, les emplacements des points sont principalement limités à des routes spécifiques traversant ces zones, et en tant que tel, il serait erroné (sophisme écologique) de faire des déductions sur les caractéristiques de routes spécifiques sur la base des informations agrégées dérivées de la cellules de la grille. Pour cette raison, lors de l'identification de l'emplacement des points chauds des accidents de cyclisme dans ces zones géographiques plus restreintes, le réseau routier lui-même devient l'unité d'analyse la plus sensible. Les données routières utilisées dans cette analyse étaient un sous-ensemble londonien de la couche du réseau de transport intégré (ITN) qui fait partie du produit de la carte maîtresse de l'enquête sur les munitions (agence nationale de cartographie britannique). Les données ITN sont un ensemble de données de réseau contenant des détails sur toutes les routes avec une variété d'attributs tels que le nom et la hiérarchie de la route (par exemple, route principale/route secondaire, etc.). Les données ITN ont été importées et préparées pour être utilisées dans ArcGIS à l'aide de ESRI UK Productivity Suite (http://www.esriuk.com/productivitysuite). Dans les données ITN, un segment de ligne est défini comme une section de route entre deux nœuds qui représente généralement une intersection comprenant un carrefour ou un rond-point. Ainsi, une même route peut être composée de plusieurs segments.


(a) Accidents dans une grille de 500 mètres avec le réseau routier et les emplacements des points d'accident en superposition
(b) Une représentation en réseau des accidents de vélo
(a) Accidents dans une grille de 500 mètres avec le réseau routier et les emplacements des points d'accident en superposition
(b) Une représentation en réseau des accidents de vélo

Une fois les données ITN importées dans le SIG, un décompte de la fréquence des emplacements d'accidents non dupliqués le long de chaque segment de route a été réalisé en effectuant une jointure spatiale qui reliait l'emplacement du point d'accident à son segment de route le plus proche.Une opération correspondant à un segment de route le plus proche était nécessaire car certains accidents avaient des emplacements enregistrés avec une précision variable par rapport à la couche de données du réseau routier, et en outre, certains accidents peuvent s'être produits à un emplacement non routier comme sur un chemin. De plus, comme discuté dans la section précédente et démontré dans le tableau 1, certaines données ponctuelles dans la base de données source présentaient une précision erronée liée à un géocodage imprécis. Cependant, le modèle de réseau permet une méthode de réintroduction de ces données dans l'analyse. Lorsqu'un point de données spatiales avait deux accidents de cyclisme ou plus qui lui étaient attribués, une analyse distincte a d'abord été effectuée pour attribuer la somme des accidents à cet endroit au segment de route le plus proche. Étant donné qu'une route peut être composée de plusieurs segments, la somme des accidents a ensuite été divisée par le nombre total de segments composant la route et attribuée à chaque segment en conséquence. Une fois que tous les segments de ligne dans les données ITN de Londres ont été codés avec une fréquence d'accidents appropriée, les lignes représentant les routes pourraient être mises à l'échelle pour créer une représentation alternative plus adaptée aux analyses à l'échelle locale (voir Figure 3(b)).

Il est important de réitérer que ces méthodes de représentation visuelle fournissent des preuves pour les zones qui ont empiriquement une fréquence plus élevée d'accidents de vélo, mais elles ne fournissent pas de causalité sur la raison pour laquelle ces événements se produisent. En tant que telles, les informations fournies ici sont principalement utiles pour la génération d'hypothèses ou pour identifier et hiérarchiser les domaines nécessitant une intervention plus urgente. Par exemple, les deux principales routes de Londres avec la fréquence la plus élevée d'accidents à vélo peuvent être identifiées comme « The Mall » et « Newington Causeway », qui ont toutes deux enregistré 20 accidents. Un point commun entre ces deux emplacements routiers est qu'une partie de leur étendue se trouve sur ou à proximité de ronds-points très fréquentés (voir la figure 4). Les deux routes ont un certain nombre de leurs accidents attribués à des emplacements non précis, et en tant que tel, il reste difficile de démêler sans plus d'informations si la cause de ces accidents est liée à la route ou au rond-point lui-même. En effet, le danger du rond-point Elephant and Castle pour les cyclistes est souligné par l'ajout d'une signalisation pour une route de contournement via des routes secondaires plus petites.


(a) Circulation aux heures de pointe sur le rond-point à l'approche du centre commercial visible à travers les arches
(b) Circulation aux heures de pointe sur la chaussée de Newington, à l'approche du rond-point des éléphants et du château
(a) Circulation aux heures de pointe sur le rond-point à l'approche du centre commercial visible à travers les arches
(b) Circulation aux heures de pointe sur la chaussée de Newington, à l'approche du rond-point des éléphants et du château

En plus de l'identification de domaines d'étude de cas ciblés, ces informations permettent également de collecter des informations supplémentaires sur la fréquence des accidents grâce à une série de données d'attributs annexées à l'ITZ. Par exemple, on peut constater que les schémas d'accidents sont hétérogènes entre les deux types de routes (voir tableau 2) et les différents éléments de l'infrastructure de transport (voir tableau 3).

4. Routage et évaluation optimisés pour la sécurité

Contrairement à de nombreuses études antérieures qui considèrent les infrastructures comme faisant partie d'un modèle de choix d'itinéraire [30], cette analyse vise à démontrer comment une application de routage simple implémentée dans un SIG pourrait être adaptée grâce à l'ajout d'une nouvelle intelligence spatiale sur la fréquence des accidents. Des études antérieures ont montré que les cyclistes optimisent principalement leur choix d'itinéraire en fonction du temps de trajet [7, 31]. Ainsi, ces analyses compareront le chemin le plus court avec un itinéraire évitant les zones à fort taux d'accidents enregistrés. Les données ITN utilisées dans cette étude sont fournies sous licence académique et ne sont donc pas disponibles pour une utilisation dans un service de routage en ligne sans coût significatif. Un jeu de données de réseau routier alternatif qui est fourni sans de telles restrictions peut être dérivé d'OpenStreetmap (http://www.openstreetmap.org/) cependant, ces données n'ont pas encore une couverture à 100 % pour Londres. De plus, il existe d'autres problèmes liés à la façon dont ces données sont structurées. Lorsque les routes ont été numérisées mais non divisées en segments, cela crée des problèmes lorsque ceux-ci sont utilisés pour des applications de routage, car un algorithme de planification d'itinéraire automatisé ne connaîtra pas un carrefour. En tant que telle, l'application de routage présentée ici a été construite hors ligne avec des données ITN et ArcGIS en tant qu'étude de preuve de concept pour examiner la faisabilité de produire un futur service en ligne. En attribuant les incidences d'accidents aux données du réseau routier, cela a créé un ensemble de contraintes de base qui pourraient être utilisées pour pondérer un modèle de routage de réseau basé sur la distance qui optimise le trajet d'un cycliste loin des routes à forte incidence d'accidents. Ces fréquences d'accidents seraient idéalement normalisées pour tenir compte de l'exposition par rapport au volume total de cyclistes empruntant ces routes cependant, malheureusement, ces données de flux ne sont pas disponibles.

Cet outil a été construit à l'aide des fonctionnalités Network Analyst d'ArcGIS qui utilise l'algorithme de Dijkstra pour trouver le chemin le plus court entre deux emplacements (nœuds) en fonction d'un ensemble de contraintes de réseau routier (bord) [32]. Une longueur de segment de route pondérée a été calculée en sélectionnant les bords avec des accidents attribués et en multipliant la longueur par la fréquence des accidents. Ainsi, lorsque plus d'un accident se produisait sur un segment de route, la longueur pondérée par l'algorithme était augmentée d'un facteur proportionnel à la fréquence des accidents. Ainsi, sur les segments de route où il n'y a eu qu'un seul accident ou aucun accident, on leur a attribué une longueur égale à leur longueur réelle en mètres. En utilisant cette pondération, l'algorithme de Dijkstra privilégie le chemin le plus court mais prend en compte (en tant que coût) les routes qui ont une fréquence élevée d'accidents. Ainsi, les contraintes de ce modèle sont attribuées sous la forme d'une combinaison de poids pour tenir compte de la distance entre les nœuds mesurée en mètres et de la fréquence des accidents de cyclisme enregistrés. L'algorithme de Dijkstra est calculé comme suit : (a) au sein du réseau, tous les nœuds se voient attribuer la valeur de l'infini, à l'exception du nœud d'origine qui se voit attribuer un zéro (b) tous les nœuds sont marqués comme non visités à l'exception du nœud d'origine ( c) la distance entre le nœud d'origine est comparée à tous les autres nœuds liés et la distance pondérée calculée (longueur de segment de route ou longueur de segment de route pondérée) (d) le nœud d'origine est alors marqué comme visité (ne sera plus visité) et a le plus bas des chemins pondérés calculés attaché (e) l'algorithme passe alors au nœud suivant qui est attaché par la plus petite distance pondérée, l'algorithme retourne alors à l'étape (c), et le processus continue.

Les exemples suivants illustrent le chemin le plus rapide entre deux points pour deux itinéraires potentiels. Les trajectoires pondérées en accident sont comparées à des versions non pondérées qui sont optimisées sur la seule base de la distance. Le premier exemple (voir Figure 5) s'étend sur le rond-point Elephant and Castle. L'itinéraire le plus rapide (noir) traverse le centre du rond-point sur un itinéraire qui, au cours de la période 2005-2007, a enregistré 24 accidents de vélo. L'itinéraire pondéré en fonction des accidents (bleu) comptait 8 accidents. Il est à noter qu'il s'agit d'un quartier de Londres qui a une très forte propension aux accidents de vélo.


Un deuxième exemple concerne un itinéraire traversant la Tamise qui oblige le cycliste à emprunter un pont. En général, les ponts du centre de Londres enregistrent un taux d'accidents relativement élevé (voir tableau 4), ce qui n'est pas surprenant compte tenu du volume de trafic qui les traverse [1].

Dans cet exemple (voir Figure 6), l'itinéraire le plus rapide (noir) navigue sur le pont Vauxhall (6 accidents) où la somme de tous les accidents sur le réseau est de 12. L'itinéraire pondéré en fonction de la sécurité traverse l'autre pont de Lambeth (1 accident) sur un route où il y a eu un total de 6 accidents enregistrés.


Une évaluation plus complète des performances de routage a été calculée en créant une matrice de trajets entre plusieurs emplacements d'origine et de destination (OD). Ceux-ci ont été sélectionnés automatiquement en superposant une grille de points stratifiée sur 1000 mètres sur toute l'étendue du Grand Londres. Ces emplacements ont ensuite été ajustés de manière à ce que les OD chevauchent leur segment de route le plus proche, permettant ainsi l'acheminement au sein du réseau de transport. Le chemin le plus court pour les itinéraires pondérés et non pondérés en matière de sécurité a ensuite été calculé pour tous les OD et la fréquence des accidents et la longueur cumulée sur chaque itinéraire ont été calculées. Sur un certain nombre d'itinéraires OD, la somme de la distance et de la somme des accidents est restée la même. Ceux-ci ont été ignorés dans l'analyse suivante car ils se sont produits lorsque l'itinéraire le plus sûr représentait l'itinéraire le plus rapide, par exemple, dans une zone où il n'y a eu aucun accident. Une analyse a été réalisée pour comparer les itinéraires normaux et pondérés en fonction de la sécurité en termes de distance totale parcourue et de la somme des accidents totaux le long de l'itinéraire. Sur les 1 650 095 trajets évalués, 1 599 218 (96,9 %) ont abouti à des itinéraires avec un nombre réduit d'accidents sur les itinéraires les plus rapides. En raison de la manière dont l'algorithme optimise le choix de l'itinéraire, tous les itinéraires optimisés pour la sécurité avaient des distances plus longues. Sur l'ensemble de la matrice OD, cela allait de l'augmentation d'un trajet de moins d'un mètre à 3725 mètres. La valeur médiane sur l'ensemble du réseau était de 436 et un histogramme de la plage totale des longueurs de trajet accrues est illustré à la figure 7. Ainsi, environ 30 % des trajets totaux ont créé une distance de trajet accrue de moins de 100 mètres. Cependant, la majorité des cyclistes à Londres ont des trajets de 8 kilomètres en moyenne [33]. Ainsi, une deuxième analyse a été créée qui a calculé un histogramme supplémentaire pour les OD où le chemin total le plus court était de 8 kilomètres ou moins. Dans cette évaluation plus réaliste des longueurs de trajets cyclistes, la médiane est tombée à 111 mètres et avait la distribution des trajets augmentée comme le montre la figure 8. Dans ces ensembles de trajets plus locaux, environ 70 % des trajets ne sont augmentés que de 100 mètres.



Histogramme de l'augmentation de la longueur de route cyclée en choisissant un itinéraire optimisé pour la sécurité où les trajets les plus directs étaient inférieurs à 8 kilomètres.

5. Discussion et conclusions

Cet article a présenté une analyse des emplacements des accidents de vélo à Londres de 2005 à 2007. Une série de cartes a démontré certains des problèmes lors de la visualisation de données ponctuelles denses pour une grande zone urbaine et a suggéré que grâce à l'utilisation d'une représentation basée sur une grille, ces les problèmes pourraient être atténués. De plus, en liant les données ponctuelles à une rue d'un ensemble de données de réseau, il a été possible de créer d'autres visualisations adaptées à l'examen des schémas d'accidents à l'échelle locale. En utilisant les attributs du réseau routier, une série d'informations sur la nature des lieux d'accidents de vélo a été dérivée. Par exemple, il a été constaté que les accidents de vélo se produisaient principalement sur les voies simples et les routes A. A partir de ces informations, il est possible d'émettre des hypothèses sur les causes probables qui peuvent ensuite être testées par une analyse statistique ou d'étude de cas locale plus rigoureuse. Une base de données a été créée pour Londres qui reliait la fréquence des accidents de vélo à leur localisation sur le réseau routier. À l'aide de cette source d'information, un algorithme de routage de réseau automatisé a été adapté pour prendre en compte la fréquence des accidents au sein d'un trajet proposé. L'itinéraire le plus rapide et un itinéraire pondéré en fonction des accidents entre une série d'origines et de destinations ont été comparés à travers Londres, et il a été constaté que les résultats pondérés en fonction des accidents n'augmentaient pas de manière significative la longueur du trajet, mais fournissaient un itinéraire «plus sûr» basé sur des preuves empiriques. sur la fréquence des lieux d'accident.

Le modèle de routage présenté dans cet article est un pilote et pourrait être développé davantage à l'avenir. Il serait préférable de déployer le modèle sur Internet via un outil de routage en ligne, cependant, cela nécessiterait que les données du réseau sous-jacent soient disponibles pour une utilisation sur Internet sans frais de licence restrictifs, ou, si elles sont dérivées de sources gratuites telles qu'OpenStreemap, ces nécessitent une couverture géographique complète et doivent être structurés de manière adaptée au routage. Il serait également intéressant de comparer la différence entre le modèle développé dans cet article et un autre modèle basé sur des preuves empiriques concernant les risques relatifs induits par différents aménagements ou types d'infrastructures routières. Par exemple, un cycliste pourrait être éloigné de tous les ronds-points très fréquentés si cela était considéré comme un facteur qui augmentait en moyenne la probabilité d'accidents. Bien sûr, il existe une quantité raisonnable de controverses dans la littérature sur les effets spécifiques de types particuliers d'infrastructures. Par conséquent, avant que ces types de modèles puissent être dérivés, une analyse plus complète est nécessaire pour quantifier de manière appropriée ces effets. Les recherches futures réviseront donc ce modèle pour intégrer des informations sur les risques associés à l'infrastructure du réseau de transport et pour créer une application de routage pouvant être déployée en ligne. Enfin, il a été noté qu'il y avait des erreurs potentielles de géocodage présentes dans les données sous-jacentes et que celles-ci justifient une enquête plus approfondie pour examiner le potentiel d'erreur systématique. Par exemple, il serait utile d'examiner les erreurs qui pourraient survenir lors du géocodage des descriptions en anglais d'accidents à des emplacements spécifiques.

Le nombre de cyclistes à Londres augmente, et sans une meilleure information sur l'emplacement et la cause des accidents, le risque de blessures ou de décès augmentera à l'avenir. L'analyse et les modèles présentés dans cet article ont démontré que beaucoup d'intelligence peut être créée en reliant les emplacements bruts d'accidents à des informations de tiers dérivées des ensembles de données du réseau de transport.

Les références

  1. TFL, "Travel in London—key trends and development report number 1", dans Londres, TF, Londres, Royaume-Uni, 2009. Voir sur : Google Scholar
  2. TFL, "Le maire lance la révolution cycliste de Londres avec un été chargé d'événements", dans Londres, TF, Londres, Royaume-Uni, 2009. Voir sur : Google Scholar
  3. J. D. Hunt et J. E. Abraham, « Influences on bicycle use », Transport, vol. 34, non. 4, pp. 453–470, 2007. Afficher sur : Site de l'éditeur | Google Scholar
  4. DFT, « Road accidenties great Britain : 2007 annual report », dans Transport, DFT, Londres, Royaume-Uni, 2008. Voir sur : Google Scholar
  5. P. Gårder, L. Leden et T. Thedພn, « Implications pour la sécurité des pistes cyclables aux intersections à feux », Analyse et prévention des accidents, vol. 26, non. 4, pp. 429-439, 1994. Voir sur : Site de l'éditeur | Google Scholar
  6. Y. Wang et N. L. Nihan, « Estimation du risque de collisions entre vélos et véhicules à moteur aux intersections à feux », Analyse et prévention des accidents, vol. 36, non. 3, pp. 313-321, 2004. Voir sur : Site de l'éditeur | Google Scholar
  7. L. Aultman-Hall, F. L. Hall et B. B. Baetz, « Analyse des itinéraires de banlieue à vélo à l'aide de systèmes d'information géographique : implications pour la planification du vélo » Dossier de recherche sur les transports, non. 1578, pp. 102-110, 1997. Voir sur : Google Scholar
  8. E. Eilert-Petersson et L. Schelp, « Une étude épidémiologique des blessures liées au vélo », Analyse et prévention des accidents, vol. 29, non. 3, pp. 363-372, 1997. Voir sur : Google Scholar
  9. L. Aultman-Hall et M. G. Kaltenecker, « Taux de sécurité des navetteurs à vélo à Toronto », Analyse et prévention des accidents, vol. 31, non. 6, pp. 675-686, 1999. Voir sur : Google Scholar
  10. M. Rasanen et H. Summala, « Ajustements des automobilistes aux cyclistes aux ronds-points », Facteurs humains liés au transport, vol. 2, non. 1, pp. 1-17, 2000. Voir sur : Google Scholar
  11. T. Hels et I. Orozova-Bekkevold, « L'effet des caractéristiques de conception des ronds-points sur le taux d'accidents des cyclistes », Analyse et prévention des accidents, vol. 39, non. 2, pp. 300–307, 2007. Afficher sur : Site de l'éditeur | Google Scholar
  12. P. Gårder, L. Leden et U. Pulkkinen, « Mesurer l'effet de sécurité des passages à niveau surélevés à vélo à l'aide d'une nouvelle méthodologie de recherche », Dossier de recherche sur les transports, non. 1636, pp. 64-70, 1998. Voir sur : Google Scholar
  13. M. Stone et J. Broughton, « Descendre de votre vélo : accidents de cyclisme en Grande-Bretagne en 1990� », Analyse et prévention des accidents, vol. 35, non. 4, pp. 549-556, 2003. Voir sur : Site de l'éditeur | Google Scholar
  14. R. B. Noland et M. A. Quddus, « Congestion and safety : a spatial analysis of London », Recherche sur les transports, partie A, vol. 39, non. 7-9, pp. 737-754, 2005. Voir sur : Site de l'éditeur | Google Scholar
  15. R. B. Noland et M. A. Quddus, « Une analyse spatialement désagrégée des accidents de la route en Angleterre », Analyse et prévention des accidents, vol. 36, non. 6, pp. 973-984, 2004. Voir sur : Site de l'éditeur | Google Scholar
  16. G. B. Rodgers, « Décès de cyclistes et modèles de risque de mortalité », Analyse et prévention des accidents, vol. 27, non. 2, pp. 215-223, 1995. Voir sur : Google Scholar
  17. B. W. Landis, V. R. Vattikuti et M. T. Brannick, « Perceptions humaines en temps réel : vers un niveau de service à vélo » Dossier de recherche sur les transports, non. 1578, pp. 119-131, 1997. Voir sur : Google Scholar
  18. M. Hillman et D. Morgan, À vélo vers la santé & la sécurité, BMJ Books, Londres, Royaume-Uni, 1992.
  19. P. Hopkinson et M. Wardman, « Evaluation de la demande de nouvelles installations cyclables », Politique des transports, vol. 3, non. 4, pp. 241-249, 1996. Voir sur : Site de l'éditeur | Google Scholar
  20. M. Møller et T. Hels, « Perception du risque par les cyclistes dans les ronds-points », Analyse et prévention des accidents, vol. 40, non. 3, pp. 1055-1062, 2008. Voir sur : Site de l'éditeur | Google Scholar
  21. G. Vandenbulcke, I. Thomas, B. de Geus et al., « Cartographier l'utilisation du vélo et le risque d'accidents pour les navetteurs qui se rendent au travail à vélo en Belgique », Politique des transports, vol. 16, non. 2, pp. 77-87, 2009. Afficher sur : Site de l'éditeur | Google Scholar
  22. ROSPA, Accidents de cyclisme�its et chiffres—Mars 2009, The Royal Society for the Prevention of Accidents, Birmingham, Royaume-Uni, 2009.
  23. J. Adams, Risque, UCL Press, Londres, Royaume-Uni, 1995.
  24. P.A. Longley, M.F. Goodchild, D.J. Maguire et D.W. Rhind, Systèmes d'information géographique et science, John Wiley & Sons, Chichester, Royaume-Uni, 2e édition, 2005.
  25. M. Dodge, M. Mcderby et M. Turner, Visualisation géographique : concepts, outils et applications, John Wiley &# x26 Sons, Chichester, Royaume-Uni, 2008.
  26. T. Anderson, « Comparaison des méthodes spatiales pour mesurer les accidents de la route “hotspots” : une étude de cas de Londres », Journal des cartes, vol. 2007, pp. 55-63, 2007. Voir sur : Google Scholar
  27. S. Openshaw, Le problème de l'unité de surface modifiable, Geo Books, Norwich, Royaume-Uni, 1984.
  28. M. Tranmer et D. G. Steel, « Utilisation des données de recensement pour enquêter sur les causes du sophisme écologique », Environnement et planification A, vol. 30, non. 5, pp. 817-831, 1998. Voir sur : Google Scholar
  29. M. McCarthy et K. Gilbert, « Cyclist road deaths in London 1985� : drivers, vehicle, manœuvres andbless, » Analyse et prévention des accidents, vol. 28, non. 2, pp. 275-279, 1996. Voir sur : Site de l'éditeur | Google Scholar
  30. T. Hyodo, N. Suzuki et K.Takahashi, « Modélisation du comportement de choix d'itinéraires cyclables et de destination pour le plan de réseau routier cyclable », Dossier de recherche sur les transports, non. 1705, pp. 70-76, 2000. Voir sur : Google Scholar
  31. M. A. Stinson et C. R. Bhat, « Choix de l'itinéraire des cyclistes de banlieue : analyse à l'aide d'une enquête sur les préférences déclarées », Dossier de recherche sur les transports, non. 1828, pp. 107-115, 2003. Voir sur : Google Scholar
  32. E. W. Dijkstra, « Une note sur deux problèmes liés aux graphiques », Mathématiques numériques, vol. 1, non. 1, pp. 269-271, 1959. Voir sur : Site de l'éditeur | Google Scholar | Zentralblatt MATH | MathSciNet
  33. TFL, Note d'enquête Thames Gateway Bridge&# x2014Durée des voyages à vélo à Londres, Transport for London, Londres, Royaume-Uni, 2006.

Droits d'auteur

Copyright © 2011 Alex D. Singleton et Daniel J. Lewis. Il s'agit d'un article en libre accès distribué sous la licence Creative Commons Attribution, qui permet une utilisation, une distribution et une reproduction sans restriction sur n'importe quel support, à condition que l'œuvre originale soit correctement citée.


Résultats

Définition de l'intériorité je

La figure 1 illustre les forces liées aux modèles morphologiques d'une ville façonnés par les dispositions infrastructurelles et socio-économiques. Pour le cas d'une grille carrée, comme le montre la figure 1a, les itinéraires les plus courts entre deux points à une distance r soit correspondent trivialement à la ligne les reliant directement, soit sont des chemins dégénérés qui traversent la grille dans les deux sens. Faire la moyenne des trajets multiples annule tout biais directionnel par rapport au centre de la grille. Pourtant, une petite perturbation de cette régularité peut changer considérablement cette caractéristique neutre, comme le montre la figure 1b, où nous décalons les quatre points les plus externes vers l'intérieur pour les placer sur le deuxième anneau à partir du centre. Les points situés sur cet anneau ont les routes les plus courtes qui se trouvent le long de la périphérie, introduisant ainsi une force de dispersion loin du centre (marquée par des flèches bleues). Sur la figure 1c, nous perturbons davantage la topologie en ajoutant quatre lignes de l'anneau externe à l'anneau interne (marquées en vert) augmentant ainsi la connectivité vers le centre. Les chemins les plus courts entre les paires sur l'anneau extérieur traversent l'anneau intérieur et sont incurvés vers le centre-ville, ce qui entraîne une force d'attraction (représentée par des flèches rouges). Au-delà de ce simple exemple, qui est principalement fonction de la topologie et s'applique aux chemins les plus courts, d'autres facteurs sont en jeu tels que le temps de trajet et la vitesse de l'itinéraire tels qu'ils sont considérés dans la réf. 24 , qui affectera nécessairement les modèles observés dans les chemins les plus rapides. De plus, l'illustration suppose un seul centre de gravité, pour ainsi dire, alors qu'un tel effet peut se manifester à plusieurs échelles, entraînant l'annulation de toute force mesurable vers un centre-ville putatif.

Forces de polarisation trouvées dans la morphologie urbaine. Trois dispositions schématiques de rues urbaines partagent une structure topologique similaire, mais des dispositions géométriques différentes entraînant des dynamiques variables. une Une structure de grille où les chemins les plus courts entre des points de même rayon ne montrent aucun biais directionnel. b Des forces de répulsion par rapport à l'origine (marquées en bleu) apparaissent lorsque nous brisons la symétrie de la grille en déplaçant les quatre points extérieurs sur la ligne annulaire intérieure équidistante. Les chemins situés sur cet anneau ont désormais les chemins les plus courts qui traversent la périphérie et évitent le centre. c Perturber davantage la topologie en augmentant la connectivité au centre (marqué par quatre lignes vertes) conduit désormais aux chemins les plus courts qui traversent le centre comme si une force d'attraction était présente (marqué en rouge)

Pour saisir si un tel effet se manifeste à l'échelle de la ville, ou est bien neutre en raison du « désaccord » à plus petite échelle, nous définissons une métrique appelée l'inness je. La figure 2c illustre comment un itinéraire typique entre n'importe quelle paire origine-destination (OD) peut être divisé en segments qui sont orientés directionnellement vers ou loin du centre-ville tel que mesuré par rapport à la distance géodésique s entre la paire. Nous étiquetons les points situés plus près du centre que les points intérieurs géodésiques tandis que ceux situés plus loin sont les points extérieurs. Par exemple, dans le schéma illustré à la figure 2c, les points situés dans la zone ombrée en rose sont des points intérieurs et ceux du côté opposé (en bleu ombré) sont des points extérieurs. Nous définissons une zone de déplacement interne délimitée par le polygone des points internes et la ligne géodésique, à laquelle nous attribuons un signe positif. A l'inverse, une zone de déplacement externe est définie par la ligne géodésique et l'ensemble des points externes, dont le signe est négatif. Ayant adopté cette convention, je est la différence entre la zone intérieure et les zones de déplacement extérieures :

qui peut être calculé en utilisant la formule du lacet pour les polygones (voir Méthodes). Dans la figure 2d, nous montrons trois idéalisations possibles d'un itinéraire, l'un avec uniquement une zone de déplacement externe (bleu), l'autre avec uniquement une zone de déplacement interne (rouge) et l'autre avec un mélange de zones de déplacement externes et internes (combinaison de bleu et rouge).

Échantillonnage des données et définition de l'intégrité je. une Trente-six paires origine-destination (OD) (espacées de 10°) sont attribuées le long de la circonférence de cercles à une distance de 2, 5, 10, 15, 20 et 30 km du centre-ville C. b Pour chaque paire OD, nous interrogeons l'API Open Source Map et collectons les routes les plus courtes (rouge) et les routes les plus rapides (bleu) (illustrées ici pour une paire OD représentative à Paris). c Une paire OD typique avec la ligne droite les reliant représentant la distance géodésique s r est la distance radiale du centre et θ est la séparation angulaire par rapport au centre. Nous définissons l'intérieur (je) correspond à la différence entre la zone de déplacement interne (polygone délimité par un point interne rouge et une ligne droite) et la zone de déplacement externe (polygone délimité par un point externe bleu et une ligne droite). Trois configurations de route possibles entre plusieurs paires OD. Une avec une zone de déplacement exclusivement extérieure (bleu), une avec une zone de déplacement exclusivement intérieure (rouge) et une où il y a une combinaison des deux

L'intérieur d'un nœud dans le réseau routier est le résultat de l'agrégation des caractéristiques de tous les itinéraires possibles qui passent par ce point. En effet, il reflète la structure du réseau puisqu'il s'agit d'une métrique influencée par la topologie et la connectivité du réseau. Cependant, en plus de cela, il capture les aspects géométriques du réseau car il s'agit d'une mesure basée sur la courbure des routes le long d'un itinéraire et code des informations structurelles à la fois aux échelles globale et locale. En ce sens, on peut considérer qu'il contient des éléments de diverses métriques de réseau structurel standard (voir la note complémentaire 2 pour plus de détails et une comparaison avec une série de métriques de réseau). Nous notons que de telles métriques, en particulier celles qui sont des mesures globales telles que la centralité de l'intermédiarité, ont déjà été utilisées pour classer les villes. Des résultats récents jettent cependant un doute sur l'efficacité des mesures de centralité pour distinguer les villes 35 . D'autre part, comme nous le démontrerons, l'inness, en plus d'être une mesure relativement simple, encode les aspects géométriques, infrastructurels, géographiques et socio-économiques des systèmes urbains.

Inness moyen pour les itinéraires les plus courts et les plus rapides

Nous commençons notre analyse par un examen des tendances qualitatives des je. Dans la Fig. 3a–f, nous traçons l'inness moyen (leftlangle I ight angle) (moyenne sur les 92 villes) pour les itinéraires les plus courts (courbe verte) et les plus rapides (courbe violette) comme un fonction de la séparation angulaire θ, pour plusieurs rayons r. Dans les environs du centre-ville à environ 2 à 5 km (Fig. 3a, b), nous voyons une tendance neutre pour les itinéraires les plus courts (left( ight )) bien que les fluctuations augmentent avec la séparation angulaire (80° ≤ θ 160°). Les fluctuations anticipent un biais vers l'intérieur clair qui émerge à une distance de r ≥ 10 km (Fig. 3c–f), visible comme un pic positif prononcé dans (leftlangle I ight angle) qui s'accentue progressivement avec l'augmentation r. La tendance qualitative de (leftlangle I ight angle) est révélatrice de la présence d'une structure de réseau routier cœur-périphérie présente à des degrés divers dans toutes les villes 36 et suggère que les forces d'attraction présentées dans la figure 1 ont tendance à se manifester à l'échelle de la ville entière, indiquant l'existence d'un centre effectif (en moyenne). En effet, pour fixe r, la distance géodésique s entre n'importe quelle paire OD est une fonction monotone croissante dans θ. Plus la distance est longue, plus il est probable que l'itinéraire dérive vers le centre, en raison d'une plus grande connectivité au centre par rapport à la périphérie. Ceci est une explication possible du biais intérieur observé et indique une densité de rues de plus en plus faible en périphérie.

L'intérieur moyen dans 92 villes. La moyenne et l'écart type de je en tant que fonction de θ montré pour plusieurs rayons r mesuré depuis le centre-ville une 2km, b 5km, c 10km, 15km, e 20 km, et F 30 km. La courbe de l'itinéraire le plus court est représentée en vert et l'itinéraire le plus rapide en violet. Le tracé de densité de (leftlangle I ight angle) en fonction de r et θ pour les trajets les plus courts g et les itinéraires les plus rapides h. L'intérieur normalisé ou sans dimension (leftlangle ight angle = leftlangle <>>s^2> ight angle) pour le plus court je et les itinéraires les plus rapides j. k Rapport de l'épaisseur normalisée des routes les plus rapides (leftlangle ight angle _< m f>) et les plus courtes (leftlangle ight angle _< m s>)

Les routes de notre ensemble de données sont organisées de manière hiérarchique et comprennent les autoroutes, les routes principales et principales au sommet de la hiérarchie et les routes résidentielles et de service aux niveaux inférieurs (Fig. 2 supplémentaire). Les chemins les plus courts considérés jusqu'à présent sont principalement composés de routes secondaires et résidentielles (Fig. 3 supplémentaire). directions telles que les autoroutes et les autoroutes (Fig. 4 supplémentaire). Cette hétérogénéité de la capacité routière est vouée à introduire des différences dans les profils intérieurs des itinéraires les plus courts et les plus rapides. Reflétant cela, on voit émerger un biais vers l'intérieur pour les itinéraires rapides autour de 10 km, mais nettement moins prononcé que celui observé pour les itinéraires les plus courts, bien que la tendance qualitative à l'augmentation du biais vers l'intérieur avec r est maintenu. Le biais plus faible vers l'intérieur des itinéraires plus rapides peut s'expliquer par le fait que les autoroutes sont généralement situées en périphérie des villes. De plus, la plage angulaire du biais vers l'intérieur observé est inférieure à celle observée pour les chemins les plus courts (45° ≤ θ ≤ 120°) et les fluctuations sont nettement plus importantes. Ceci est révélateur de la distribution spatiale hétérogène des profils de vitesse dans les routes principales à travers les villes (en raison des niveaux variables d'infrastructure), associée au fait qu'elles sont en général plus longues que les routes secondaires.

Les dépendances angulaires et radiales collectives de (leftlangle I ight angle) sont représentées sous forme de diagrammes de densité pour les routes les plus courtes et les plus rapides sur la figure 3g, h. L'augmentation monotone de (leftlangle I ight angle) avec r se manifeste dans les deux cas, en particulier à r

15 km (également indiqué explicitement dans la Fig. 5a supplémentaire). Les différences de dépendance angulaire peuvent être clairement observées avec les routes les plus rapides ayant un (leftlangle I ight angle) à une plage angulaire inférieure à celle des chemins les plus courts. Notable est l'absence de tout biais vers l'extérieur (valeurs négatives de (leftlangle I ight angle) ) à n'importe quelle plage radiale ou angulaire.

Intérieur sans dimension (hat I_<>^<>)

Les tendances observées de l'intérieur ne prennent pas en compte les effets des différentes zones de déplacement à différentes distances du centre, ou la variation de la taille urbaine à travers les villes étudiées. Pour tenir compte de ces effets, nous notons que la zone de déplacement (moyenne des villes) augmente à peu près quadratiquement avec la distance géodésique s (Fig. 5k supplémentaire), une tendance également observée dans la réf. 23 où les formes caractéristiques des itinéraires urbains avaient des zones de déplacement de O(s 2 ). Par conséquent, pour tenir compte de tout biais provenant des variations de la zone de déplacement au sein et entre les villes, nous définissons une inness rééchelonnée

Dans la figure 3i, j, nous traçons (leftlangle hat I ight angle) pour les itinéraires les plus courts et les plus rapides, constatant que l'effet d'inness est robuste aux biais potentiels dus à la longueur ou à la zone des trajets. Alors que le comportement qualitatif est similaire à celui observé pour (leftlangle I ight angle) , la tendance vers l'intérieur des routes est présente sur un plus large r et θ pour les trajets les plus courts et les plus rapides. Par exemple, des biais vers l'intérieur sont apparents à des distances de 5 km du centre-ville, un effet supprimé dans (leftlangle I ight angle) en raison de la zone de déplacement correspondante plus petite. De plus, nous trouvons maintenant une distribution relativement plus homogène avec une dépendance comparativement plus faible sur r et θ. La tendance pour (leftlangle hat I ight angle) continue de soutenir une structure moyenne centre-périphérie dans les villes que nous étudions (et donc un centre-ville), en combinaison avec une distribution de densité décroissante des rues loin de ce centre. La dépendance angulaire plus faible, en particulier, laisse présager une variation isotrope de la densité des carrefours.

La distribution de (leftlangle hat I ight angle) est comparativement moins homogène pour les itinéraires les plus rapides, principalement en raison de la prédominance des routes à grande capacité (Fig. 2 supplémentaire), ajoutant, par conséquent, plus de variation à le profil intérieur. À travers un large éventail de r et θ, (leftlangle hat I ight angle) est généralement inférieur aux routes les plus courtes, alors qu'il y a une forte augmentation à 15 ≤ r 30 et 40 ≤ θ ≤ 100. Cela est probablement dû au fait que certaines des autoroutes sont des structures spécialisées telles que des rocades ou des contournements qui servent d'attracteurs pour le trafic dans la périphérie de la ville. Ceci est confirmé en traçant le rapport (leftlangle ight angle _< m f>leftlangle ight angle _< m s>) dans la Fig. 3k, où l'on voit un facteur de deux ou plus de biais vers l'intérieur dans les itinéraires les plus rapides par rapport aux itinéraires les plus courts près du périphérie de la ville (

Répartition Inness pour les villes individuelles

Après avoir examiné les propriétés des biais directionnels moyens dans les zones urbaines, nous tournons maintenant notre attention vers les modèles dans les villes individuelles. En effet, comme le montrent les fluctuations des figures 3a–f, il existe une variabilité dans le modèle d'intérieur entre les villes, reflétant les différences de niveau de hiérarchie et d'organisation des routes. La composition des itinéraires les plus courts et les plus rapides en termes de hiérarchies routières différentes varie considérablement d'une ville à l'autre. Par exemple, dans certaines villes (Atlanta, Houston, Madrid), les itinéraires les plus rapides ont tendance à emprunter des autoroutes, tandis que dans d'autres (Luanda, Kolkata et Pune), ils ont tendance à être composés de routes principales (Fig. 4 supplémentaire). susceptibles d'affecter leurs profils d'inness respectifs.

Pour étudier l'effet de ces différences, nous traçons chaque ville en fonction de l'écart type et de la moyenne de (hat I_<>^<>) pour les chemins les plus courts (Fig. 4a–c). La plupart des villes se situent dans la plage (0.0 le leftlangle ight angle le 0.08) avec quelques valeurs aberrantes à la fois positives et négatives. En ignorant les valeurs aberrantes pour le moment, grosso modo, nous identifions trois régions : moyenne faible et écart type faible (LL), moyenne faible et écart type élevé (LH) et moyenne élevée et écart type élevé (HH). (Voir les figures supplémentaires 6 et 7 et la note supplémentaire 5 pour plus de détails sur les villes individuelles et aberrantes.) Chaque ville est également colorée selon trois métriques reflétant les caractéristiques infrastructurelles et géographiques : en 4a, nous montrons la longueur totale des routes à moins de 30 km de le centre-ville sur la figure 4b, nous montrons une mesure des contraintes géographiques (GC) qui capture la présence et la taille des barrières telles que les rivières, les côtes, les montagnes ou les installations industrielles enfin sur la figure 4c, nous montrons une mesure de la connectivité périphérique agissant comme un proxy pour la présence de rocades dans la ville (détails pour chaque métrique dans la note supplémentaire 4). Sur la figure 4d–f, nous montrons une sélection de villes de chaque région, ainsi que le graphique de densité de (hat I) d'une ville représentative représentée en encart.

Les statistiques et la distribution spatiale de l'intérieur pour les villes individuelles. L'écart type tracé en fonction de l'intérieur moyen pour chaque ville. Les villes sont divisées en trois groupes par leur valeur de moyenne et d'écart type d'inness Low-Low (LL), Low-High (LH), High-High (HH). La couleur des points indique la longueur de la route une, le niveau de contrainte géographique (GC) b, et une mesure de la connectivité périphérique c. Nous agrandissons trois zones marquées LL, LH et HH et étiquetons les villes explicitement dans F ainsi que l'affichage en médaillon (hat I) , pour les villes représentatives de chaque région (Berlin, Mumbai, Kolkata). Dans g, h, et je nous traçons la distribution spatiale de (hat I) projetée sur les cartes physiques pour les trois villes représentatives. La couleur des carrefours correspond à la moyenne (hat I) de tous les itinéraires passant par le carrefour, avec des valeurs dans l'intervalle (- 0.3 le hat I le 0.3) et va du bleu au rouge avec croissant (hat I)

Il semble que les villes de chaque région ont tendance à partager certaines caractéristiques communes en ce qui concerne ces métriques et leurs profils d'inness. Ceux du groupe LL ont tendance à avoir une longueur totale de routes plus longue, moins de contraintes géographiques et une forte connectivité périphérique, indiquant des niveaux élevés de développement des infrastructures. Le profil intérieur est généralement neutre (comme on peut le voir pour Berlin), indiquant aucun centre discernable de la ville vers lequel les routes sont tracées. D'un autre côté, les villes du groupe HH ont tendance à avoir des routes plus courtes, une connectivité limitée en périphérie (indiquant des niveaux de développement des infrastructures relativement plus faibles) et plus de contraintes géographiques que le groupe LL. Ces villes ont également un profil d'inness nettement positif (indiqué pour Kolkata) suggérant que la navigabilité de la ville passe par un noyau central. Le groupe LH semble présenter une combinaison de valeurs élevées et faibles en termes de métriques d'infrastructure, tout en se distinguant par des contraintes géographiques nettement plus élevées que les villes des autres régions. Cela se reflète dans un profil d'intérieur assez particulier qui se manifeste positivement à courte distance, mais est négatif à plus longue distance.

Pour approfondir ces tendances, nous traçons la distribution spatiale de (hat I) sur une carte géographique d'une ville représentative de chaque région. La distribution spatiale est générée en considérant chaque point intermédiaire d'un itinéraire urbain et en calculant la moyenne (hat I) de tous les itinéraires qui passent par cet endroit particulier. En figue.4g, nous montrons la distribution spatiale de (hat I) pour Berlin. Dans toute une partie de Berlin, nous trouvons une distribution homogène d'inness modérément positive (presque neutre) (rouge), avec des routes près de la limite de la ville montrant une valeur d'inness marginalement négative (bleu). Des schémas similaires sont observés dans d'autres grandes agglomérations urbaines telles que Tokyo et Paris (Fig. 10a, c). Dans l'ensemble, ces villes sont de vastes zones urbaines dotées d'infrastructures avancées et de niveaux élevés de connectivité.

Ensuite, nous nous concentrons sur le groupe de villes LH, celles avec un mélange de biais entrant et sortant dans les schémas d'itinéraire. Sur la figure 4h, nous montrons le profil spatial de Mumbai qui affiche deux régions distinctes avec un biais interne et externe. Les deux régions sont séparées par la mer d'Arabie et reliées par (quelques) ponts. Le côté gauche de la carte correspond à la partie la plus densément connectée de Mumbai (son centre économique), ainsi la plupart des itinéraires dans cette région ont un biais vers l'intérieur. L'apparition du biais vers l'extérieur dans l'autre région est due au manque de connectivité directe avec le centre économique, car les itinéraires doivent passer par l'un des rares ponts qui relient l'île au continent et sont donc soumis à des détours considérables. Un schéma similaire est observé dans d'autres villes de ce groupe, qui ont presque toutes des barrières géographiques (rivières, mers, collines, montagnes) qui s'étendent à travers la ville ou divisent la ville en régions distinctes. De plus, il y a des villes dans ce groupe sans barrières géographiques, mais avec des barrières artificielles attribuant un effet similaire sur les profils d'itinéraires. Un exemple notable de ceci est Miami qui possède un important site industriel d'extraction de roche dans le comté de Miami-Dade occidental (voir Fig. 10e, g supplémentaire pour cet exemple et d'autres).

Enfin, nous examinons la distribution spatiale de (hat I) pour Calcutta en tant que ville de la catégorie HH, illustrée à la figure 4i. Il est évident que le profil est plus distinct que celui observé pour Berlin. Il existe un motif de type hub et rayons avec des rayons présentant des niveaux élevés d'intérieur, probablement en raison de sa fonction reliant les régions extérieures au centre-ville. En effet, un centre-ville clair est apparent avec peu ou pas de connexions à travers la périphérie. Une tendance similaire est observée pour les autres villes de ce groupe (Le Caire, Medan, Supplementary Fig. 10i, k). Il y a au moins deux causes possibles à cela : soit ces villes ont une surface urbaine effective relativement plus petite (régions à forte connectivité), soit ce sont de grandes agglomérations urbaines avec des infrastructures limitées ou sous-développées.

Différences entre les itinéraires les plus courts et les plus rapides dans les villes

La connexion mesurée des profils d'inness avec les indicateurs d'infrastructure suggère que plus d'informations peuvent être glanées en étudiant les différences entre les itinéraires les plus courts et les plus rapides. En effet, alors que le premier est plus lié aux contraintes spatiales et géographiques, le second partage un lien plus naturel avec les indicateurs de développement. Pour mieux quantifier cette différence, nous mesurons le coefficient de corrélation de Pearson ρ entre (leftlangle ight angle _< m f>) et (leftlangle ight angle _< m s>) , pour chaque ville, représentée sur la figure 5e par ordre croissant des valeurs négatives aux valeurs positives. Les lignes verticales en pointillés sont les résultats de l'utilisation K-moyens clustering et optimisation des ruptures naturelles de Jenks pour diviser les villes en trois groupes, les deux méthodes produisant des divisions presque identiques. (D'autres approches de clustering ont révélé des résultats similaires, voir la note supplémentaire 6.)

Différence entre les itinéraires les plus courts et les itinéraires les plus rapides. Itinéraires les plus courts une et les itinéraires les plus rapides b pour Berlin. Itinéraires les plus courts c et les itinéraires les plus rapides pour Bombay. Les encarts montrent les tracés de densité de (hat I) avec la même plage que dans la Fig. 4. e Coefficient de corrélation de Pearson ρ entre les schémas intérieurs des itinéraires les plus courts et les plus rapides pour chaque ville. Les villes sont classées en trois groupes (marqués par des lignes pointillées verticales) sur la base d'un K-Moyens clustering et optimisation des ruptures naturelles de Jenks, conditionnés à leur niveau de corrélation ρ. Les noms des villes de chaque type sont répertoriés dans la note supplémentaire 6. Trois indices socio-économiques, indice de productivité F, Indice de développement des infrastructures g, et PIB par habitant h, sont tracés en fonction de ρ montrant une tendance claire et monotone à la baisse. Les points sont des moyennes sur les villes regroupées par intervalles de 0,2, et les barres représentent l'erreur standard

Pour étudier cette partition, nous choisissons une ville représentative à chaque extrémité du spectre : Berlin avec ρ < 0 et Mumbai avec ρ ≈ 1. Les figures 5a, b montrent la distribution spatiale de (hat I_<>^<>) à Berlin pour les itinéraires les plus courts et les plus rapides. Contrairement à l'intérieur neutre observé pour les itinéraires les plus courts, les itinéraires les plus rapides affichent un fort biais vers l'extérieur à partir d'une distance radiale de 15 km, ce qui semble être une conséquence des artères en anneau dispersant le trafic loin du centre. En effet, cela soutient notre métaphore des forces concurrentes esquissée dans la figure 1. vers l'extérieur. Une tendance similaire est observée pour toutes les villes avec une corrélation négative (Tokyo et Paris illustrés dans la Fig. 10a-d supplémentaire), avec la présence de rocades artérielles (construites vraisemblablement pour réduire la congestion) près de la périphérie de la ville étant le principal moteur de la différences (conformément aux valeurs plus élevées de connectivité périphérique mesurées précédemment). Une majorité de ces villes, qui sont membres de la partition de type I, correspondent à celles vues dans le groupe LL de la figure 4d.

Contrairement à Berlin, Mumbai présente des profils d'inness pratiquement identiques entre les itinéraires les plus courts et les plus rapides, comme le montrent les figures 5c, d, avec moins d'artères ou de contournements qui peuvent détourner le trafic du centre-ville. Dans le cas de Mumbai, cela est dû à des contraintes géographiques importantes, mais une tendance similaire est également observée dans d'autres villes comme Kolkata, qui manquent également de routes périphériques. Ainsi, les villes qui souffrent d'une sorte de contrainte géographique ou d'infrastructures relativement sous-développées ont tendance à montrer une corrélation plus élevée entre les deux types d'itinéraires. Ces villes de la partition de type III comprennent la majorité des villes du groupe HH et quelques-unes des groupes LH sur la figure 4.

Les villes avec une corrélation intermédiaire dans la partition de type II ont tendance à être celles avec un profil observé dans le groupe LH sur la figure 4. Le comportement observé ici semble être une combinaison de ce qui motive les tendances observées dans les villes de type I et de type III. Il se trouve cependant qu'il y a le cas exceptionnel de New York. La ville partage les mêmes caractéristiques que les villes de type I, c'est-à-dire qu'il s'agit d'une grande zone urbaine, avec une infrastructure très développée, mais il semble y avoir une forte corrélation entre les itinéraires les plus rapides et les plus courts (Fig. 14 supplémentaire). Cela est probablement dû à la géographie unique des autoroutes dans la zone urbaine métropolitaine de New York, qui, contrairement aux villes typiques de type I, n'a pas d'autoroutes en anneau en périphérie. Au lieu de cela, New York se compose d'une série d'autoroutes radiales et en forme de grille dont l'effet global est d'annuler tout biais directionnel observable.

Les niveaux avancés d'infrastructure se traduisent généralement par des améliorations à travers une variété d'indices socio-économiques. Pour examiner si le comportement mesuré de l'inness saisit tout cela, nous considérons trois indicateurs socio-économiques : l'indice de productivité provenant de l'indice de prospérité de la ville (IPC) créé par l'ONU (http://cpi.unhabitat.org/download -raw-data), l'indice de développement des infrastructures (également issu de l'IPC) et enfin le PIB par habitant issu de https://www.lloyds.com/cityriskindex/locations. Sur la figure 5f–h, nous traçons ces métriques en fonction du coefficient de corrélation ρ qui a été utilisé pour regrouper les villes. Dans les trois cas, il y a une nette diminution monotone des indicateurs avec l'augmentation ρ, suggérant que l'inness code également des informations sur le développement socio-économique. Un schéma relativement clair se dégage selon lequel la majorité des villes de type I sont de grandes agglomérations urbaines dotées d'infrastructures avancées et d'indicateurs socio-économiques solides, les villes de type III ont dans l'ensemble un développement infrastructurel et socio-économique relativement limité, et enfin les villes de type II partagent une combinaison de ces fonctionnalités.


Résultats et conclusions

Nous présentons ici le résultat de l'analyse du réseau de transport multimodal de la région du Grand Tokyo en utilisant les méthodes ci-dessus. Parce que notre analyse est principalement exploratoire, nous nous efforçons de décrire en détail les caractéristiques révélées des modèles d'utilisation du système de transport. Bien que notre objectif ici ne soit pas d'effectuer des micro-simulations de trafic et de recréer un flux de trafic précis, nous effectuons une comparaison limitée de l'utilisation révélée avec des données empiriques pour vérifier la validité apparente de nos méthodes. Nous couvrons ensuite certaines implications et interprétations de ces résultats dans la section Conclusions ci-dessous.

Fréquence d'utilisation du bord

Tout d'abord, nous examinons les fréquences d'utilisation des bordures présentées à la figure 8 et au tableau 3 (en pourcentage, les comptes d'utilisation sont disponibles dans le fichier supplémentaire 1). Bien que l'utilisation des bords soit moins informative pour les modèles d'utilisation des modes que le temps passé (tableau 4) et la distance parcourue (tableau 5), elle est plus informative pour les modèles géographiques et certaines statistiques d'utilisation telles que les transferts et les liaisons d'accès. Notez le degré extrêmement élevé de similitude entre les colonnes de données to-work et from-work. Il y a des différences, et nous les explorons plus tard, mais en pratique nous pouvons les considérer comme équivalentes.

Une carte de la région de Tokyo montrant la solution de flux trouvée par l'algorithme du simplexe à l'aide d'un échantillon d'un million de personnes/emplois (en haut) et la fréquence d'utilisation des périphéries parmi 300 000 déplacements générés pour se rendre au travail (en bas - carte des déplacements inversés disponible dans le fichier 1). Pour attirer l'attention sur les couloirs très fréquentés, nous avons filtré les tronçons avec moins de 100 trajets dans ces diagrammes (mais pas dans notre analyse). Notez que les bords allant dans chaque direction pour chaque paire de nœuds se chevauchent, et même à 0,3 opacité, une partie de la différence de couleur peut être due à l'ordre z. Tuiles de carte par Stamen Design (2019), données cartographiques par OpenStreetMap (OpenStreetMap Contributors 2019).

Les résultats de trajet générés de manière stochastique sont également assez similaires aux résultats de l'algorithme du simplexe, mais ici, les différences d'utilisation révèlent des différences importantes entre les deux méthodes. Par exemple, l'algorithme simplex a utilisé 480 (0,007%) liaisons de transfert de bus, tandis que les trajets générés ont généré 1744 (0,019%). Pour les deux systèmes, l'utilisation du transfert de bus est le type de liaison le plus faible, mais les trajets générés sont presque trois fois plus susceptibles d'utiliser un transfert de bus. L'algorithme simplex utilise également deux fois plus de liens hexagonaux et 5% de liens de connexion supplémentaires (les deux sont plus utiles pour les déplacements à courte distance). Pour compenser, les trajets générés stochastiquement utilisent 3% de liaisons ferroviaires en plus et 6% de liaisons routières supplémentaires. En termes de nombre de liaisons, le réseau routier domine à environ 40%, mais comme nous le verrons, cela ne se traduit pas par un débit élevé car la longueur moyenne des liaisons du réseau routier est courte.

Modèles d'utilisation des modes

Selon le Enquête nationale sur les caractéristiques du trafic urbain, en utilisant des données de trajet agrégées dans les trois plus grandes villes du Japon, 26 % des trajets en semaine ont utilisé le train comme mode de déplacement principal, 2,7 % ont utilisé le bus, 33 % ont utilisé une voiture, 16,8 % un vélo et 21,5 % ont utilisé la marche ou d'autres moyens ( Ministère des Terres 2010b). Parce que cela ne reflète que le mode de transport principal (et pas tous les modes de transport en cours de route), et combine tous les motifs de déplacement (non isolés pour se déplacer entre le domicile et le travail), les données ne sont pas une comparaison idéale pour nos résultats ou nos fins . Cependant, comme mentionné précédemment, la disponibilité des données au Japon est extrêmement limitée par rapport à d'autres pays développés (Kawasaki 2015), nous devons donc nous débrouiller avec ce que nous avons.

Nous pouvons évaluer l'utilité d'un lien ou d'un mode en utilisant le temps passé et la distance parcourue à travers ce lien ou ce mode. L'une des raisons pour lesquelles cela est meilleur que les nombres/pourcentages d'utilisation de périphérie est que dans un réseau multimodal, l'hétérogénéité de la distance de liaison, de la vitesse et de la connectivité est beaucoup plus grande par rapport à un mode unique. Le tableau 4 montre le pourcentage du temps de déplacement total utilisé par chaque mode de transport tandis que le tableau 5 fait de même pour les distances.

Sur la base des rapports du temps total et de la distance totale utilisés, nous pouvons faire quelques inférences sur les caractéristiques moyennes des modes. Les liens hexagonaux et de connexion, ainsi que les liens d'accès et de transfert, sont des moyens lents mais nécessaires pour connecter les modes de transport les plus efficaces. Ils représentent donc un petit pourcentage pour la plupart des déplacements, mais font partie de chaque déplacement. Le principal résultat ici est que le train + la route représentent près de 66% du temps mais plus de 94% de la distance parcourue, avec d'autres liaisons (plus lentes) comblant les fissures pour fournir un accès transmodal et un accès aux emplacements locaux. Les bus représentent un pourcentage étonnamment faible du temps et de la distance. Bien que les taux générés correspondent aux données de l'enquête indiquant que seulement 2,7% des déplacements domicile-travail utilisent un bus comme mode principal, nous nous attendons à voir des bus utilisés dans un rôle de soutien (par exemple, du domicile à la gare). Nous revenons sur ce point ci-dessous.

Les différences entre les tableaux 3, 4 et 5 révèlent comment l'hétérogénéité des modes affecte les résultats. Par exemple, bien que les déplacements routiers représentent respectivement 36 % ou 43 % des tronçons pour les déplacements simplex et générés, ils ne représentent que 16 % et 18 % du temps utilisé (valeurs similaires pour la distance). Les liens hexagonaux et de liaison sont tous courts (≤250m) et parcourus à vitesse de marche, ils représentent donc 38% des liens, mais 29% du temps et 5% de la distance pour le flux simplex. Pour les flux de déplacements générés, ces liaisons piétonnes vont de 28% des bords à 18% du temps et 3% de la distance. Dans l'ensemble, ces résultats soulignent l'importance des poids de bord temporels et physiques lors de l'analyse des réseaux de transport géographiquement intégrés. Les modèles qui font abstraction de ces détails pour mesurer plus simplement les propriétés de la structure du réseau manquent cet aspect clé de l'analyse du réseau de transport.

Transferts en bus

Comme mentionné précédemment, les liaisons de transfert de bus sont les moins utilisées pour les deux méthodes. Une des raisons à cela est le faible niveau global d'utilisation du bus (1% des liaisons pour le simplex, 0,7% pour les trajets générés), mais même en considérant que les correspondances sont sous-représentées. Les liaisons d'accès en bus ont été utilisées 35 280 et 30 900 fois par les méthodes de simplex et de trajet généré respectivement, ce qui implique 17 640 et 15 450 trajets en bus. Cela signifie que seulement 2,72 % des trajets en bus impliquaient des transferts pour le simplex et 11,29 % pour les trajets générés. En fait, les transferts en bus sont plutôt rares dans le système de transport en commun de Tokyo, car les bus sont généralement utilisés pour relier des zones reculées à la gare la plus proche ou pour relier des gares/emplacements distants via des bus express. Ainsi, la plupart des transferts en bus se feraient dans les gares, et à partir de ces points, l'utilisation d'un train est généralement plus rapide. Bien que nous ne disposions pas encore de données concrètes sur les taux de transfert en bus pour faire une comparaison quantitative (uniquement des rapports et des preuves anecdotiques), nous considérons ce faible taux de transferts en bus comme un point de validation modéré pour les méthodes utilisées ici.

Sous-utilisation des bus

Bien que de faibles pourcentages de transfert en bus soient attendus, nous nous attendions à des taux d'utilisation des bus plus élevés dans l'ensemble. Les bus sont sous-représentés par les deux méthodes, et pour la même raison. Les bus utilisent le réseau routier mais ont un coût de temps de chargement et de déchargement. Ainsi, comme notre analyse actuelle ne porte que sur l'efficacité temporelle, l'utilisation directe du réseau routier sera plus rapide que l'utilisation du réseau de bus pour le même trajet. Les deux exceptions à cette règle sont (1) lorsque le réseau routier inclus est trop clairsemé car les routes sont plus petites que le tertiaire et (2) les bus express qui circulent sur les autoroutes qui sont également exclus de notre réseau routier actuel. Bien sûr, tout le monde n'a pas sa propre voiture (moins de la moitié des ménages de Tokyo possèdent un véhicule Automobile Inspection & Registration Information Association (2017)), et la principale raison d'utiliser un bus plutôt qu'un taxi est le coût plutôt que le temps. Les travaux futurs qui incluent les coûts financiers en plus des coûts de temps généreront probablement des modèles d'utilisation des autobus plus réalistes. Cependant, l'analyse du réseau multimodal confirme ce que l'on sait déjà : si l'argent et le stationnement ne sont pas un problème, alors la conduite est presque toujours préférée au bus.

Durée et mode du trajet domicile-travail

Comme mentionné précédemment, l'un des avantages de la méthode des trajets générés est qu'elle fournit des données riches concernant les modes utilisés le long d'un itinéraire ainsi que les distances et les temps de trajet totaux. Le temps de parcours total moyen pour nos trajets générés est de 64 min (le max est de 223 et le min est de 1,95 min). Selon une enquête NHK de 2015, le temps moyen de trajet aller simple pour les personnes travaillant dans la région du Grand Tokyo est de 51 minutes (NHK Culture Research Institute 2015). Bien que ce soit quelque peu inférieur à ce que nous trouvons, le temps de trajet modal (en tranches de 10 min) est de 60 à 69 min (20,6 %), de sorte que la méthode de déplacement générée produit également des déplacements raisonnables à cet égard. Notre valeur moyenne peut être plus élevée en raison de paires domicile-travail peu pratiques, ou peut-être parce que les données de l'enquête incluaient des emplois de type non bureautique. Les personnes travaillant dans (par exemple) des magasins et des restaurants sont plus susceptibles de travailler plus près de chez elles. D'après la même enquête (NHK Culture Research Institute 2015), 85,2 % des employés de bureau ont déclaré se déplacer en train. Cela se compare avantageusement à notre conclusion selon laquelle 88,5% des voyages générés contenaient une composante de train. Si nous pouvons obtenir des résultats plus précis de cette enquête et d'autres concernant l'utilisation empirique des modes de navettage, le temps, la distance, etc., nous pouvons effectuer une comparaison plus rigoureuse des distributions pour valider les résultats et calibrer des fonctions de génération de déplacements plus sophistiquées.

Facteurs de détermination de l'utilisation des liens

Ici, nous étudions si des caractéristiques de lien particulières les rendent plus susceptibles d'être traversées dans les expériences de simplex ou de voyage généré. Il est clair que le principal facteur déterminant est d'avoir une localisation entre la population et les pôles d'emploi, mais au-delà, il semble raisonnable que des liaisons qui couvrent plus de distance en moins de temps soient préférentiellement utilisées. Le tableau 6 montre la corrélation de Pearson entre la fréquence d'utilisation des bords et la vitesse, la distance et le temps de traversée pour l'ensemble du réseau et trois modes de transport principaux (c'est-à-dire à l'exclusion des liaisons de connexion et hexagonales, ces dernières étant toutes identiques en distance et en temps).

Intuitivement, les trains sont utilisés car ils constituent un moyen de transport rapide et efficace, ce qui signifie que nous devrions nous attendre à ce que les trains express dominent l'utilisation des trains et que les trains locaux soient beaucoup moins courants. Considérant l'ensemble du réseau de transport, les liaisons plus rapides et plus longues sont en effet préférentiellement utilisées par les deux méthodes. Pour les trajets générés, cela s'applique aux trains (0,163), mais pour la méthode simplex, les trains plus rapides ne sont pas corrélés avec la fréquence (0,051) même si des liaisons plus longues (qui sont pour la plupart des trains express) sont quelque peu préférentiellement utilisées (0,127).

Vraisemblablement, les trajets en bus plus longs ne sont pas beaucoup plus rapides que les trajets en bus plus courts car ils sont limités par les conditions de circulation et la limite de vitesse. la vitesse n'est pas corrélée. Par conséquent, des temps de trajet plus longs en bus sont également corrélés pour les deux méthodes. Bien qu'aucune caractéristique routière ne soit sensiblement corrélée à l'utilisation, la distance et le temps de parcours ont des corrélations faibles et négatives, ce qui indique que les routes sont plus souvent utilisées pour des trajets plus courts (par exemple, aller de la maison à la gare ou conduire directement là où l'utilisation des trains serait trop sinueuse ).

D'après la figure 8 des deux flux générés, il apparaît que les liens entrant dans le cœur ont les poids les plus importants. Cependant, nous constatons que parmi les liens réellement utilisés, les liens au sein du cœur lui-même ne sont pas aussi fortement utilisés que les routes situées de manière intermédiaire. Plus précisément, la corrélation entre la distance du centre d'un bord à la gare de Tokyo est légèrement négativement corrélée avec sa fréquence d'utilisation (simplex : -0,175 trajets générés : -0,12). Une explication est que les destinations au sein du cœur sont variées et que le réseau est le plus dense dans cette zone, dissipant ainsi le trafic sur de nombreux bords. En revanche, les itinéraires de banlieue circulant vers et depuis le centre sont plus clairsemés et concentrent ainsi l'utilisation sur quelques itinéraires principaux. Même s'il est certainement vrai que les liaisons les plus fréquentées sont ces liaisons pendulaires, nous constatons que la tendance est plus générale. Les liaisons périphériques (au-delà des banlieues) sont les plus courantes et les moins utilisées, mais les trains de banlieue éloignent suffisamment les gros usagers du centre-ville.

Caractéristiques du voyage

Une analyse plus approfondie des données de trajet générées révèle/confirme quelques modèles d'utilisation supplémentaires. Le tableau 7 résume quelques relations d'intérêt clés. Pour les quatre principaux modes de transport (hors accès et liaisons de raccordement), on peut constater la différence entre la longueur de bordure moyenne du réseau complet par rapport à la longueur de bordure moyenne utilisée dans les déplacements générés. Naturellement, les liaisons hexagonales sont inchangées car toutes les liaisons hexagonales ont une longueur de 250 m, mais les liaisons en train et en bus sont plus longues et les liaisons routières sont plus courtes. De plus, les liaisons ferroviaires étant près du double de la longueur moyenne révèlent que les trains express (avec des longueurs de liaison 2 à 5 fois plus longues que les trains locaux) sont utilisés, mais pas par une prépondérance des déplacements. Les trains du centre-ville n'ont souvent pas de lignes express et c'est là que se déroule la plupart des trajets en train.

Les liaisons de bus utilisées sont 15 fois plus longues que la moyenne des liaisons de bus, indiquant que les bus sont presque exclusivement utilisés pour les services express. Comme déjà discuté, pour les distances plus courtes, le réseau routier est plus rapide, et bien sûr, nous constatons que les routes sont utilisées pour l'accès local car les liaisons routières utilisées sont encore plus courtes que les liaisons routières moyennes. Malgré la concentration sur les liaisons longue distance, l'utilisation du bus représente moins de la distance totale (1,5%) que même les liaisons hexagonales (1,6%). L'utilisation des liaisons hexagonales et routières est inversement corrélée à la longueur totale du trajet, tandis que l'utilisation du train est positivement corrélée.

Pour mesurer l'efficacité de l'itinéraire, nous mesurons le circuit de chaque trajet en tant que rapport entre la distance parcourue et la distance euclidienne (Huang et Levinson 2015 Lee et al. 2015). Nous trouvons que les trajets au travail ont un circuit maximum de 6,82 (autour de la baie de Tokyo), une moyenne de 1,28 et une valeur minimale de 1 (il existe au moins un trajet entre des hexagones voisins). Une plus grande utilisation des trains est négativement corrélée à l'inefficacité des itinéraires (−0,214). Bien que les trains soient rapides, il faut faire tout son possible pour aller et venir des gares pour les utiliser, ce qui conduit intuitivement à un plus grand circuit. Plutôt que d'indiquer que les voyages en train sont moins sinueux, cela nous dit que les trains sont utilisés plus souvent dans les cas où ils sont moins sinueux (vraisemblablement, les routes sont utilisées lorsque les itinéraires de train sont trop sinueux).

En plus des détails ci-dessus, nous constatons également que 18,29% des trajets utilisent des liens hexagonaux zéro, ce qui signifie qu'ils ont pu utiliser des liens de connexion pour atteindre un nœud de transport directement depuis l'hex de domicile et vers l'hex de travail. Dans seulement 0,05 % des déplacements, seuls des liens hexadécimaux ont été utilisés, ce qui indique que pour 1 personne sur 2000 se rendre directement au travail à pied est en fait le mode de déplacement le plus rapide. Bien qu'au moins une liaison ferroviaire ait été utilisée dans 88,54 % des trajets, seulement 3,1 % n'utilisaient que des trains et des hexagones, ce qui indique que les trajets vers et depuis les gares reposent sur d'autres modes (par exemple, l'utilisation des routes pour atteindre la gare). En revanche, 96,53 % des déplacements utilisaient des liaisons routières et 10,27 % utilisaient uniquement des liaisons routières (et hexagonales). Cinq pour cent des trajets utilisaient des liaisons par bus, mais seulement 0,05 % utilisaient des bus sans liaison ferroviaire ou automobile (même pourcentage que les liaisons hexagonales). Les résultats des déplacements générés nous indiquent que les déplacements efficaces vers et depuis le travail sont vraiment multimodaux, mais avec seulement 2,82 % des déplacements utilisant les quatre principaux modes de transport, la meilleure combinaison de modes est hautement contextuelle.

Trajets générés vers vs depuis

Nous avons d'abord été surpris que pour un peu moins d'un tiers des trajets (96 219 sur 300 000), un chemin différent ait été emprunté vers et depuis la même paire de points. Rappelez-vous le tableau 3 des fréquences d'utilisation des bords, bien qu'il existe clairement un degré élevé de similitude, il existe également des différences marquées (voir également les cartes montrant les poids de fréquence dans chaque direction dans le fichier supplémentaire 1). Cela peut ne pas sembler surprenant sur un réseau dirigé, mais presque tous les liens sont réciproques et pondérés symétriquement. Pour les liaisons pondérées de manière asymétrique, telles que les liaisons de chargement/déchargement de bus et de train, le temps de trajet total serait toujours symétrique car il existe une liaison de chargement et de déchargement de chaque côté d'un trajet en train ou en bus.

La cause du grand nombre de trajets aller-retour non identiques est que nous avons utilisé l'algorithme de chemin de Dijkstra à source unique et qu'il ne renvoie qu'un seul chemin parmi peut-être plusieurs chemins de temps de trajet équivalents. En prévision de cela, nous avons préféré trouver tous les chemins et pondérer les comptes par le nombre de chemins (comme cela est généralement fait pour les calculs d'intermédiarité), mais nous n'avons pas pu le faire en raison des exigences de temps de calcul (plus de 20 fois plus longues). En effet, dans tous les cas où les allers et retours prenaient des chemins différents, le temps qu'il prenait était toujours identique. Ceci est particulièrement un problème sur la partie grille hexagonale du réseau où de nombreux chemins distincts de longueur et de temps équivalents peuvent être trouvés. Lorsque nous filtrons les trajets sur lesquels un nombre différent de liaisons ferroviaires, routières ou routières a été utilisé, le nombre de trajets aller-retour non identiques se réduit à 7856.

Pour le pire des cas de différence de distance à parcourir, le trajet pour se rendre au travail a parcouru 75 km (65 km en train) pour atteindre un travail à 43 km. Le voyage de retour n'a utilisé que 16 km de rail, mais 21 km de liaisons par bus pour une distance totale de 52 km. Les deux voyages ont duré exactement le même temps. La plus grande différence dans le nombre de pas se produit entre une paire distante de 18 km. Le trajet domicile-travail utilisait majoritairement des liaisons routières (68 sur 90 étaient des bords de route), tandis que le trajet retour utilisait 18 liaisons routières et 7 liaisons ferroviaires sur un total de 41 liaisons. Aucun bus n'a été utilisé dans les deux sens. Les liaisons routières relient les intersections tandis que les liaisons ferroviaires relient les gares, qui sont plus éloignées les unes des autres. La distance totale parcourue ne différait que de 1,7 km, de sorte que la différence souligne à nouveau l'importance des mesures géographiquement ancrées en termes de distances et de temps plutôt que de caractéristiques structurelles du réseau. Les différences entre les trajets aller et retour, ou plutôt l'existence de plusieurs chemins équivalents entre les points, seront largement améliorées avec une fonction de génération de trajets plus sophistiquée qui inclut les coûts, les pénalités de transfert, les distances minimales par mode et d'autres aspects.

Vraisemblance du chemin

Comme décrit ci-dessus, les proportions d'utilisation de chaque mode sont très similaires entre les méthodes de déplacement simplex et générées stochastiquement, même lorsqu'elles sont mesurées en temps utilisé ou en distance parcourue. Les explications des différences fournies ci-dessus mettent en évidence un compromis entre les avantages informatiques de l'algorithme du simplexe et la richesse des données et l'intuitivité de la génération de trajets O-D. On pose ici une bonne raison de privilégier la méthode des trajets générés stochastiquement qui regroupe les différents résultats ci-dessus : les chemins générés sont plus crédibles.

La figure 9 montre les liens utilisés par chaque mode pour les deux méthodes concentrées jusqu'au centre de Tokyo et filtrées pour n'afficher que les contours utilisés au moins 10 fois (cartes complètes avec tous les liens disponibles dans le fichier supplémentaire 1). L'hypothèse implicite de la méthode du simplexe selon laquelle les gens prennent l'emploi disponible le plus proche de leur domicile se révèle dans le grand nombre de courts trajets en lien hexadécimal uniquement. Plus que cela, l'utilisation de la route, du bus et du train est également plus fragmentée et locale. En revanche, la méthode de voyage générée révèle des modèles d'utilisation qui sont plus organiques, cohérents et suivent un modèle de branchement familier avec des branches partagées et des nœuds feuilles isolés.

Une carte de la région de Tokyo agrandie pour montrer les liens utilisés par mode pour l'algorithme du simplexe (en haut) et les trajets au travail générés (en bas) filtrant les bords avec moins de 10 traversées. Les lignes bleues sont les trains, les vertes les bus, les rouges les routes, les violettes les liaisons interhexagonales et les liaisons piétonnes de connexion sont oranges. Tuiles de carte par Stamen Design (2019), données cartographiques par OpenStreetMap (OpenStreetMap Contributors 2019).

Le problème avec les résultats du simplexe est plus que visuel. Bien qu'il y ait plus de trois fois plus de personnes se déplaçant dans la simulation simplex, la densité des déplacements dans les centres-villes et la variété des lisières utilisées sont nettement moindres. Le tableau 8 montre le nombre de tronçons distincts utilisés par chaque mode de transport. De là, nous pouvons voir que malgré les similitudes dans les fréquences d'utilisation proportionnelles, les temps et les distances, la méthode simplex concentre son utilisation du transport sur beaucoup moins de liaisons.

Bien que les deux méthodes soient des abstractions, la méthode du simplexe est certainement plus abstraite. La méthode du simplexe est appropriée pour les problèmes logistiques, par exemple, trouver le modèle de distribution optimal d'un ensemble d'entrepôts aux clients distribués. Dans le cas du transport pendulaire, une solution efficace n'est pas nécessairement une solution réaliste. La similitude dans les distributions d'utilisation révèle quelque chose d'intéressant sur les modèles d'utilisation de base, mais la plus grande taille de l'échantillon de population/d'emploi ne se traduit pas par un échantillonnage plus grand (ou plus large) du réseau de transport. mais 9 324 179 et 9 323 457 pour les déplacements générés. La différence vient du nombre de trajets courts suffisant pour satisfaire la demande nette locale pour l'algorithme du simplex. Cependant, empiriquement, il existe peu de trajets domicile-travail aussi courts que ceux générés par l'algorithme du simplexe.

Nous avons déjà couvert plusieurs manières d'étendre et d'améliorer la méthode de voyage générée. Même sans ces raffinements, la méthode de déplacement générée se révèle supérieure à la méthode du simplexe du réseau pour capturer les modèles d'utilisation qui reflètent la complexité des réseaux de transport multimodaux intégrés. Peut-être que la méthode du simplexe peut également être affinée et étendue pour produire des résultats plus utiles. Nous avons déjà évoqué la possibilité d'utiliser des niveaux de revenu et de qualité pour mieux faire correspondre les personnes aux emplois. Des considérations supplémentaires pourraient être utilisées pour établir plusieurs distributions à la maison et au travail, et l'agrégation des résultats de l'exécution de l'algorithme du simplexe sur chaque paire de distributions pourrait être calibrée pour produire des modèles d'utilisation plus réalistes.

Comparaison avec les trains les plus bondés

En plus des descriptions exploratoires des résultats et des comparaisons qualitatives avec les modèles de navetteurs plausibles ci-dessus, nous fournissons ici une analyse quantitative de la capacité de nos méthodes à générer des modèles similaires aux modèles empiriques. Le ministère du Territoire, de l'Infrastructure, des Transports et du Tourisme (MLIT) publie un PDF répertoriant les segments de réseau ferroviaire sélectionnés, y compris, mais sans s'y limiter, ceux avec le pourcentage le plus élevé d'utilisation de la capacité pour une heure de fonctionnement donnée (Ministère du Territoire 2018). Les données se concentrent sur les segments dirigés dépassant la capacité plutôt que sur l'achalandage le plus élevé, mais les données incluent l'achalandage de ces trains. Idéalement, nous aurions des valeurs d'achalandage quotidiennes moyennes pour chaque segment, au moins pour les lignes les plus fréquentées, nous permettant de calculer le chevauchement biaisé par les rangs (Webber et al. 2010) une mesure de la similarité des rangs qui favorise les comparaisons de listes de différentes longueurs avec des poids plus lourds pour faire correspondre les segments de rang supérieur. Malheureusement, ces données ne sont pas accessibles au public et nous ne pouvons analyser que les données auxquelles nous avons actuellement accès.

Pour comprendre pourquoi cela est important, considérons l'exemple suivant. Un segment répertorié a une capacité de 2688 et un achalandage de 3130, ce qui en fait 16% de plus de capacité à cette heure particulière de la journée. Un autre segment de ligne a une capacité de 34 040 et une fréquentation de 32 240 en heure de pointe, fonctionnant ainsi à 95 % de sa capacité. Bien que le deuxième train soit moins encombré à son maximum, même aux heures creuses, il transporte environ dix fois plus de trafic que le train le plus encombré. Comme nous ne disposons pas encore de données de capacité hétérogènes pour chaque ligne de train, nous ne pouvons pas faire correspondre les niveaux d'encombrement. Cependant, nous pouvons déterminer l'accord entre le classement du nombre de passagers sur les segments de ligne fournis et nos classements de trafic simulés sur ces mêmes segments de ligne.

Vérification de l'achalandage du segment de ligne

Parmi les segments de ligne sélectionnés par le MLIT, 76 font partie de notre domaine de recherche. Dans un premier temps, nous isolons les segments inclus dans les données empiriques de notre réseau. Nous calculons ensuite le coefficient de corrélation de Pearson entre les données d'achalandage des segments et les valeurs d'usage à partir de simulations limitées aux mêmes segments (Ren et al. 2014). Dans les cas où plusieurs types de lignes circulent entre une paire de stations, nous utilisons la valeur d'utilisation maximale parmi les bords du réseau. Nous calculons la corrélation de Spearman et le Kendall τ pour évaluer dans quelle mesure nos simulations correspondent au classement des segments. Le tableau 9 rapporte les résultats de ces tests de comparaison.

La corrélation de Pearson entre l'achalandage empirique et les quatre niveaux d'utilisation simulés est constamment, quoique faiblement, positive à des niveaux de signification raisonnablement élevés (près du niveau de 0,01). La comparaison des rangs, cependant, montre que l'algorithme du simplexe fonctionne sensiblement moins bien pour faire correspondre les modèles empiriques selon à la fois la corrélation de Spearman et le Kendall τ. L'un des principaux facteurs expliquant la piètre performance d'appariement des rangs est que pour 28 des 76 segments, le flux simplex n'a généré aucun déclenchement. C'est un autre résultat de l'hypothèse non naturelle selon laquelle les gens occupent le travail le plus proche de leur domicile et des schémas de transit non naturels qu'il génère.

Les trajets O-D générés vers le travail et depuis le travail atteignent des niveaux de corrélation similaires pour les données de trajet du matin. La raison en est les segments particuliers choisis par le MLIT dont la majorité sont situés dans ou à proximité du noyau central plutôt que le long des lignes de banlieue. Une fois suffisamment proches de la région centrale à forte densité d'emplois, les trains sont en effet bondés dans les deux sens en raison de personnes (par exemple) vivant à l'ouest de la ville mais travaillant du côté est du noyau et vice versa. En effet, sur les 76 segments rapportés par le MLIT, il y a 9 lignes à deux segments et 1 ligne à trois segments. Dans les données empiriques, il existe des exemples de lignes allant dans des directions opposées avec une fréquentation comparable.

Compte tenu des hypothèses simplificatrices formulées dans la génération du réseau et de la rigueur du test d'appariement de l'achalandage sur seulement 76 des 10 536 segments, le niveau de concordance entre nos simulations et les données empiriques est déjà raisonnablement élevé. Surtout à la lumière du fait que dans nos simulations, les voyages en bus et en taxi sont également des options concurrentes. En ajoutant des données sur les temps de transfert et d'accès hétérogènes, les limitations d'horaires (par exemple, les itinéraires en soirée uniquement) et un compromis coût/temps dans la planification des itinéraires, nous prévoyons d'améliorer encore la précision. Bien que ces ajouts doivent être conservés pour des travaux futurs (une fois que nous aurons pu obtenir les données), nous pouvons maintenant faire quelque chose pour élargir notre évaluation : tester des lignes entières au lieu de segments spécifiques.

Vérification de l'achalandage de toute la ligne

Dans l'analyse suivante, nous extrapolons les données de segment empiriques aux lignes et comparons le trafic simulé agrégé par ligne en utilisant à la fois la moyenne et le maximum. Les données du MLIT ne couvrent qu'un infime pourcentage des segments de ligne (0,72%), mais elles incluent au moins un segment d'environ la moitié des lignes de la région de Tokyo (65 des 131 lignes, sans distinction par type). Douze segments empiriques apparaissent sur des lignes partagées, donc pour extrapoler la valeur pour chaque ligne, nous prenons d'abord la moyenne des valeurs d'achalandage des segments pour chaque ligne. Nous isolons ensuite ces 65 lignes présentes dans les données empiriques de nos données simulées. Nous agrégeons ensuite les données d'utilisation simulées pour ces lignes en tant que valeur moyenne de tous les segments de cette ligne (y compris tous les types de trains de cette ligne). Enfin, nous effectuons les mêmes tests statistiques que ci-dessus pour déterminer le niveau de similarité des résultats. Le tableau 10 montre les résultats de la comparaison des valeurs moyennes d'achalandage le long de chaque ligne aux valeurs empiriques moyennes pour cette ligne.

Comme prévu, la comparaison de l'agrégat sur toute la ligne à l'utilisation de la ligne extrapolée améliore la précision résultante dans la plupart des cas (seule la corrélation de Pearson de l'algorithme du simplexe est plus faible). La corrélation de Spearman des déplacements domicile-travail générés dépasse 0,45, tandis que les déplacements domicile-travail sont légèrement inférieurs. Ces résultats utilisant l'utilisation moyenne sur chaque ligne justifient encore plus les trajets O-D générés de manière stochastique.

Cela dit, les données empiriques sont rapportées pour l'heure la plus chargée des segments de ligne inclus. Étant donné que la capacité d'une ligne donnée est en grande partie (mais pas entièrement) constante dans le temps, il s'agit également des valeurs d'achalandage maximales pour cette ligne. Au cours d'une heure donnée, l'achalandage d'un train est fortement corrélé entre les segments d'un itinéraire. L'achalandage de l'ensemble de la ligne est donc assez bien représenté par les données de segment dont nous disposons, notamment en termes de rangs. Ainsi, au lieu d'utiliser la moyenne pour extrapoler et agréger les valeurs sur toute la ligne, nous examinons maintenant les valeurs maximales. Pour les données simulées, chaque ligne se voit attribuer la valeur du lien avec l'utilisation la plus élevée. Le tableau 11 montre que la précision de la correspondance est encore améliorée en utilisant les valeurs maximales par rapport aux valeurs moyennes.

Les corrélations de Spearman sont légèrement inférieures à 0,60 pour les déplacements générés de manière stochastique, bien qu'encore inférieures à 0,40 pour la méthode simplex. Compte tenu des limites de la construction de notre modèle de transport, des méthodes utilisées pour générer des trajets OD et de notre objectif de recréer des schémas quotidiens globaux plutôt que des micro-simulations de trafic spécifiques au temps, ce résultat représente une forte relation entre nos niveaux d'achalandage prédits et les données empiriques. classement de l'achalandage des lignes de train.

Pour que les niveaux d'achalandage maximum correspondent bien mieux que l'achalandage au niveau du segment, cela implique qu'un segment différent de la ligne reçoit une utilisation plus élevée dans les données simulées.Cette différence résulte probablement d'une combinaison des simplifications utilisées pour créer notre modèle actuel et de la portée limitée des données empiriques disponibles. Bien que le niveau de précision actuel ne soit pas assez précis pour être utilisé pour les décisions de politique ou de routage, les résultats sont très encourageants pour la précision, y compris nos extensions prévues.

Limites du test de vérification

Une limite évidente de cette analyse est qu'elle ne compare que les volumes de trafic sur le réseau ferroviaire. À l'avenir, nous prévoyons/espérons avoir accès à des données agrégées de type GPS sur les mouvements des personnes qui couvriraient tous les modes de transport (même à pied) et nous permettraient de mieux calibrer et vérifier les flux du modèle. Une autre limitation est la rareté des données empiriques, les données ne contiennent que l'achalandage pour 76 des 10 536 bords de train. Un ensemble de données plus important peut ne pas révéler une meilleure précision, mais ce serait un test de précision plus robuste. Une autre limitation est que les données ne rapportent que l'achalandage pendant son heure de pointe plutôt qu'un total pour une journée, bien que nous nous attendions à ce qu'ils soient fortement corrélés au moins pour les classements. Étant donné que nous analysons les trajets domicile-travail et que la majeure partie de ce trafic se produit pendant la pointe du matin, cette limitation n'est probablement pas problématique pour notre analyse de classement. Cependant, cette limitation deviendra problématique lorsque nous incluons les déplacements à d'autres fins telles que les courses, les trajets domicile-travail, etc. sur une journée entière.

Flux de réseau et mobilité urbaine

Dans notre réseau de transport entièrement intégré, il y a 32 composants faiblement connectés, mais le plus grand composant contient 99,965% des nœuds, le deuxième plus grand compte 63 nœuds et les 30 autres en ont moins de 10 (îles le long des frontières déchiquetées). Le sous-graphe simplex a 9862 composants faiblement connectés, le composant dominant n'a que 106 149 de ses 178 793 nœuds, de nombreux composants ont plusieurs centaines ou milliers de nœuds et la plupart des composants ont moins de 10 nœuds. En revanche, la méthode des trajets générés a généré un seul composant faiblement connecté contenant 169 220 nœuds. L'aspect connecté du réseau de trajets généré facilite des mesures supplémentaires incorporant des caractéristiques de réseau et des connexions aux données géographiques sous-jacentes stockées dans les nœuds hexadécimaux. Nous omettons une analyse de nos mesures d'accessibilité géosocio-économique (par exemple, les personnes atteignables et les emplois pondérés par la distance), mais nous relions ici nos résultats à des questions plus larges de mobilité.

En utilisant le même réseau de transport multimodal utilisé pour examiner les flux agrégés de navetteurs, nous pouvons également examiner les propriétés de mobilité de la région. Considérez les deux mesures de mobilité suivantes : portée pondérée et point le plus accessible. Portée pondérée ou alors accessibilité est une mesure d'accessibilité (Levinson 2012 Biazzo et al. 2018) qui compte, pour chaque nœud hexadécimal je, le nombre d'autres hexagones j joignable de je, pondérée par l'inverse du temps pour atteindre j:

dans lequel tje est le temps le plus court à partir de l'hex je ensorceler j. Pour l'analyse actuelle, nous limitons la portée aux hexagones accessibles dans les 20 minutes. Nous déterminons également la distance d'Haversine jusqu'à l'hexagone le plus éloigné accessible dans les mêmes 20 minutes. La figure 10 montre les valeurs des deux mesures pour chaque hexagone de la région de Tokyo.

Une carte de la région de Tokyo montrant l'accessibilité en 20 minutes (en haut) et la distance du point le plus éloigné (en mètres, en bas) accessible en 20 minutes. Certains emplacements situés dans des zones à faible accessibilité peuvent atteindre de longues distances, par exemple ceux situés à proximité des gares de trains de banlieue. Tuiles de carte par Stamen Design (2019), données cartographiques par OpenStreetMap Contributors (2019)

Ces deux mesures offrent des fenêtres distinctes sur la mobilité : la portée pondérée est une mesure de largeur alors que la distance la plus éloignée est une mesure de profondeur. Dans le cas des déplacements domicile-travail, on peut principalement se soucier d'un seul itinéraire de votre domicile de banlieue à votre bureau du centre-ville et une chose similaire peut être dite pour les quartiers commerçants et autres activités. Il peut être plus important d'avoir une grande distance accessible, et nous observons les valeurs les plus élevées autour des gares de banlieue et des emplacements éloignés. La portée pondérée montre plutôt un modèle aligné sur le réseau routier, qui est évidemment plus apte aux déplacements omnidirectionnels que le système ferroviaire. Certaines zones (comme Shiroi au nord-est du centre de Tokyo) ont une mobilité très élevée dans un sens (distance la plus éloignée), mais une faible mobilité dans l'autre (portée).

Notez que le centre de Tokyo n'a pas de mobilité particulièrement élevée selon l'une ou l'autre mesure. C'est le cas de la version avec coupure de 20 minutes, car la plupart des trains du centre de Tokyo sont locaux et l'accent est davantage mis sur la couverture que sur les vitesses de traversée. Cependant, étant donné que les lignes de banlieue qui offrent une grande mobilité vers les zones suburbaines se terminent près du centre-ville, l'extension de la coupure à 45 ou 60 minutes modifie la répartition des points chauds vers le centre. Cependant, la divergence entre la mobilité en profondeur privilégiant le train et la mobilité en largeur privilégiant la route demeure à toutes les échelles.

Résumé des résultats

Notre analyse exploratoire des flux de personnes vers les emplois a produit plusieurs découvertes intéressantes de modèles dans le réseau de transport multimodal de la région du Grand Tokyo. Nous décrivons plusieurs « faits stylisés » concernant le résultat des simulations pour faciliter les comparaisons qualitatives et une compréhension plus large du système de transport multimodal de la région de Tokyo, suivis d'un test de vérification quantitative limité à l'aide de données sur l'achalandage des trains. Ces résultats servent de tremplin à de futurs travaux pour affiner les méthodes de génération de déplacements et calibrer autant que possible les rares données disponibles.

Nous avons également produit des résultats qui servent de carburant pour comparer les déplacements O-D générés de manière stochastique à la méthode simplex du réseau pour générer des flux appropriés pour une analyse globale comme la nôtre. Les deux méthodes produisent des résultats similaires en termes de contours les plus utilisés et de pourcentages de trafic sur chaque mode, mais elles produisent des chemins très différents. Dans les deux cas, les bus étaient sous-utilisés car ils sont largement redondants par rapport au réseau routier plus rapide, à l'exception des bus express. Le réseau routier permet un accès plus rapide aux localités éloignées des gares pour aider à désengorger les gares le long des lignes de train à haut débit. Dans l'ensemble, nous constatons que les déplacements générés sont plus réalistes et correspondent mieux aux données empiriques que les résultats du flux simplex. Nous examinons ensuite quelques implications de ces résultats.

Résumé des conclusions

C'est une distinction importante (et qui mérite d'être répétée) que notre analyse n'est pas destinée à suivre les itinéraires de navettage réels des individus, à prédire la congestion ou à refléter les fluctuations à court terme de la localisation des individus (Cherdarchuk 2014). Nous nous intéressons aux modèles persistants de flux et reflux du capital humain et économique. Les niveaux de flux socio-économique dans notre analyse sont des quantités abstraites représentant le mouvement global et soutenu du capital social à travers une ville. Plutôt qu'une proposition qu'un individu qui vit dans l'hex une est susceptible d'avoir un emploi dans l'hexagone b, les distributions des lieux de résidence et de travail représentent des sources et des puits de capital humain et financier plus abstraits. Les modèles d'utilisation révélés sont censés être une approximation du flux potentiel global basé sur le réseau de personnes vers et depuis le travail.

L'algorithme du réseau simplex trouve l'affectation la plus rapide des personnes aux emplois, mais il est évident que peu de personnes travaillent réellement dans l'emploi le plus proche de leur domicile. Une grande variété de conditions, de circonstances et d'événements historiques déterminent à la fois le domicile et le lieu de travail, de sorte qu'ils sont liés, mais leur relation n'est pas évidente, hétérogène et inaccessible pour nous. La méthode de déplacement généré est donc plus réaliste dans ce sens, mais nos méthodes actuelles doivent encore inclure des mécanismes pour refléter le fait que les gens choisissent leur lieu de résidence en fonction de leur lieu de travail et vice-versa. Ce sont des abstractions différentes des mouvements de personnes du domicile aux lieux de travail pondérées par les probabilités de tels mouvements.

Travail futur

Le texte ci-dessus traite déjà de plusieurs améliorations et extensions prévues des méthodes de génération de flux et de l'étalonnage/validation. Nous détaillons légèrement ces points dans cette section.

L'un de nos principaux intérêts est une analyse approfondie de la mobilité et de l'accessibilité. En plus de l'accessibilité décrite ci-dessus, nous mesurons également le nombre pondéré dans le temps de personnes et d'emplois accessibles à partir d'un emplacement. Ces mesures convertissent les types de résultats de mobilité ci-dessus en résultats d'accessibilité socioéconomique. Nous avons prévu d'étudier la relation entre la sociabilité et l'opportunité économique pour mieux comprendre le rôle des « centres d'affaires » et les différencier d'autres endroits avec des scores de sociabilité élevés. En comparant les résultats entre les régions géographiques, nous espérons déterminer si les modèles socio-économiques sont des phénomènes récurrents et auto-organisés ou des phénomènes dépendants de l'échelle et de la trajectoire. Tout comme le score de sociabilité peut être utilisé pour évaluer l'accessibilité d'un lieu à d'autres personnes et lieux, le score d'opportunité économique indique l'accès d'un lieu à l'emploi et aux ressources économiques. Cet indice, et sa corrélation avec d'autres facteurs tels que le revenu et les prix des logements, est susceptible de révéler des informations utiles à de nombreuses fins pratiques et théoriques. Pour des considérations d'espace et de temps, cette partie du projet actuel est laissée à des travaux futurs.

Comme mentionné dans la section des données, il y a quelques caractéristiques de nos données qui affaiblissent la force de nos résultats. Le principal d'entre eux est le manque d'autoroutes à partir des données routières. Une autre préoccupation est la nature déconnectée du réseau routier lorsque l'on considère uniquement les routes tertiaires ou plus grandes, bien que cela soit largement atténué par les réseaux hexagonaux et piétonniers, ces liens peuvent déprimer artificiellement la contribution au débit du réseau routier. Nos données de temps de traversée des liaisons de train et de bus sont actuellement basées sur un échantillon des horaires de chaque ligne. Bien que très cohérents, il existe des différences dans la durée et la disponibilité de la traversée tout au long de la journée. Notre analyse actuelle est censée être un flux agrégé à travers les méthodes de transport généralement disponibles, mais des données plus affinées pour les systèmes de train et de bus du Japon pourraient permettre une analyse qui dépend de l'heure de la journée (Ayed et al. 2011 Cherdarchuk 2014 Idri et al. 2017 Biazzo et al. 2018).

De toute évidence, le temps de déplacement n'est pas le seul facteur que les gens prennent en compte lorsqu'ils décident du mode de transport. Nous travaillons également à inclure des données sur les coûts de transport, la congestion/l'encombrement, la disponibilité du stationnement, etc. ainsi qu'une fonction de coût multi-objectifs pour la détermination du chemin (Abdelghany et Mahmassani 2001). Comme nos objectifs sont toujours la découverte de modèles agrégés plutôt que la planification des transports en commun ou la planification d'itinéraires en fonction du temps, nous pouvons chevaucher la frontière entre les méthodes abstraites (comme celles utilisées ici) et les règles très détaillées basées sur les agents dans les micro-simulations de trafic. Nous pouvons également examiner la distance parcourue et l'énergie utilisée pour explorer l'impact environnemental de différentes méthodes de déplacement. Les préférences et les prix des logements sont déterminés par de nombreux facteurs connexes, et nous prévoyons de déterminer dans quelle mesure l'accessibilité des transports influence le choix et la demande de logement/d'emploi (Hatta et Ohkawara 1993). Avec des réseaux de transport multimodaux détaillés et de riches ensembles de données de divers facteurs socioéconomiques et géographiques à travers le Japon, nous attendons avec impatience des recherches et des collaborations fructueuses en cours.


Informations sur l'auteur

Ces auteurs ont contribué à parts égales : M. M. Vazifeh, P. Santi.

Affiliations

Laboratoire Senseable City, Massachusetts Institute of Technology, Cambridge, MA, États-Unis

M. M. Vazifeh, P. Santi et C. Ratti

Istituto di Informatica e Telematica del CNR, Pise, Italie

Département de Mathématiques, Cornell University, Ithaca, NY, USA

Cornell Tech, New York, NY, États-Unis

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Contributions

P.S. défini le problème, conçu la solution et les algorithmes, et contribué à l'analyse et à la rédaction de l'article. M.M.V. conçu et réalisé l'analyse, développé des modèles et des simulations et rédigé l'article. G.R. contribué à la conception de l'algorithme, mis en œuvre les algorithmes et aidé à l'analyse. S.H.S. contribué à l'écriture. C.R. a supervisé les recherches et contribué à la rédaction.

Auteur correspondant


Conclusion

La fusion des métriques de réseau et géographiques offre la possibilité d'augmenter les mesures de similarité du réseau ainsi que de combler les lacunes cruciales en matière de données sur l'efficacité, l'accessibilité, la connectivité et les politiques des transports. Alors que la plupart des applications de l'apprentissage automatique aux réseaux de transport visent la prévision du trafic, l'efficacité des flux, le réacheminement et la robustesse, nous nous intéressons particulièrement à l'accessibilité des transports publics. L'identification des zones sous et sur desservies peut aider à prendre des décisions politiques, y compris la planification des infrastructures et le développement de logements. De plus, nous espérons que la fusion de mesures géographiques et de réseau pour marquer les zones en fonction de la commodité et de la dépendance de divers modes de transport peut éclairer les décisions concernant les services de localisation (tels que la recherche d'appartements, le covoiturage et le positionnement de nouveaux magasins).

Nous avons constaté que les mesures standard de la structure du réseau ne fournissent pas un aperçu particulièrement utile des caractéristiques d'accessibilité des réseaux de transport. Bien que les réseaux de train, d'autobus et de route présentent des différences constantes d'un endroit à l'autre, ces différences structurelles ne se traduisent pas par des différences dans l'utilité des modes de transport. C'est-à-dire jusqu'où on peut aller dans un certain laps de temps, combien d'endroits peuvent être atteints et combien de personnes peuvent être desservies sont des mesures évidentes d'utilité, mais ces mesures (et les grappes qu'elles produisent) ne correspondent pas bien avec toutes les caractéristiques structurelles de ces réseaux. Au contraire, la vitesse, la variété et les destinations des liaisons ont le plus grand impact. En tenant compte de cela, nous reconsidérerons les mesures de réseau incluses dans nos futures analyses et, espérons-le, trouverons de nouvelles façons de les incorporer pour révéler des caractéristiques plus utiles.

Nous reconnaissons également la possibilité d'examiner les réseaux de trains, de bus et de routes sans la grille hexagonale afin que les mesures des analyses précédentes puissent potentiellement être appliquées. Nous pourrions ensuite mélanger ces mesures monomodes pour le regroupement et la comparaison de régions. Bien que cela soit raisonnable pour le réseau ferroviaire si l'on se concentre sur la composante géante (qui comprend une grande majorité de gares), les réseaux bus et routiers sont trop fragmentaires pour que leurs analyses isolées soient robustes. Et bien que cela faciliterait les comparaisons avec les recherches antérieures sur les réseaux de transport qui se concentrent sur des modes de transport uniques, nous pensons qu'aller dans le sens d'une plus grande inclusion des modes de transport et des données géographiques sera plus fructueux.

Dans l'ensemble, ce que nous constatons, c'est qu'au sein des villes, il existe un modèle familier de régions centrales facilement accessibles avec de faibles populations et des régions de densité de population plus élevée plus éloignées, avec des populations encore en baisse encore plus éloignées. Ces régions suburbaines disposent souvent de transports en commun pratiques vers les centres-villes, mais nécessitent localement des bus et/ou des voitures pour le transport dans toute autre direction. Nous avons été surpris par la puissance du réseau routier pour le transport dans toute la région de Tokyo, y compris la zone centrale. Alors que les bus jouent un rôle important dans la zone suburbaine, leur utilité est largement uniforme dans la plupart de notre domaine d'étude.

Nous constatons que les centres d'affaires, malgré leur faible population, sont si facilement accessibles par train et par les réseaux routiers qu'ils obtiennent systématiquement les scores de sociabilité et de commodité les plus élevés. Les régions suburbaines ont des systèmes de bus plus utilisables, mais une connectivité globalement plus faible, ce qui entraîne des populations moins accessibles malgré une population locale plus importante. Malgré le fait d'avoir le système de transport public le plus grand et le plus dense au monde, nous constatons que le réseau routier domine systématiquement les réseaux de train et de bus pour toutes les mesures d'accessibilité.

Dans notre analyse de l'accessibilité et de la sociabilité, nous trouvons une forte variabilité dans les regroupements par mode de transport (en particulier pour l'accessibilité), ce qui implique (comme prévu) que les réseaux de transport produisent des caractéristiques d'accessibilité distinctes. Cependant, nous constatons également que même lorsque la corrélation de deux variables est élevée, les méthodes de clustering ne créent pas systématiquement des groupes similaires à partir de ces mêmes variables. Rappelez-vous les nuages ​​de points d'accessibilité et de sociabilité de la figure 10. Cela montre que ces deux variables, et en fait toutes les variables de base, présentent un gradient plutôt lisse avec des grumeaux occasionnels de points pour les cas proches des frontières, avec des valeurs nulles, ou sans certains modes présents . La régularité de nos données aide à expliquer les différences étonnamment élevées dans les regroupements. En l'absence de clusters de données clairs et distincts (et sans une vérité terrain connue), il est difficile d'évaluer la précision des méthodes de clustering. Cependant, les groupes découverts (en particulier par clustering hiérarchique) réussissent plusieurs tests de réalité intuitifs et fournissent informations utiles sur les modèles géographiques dans plusieurs caractéristiques d'accessibilité.

Parce que les scores de synergie sont des mesures de la façon dont accessible en plus un emplacement est en utilisant les modes ensemble, le résultat qu'être plus proche des gares, des arrêts de bus et des intersections améliore les effets combinatoires des modes est surprenant. Certes, être à proximité d'une gare rend le réseau ferroviaire plus utile, mais pourquoi cela rendrait-il le réseau de bus plus utile aussi ? La raison en est que dans la planification urbaine centrée sur le train au Japon, la plupart des lignes de bus se connectent aux gares et la plupart des autoroutes sont parallèles aux voies ferrées. Notez l'espace blanc en haut à gauche de chaque tracé de la figure 13, il n'y a pas d'emplacements à proximité d'une gare et loin d'un arrêt de bus. Cependant, les bus et les voitures peuvent également s'éloigner des gares dans des directions que les trains ne peuvent pas emprunter. Ainsi, même si le fait de pouvoir prendre le bus jusqu'à la gare la plus proche peut améliorer l'utilité de cette gare, en moyenne, le fait d'être à proximité d'un nœud de transport de toute nature vous donne plus d'accessibilité pour l'ensemble du réseau intégré.

Notre analyse de la dominance des modes de transport a révélé plusieurs résultats intéressants. D'une part, la conduite est dominante partout. Naturellement, les bus et les voitures empruntent les mêmes routes, et les voitures sont plus rapides que les bus, il n'est donc pas surprenant que la conduite soit plus rapide que les bus. Pour certains endroits, les trains peuvent aller plus loin que la conduite dans un laps de temps donné, mais en incluant le temps de marche jusqu'à la gare, le réseau routier est en moyenne meilleur. Les routes favorisent également une répartition plus diffuse à travers la région que le transport ferroviaire, ce qui contribue à leur accessibilité supérieure. Dans cet esprit, nous avons évalué la dominance relative : les emplacements où le réseau de train ou de bus est relativement fort par rapport à d'autres zones.Bien que cela nous indique si un mode particulier présente des avantages par rapport aux autres, grâce à cet effort, nous avons conclu que la commodité du mode de déplacement est une mesure plus utile à nos fins pratiques que la domination.

Notre utilisation du clustering pour mieux comprendre la dominance des modes de transport nous a informés de la nature très localisée de cette caractéristique. Certains modèles géographiques existent lorsqu'ils sont fortement corrélés avec, par exemple, l'absence de lignes de train. Cependant, les emplacements à proximité peuvent varier considérablement dans les forces de mode relatives basées uniquement sur la distance à la station la plus proche. Ainsi, pour cette caractéristique, les scores de localisation individuels sont beaucoup plus informatifs que les groupes de tels scores.

Travail futur

Parce que l'ensemble de données est si riche et qu'il y a autant de questions qu'il peut être utilisé pour répondre, il y a naturellement de nombreuses directions prévues pour les travaux futurs. En incluant des données socioéconomiques supplémentaires, nous examinerons la relation entre l'accessibilité et des facteurs tels que le chômage, le revenu, l'accession à la propriété, la structure du ménage, le profil d'âge et la criminalité. Nous souhaitons identifier les différences dans la structure de la communauté par mode de transport (Bohlin et al. 2014), c'est-à-dire quelles régions géographiques sont considérées comme faisant partie de quels quartiers lorsque l'on considère différents modes de transport. Nous souhaitons évidemment poursuivre les questions de robustesse et d'efficacité via des analyses de knock-out et de détour. Cela peut aborder la réponse aux accidents/échecs et identifier les changements structurels et de débit requis pour s'adapter aux changements de passagers à court terme (par exemple, les Jeux olympiques) et aux changements démographiques à long terme (par exemple, le vieillissement de la population, l'urbanisation).

En plus d'approfondir nos analyses, nous souhaitons élargir et affiner notre ensemble de données. Par exemple, nous nous intéressons fortement à l'impact des programmes de vélos en libre-service sur les flux de transport (Pucher et Buehler 2012). Bien que ces programmes soient depuis longtemps populaires en Europe et en Chine et que l'utilisation du vélo soit élevée au Japon, il existe très peu de données ou d'analyses sur l'utilisation du vélo et son interaction avec d'autres modes de transport. Bien que tous nos réseaux soient des abstractions, des évaluations plus réalistes des temps de transfert et d'attente des bus, des temps de transfert des trains spécifiques aux lignes, des vitesses pratiques des véhicules, etc. fourniraient des mesures plus précises des temps de trajet et des distances. Les approximations faites ici suffisent à nos fins de catégorisation dans cet article, mais d'autres fins peuvent être plus sensibles à des différences de quelques minutes.

Notre notation multidimensionnelle des emplacements en fonction de leurs caractéristiques de transport et démographiques dans le transport multimodal a permis de mieux comprendre quelles caractéristiques forment et ne forment pas des modèles géographiques. Nous avons constaté qu'en regroupant les données de différentes manières, nous pouvions découvrir des ventilations utiles de différentes caractéristiques, telles que les synergies intermodes et les efficacités relatives. Notre effort actuel visait à résumer et à visualiser les clusters d'une manière intuitive et interactive qui conduira à une meilleure compréhension et à des questions plus approfondies. Certaines de ces questions plus profondes concernent le rôle des techniques traditionnelles d'analyse de réseau dans l'évaluation des réseaux de transport multimodaux. Peut-être que cette recherche sur la caractérisation et la classification des réseaux de transport multimodaux conduira à de nouvelles métriques pouvant être appliquées à d'autres types de réseaux.

Le papier actuel utilise des emplacements aléatoires, ce qui présente des avantages et des inconvénients. Nous avons également envisagé d'utiliser une méthode d'échantillonnage sur disque de Poisson (Bridson 2007) pour avoir une couverture plus régulière et uniforme de la zone, mais nous avons constaté que le fait d'avoir certains points très proches les uns des autres était utile pour découvrir la sensibilité de certaines mesures aux petites différences de localisation. À l'avenir, nous calculerons toutes les mesures sur chaque hexagone, nous permettant ainsi de discerner des microvariations dans les propriétés en fonction de différences d'emplacement aussi petites que 250 m dans toute la région de Tokyo. Bien qu'il reste certainement beaucoup de travail à faire pour comprendre l'accessibilité sous ses nombreuses formes, nos analyses exploratoires préliminaires ont montré la voie à de nombreuses options et opportunités fructueuses.


Disponibilité des données

Sur demande, les auteurs peuvent fournir les données des scores moyens de mobilité par tour de téléphonie cellulaire, ventilés par sexe, ainsi qu'une documentation appropriée pour la réplication de l'analyse connexe. Sur demande, les auteurs peuvent également autoriser d'autres chercheurs à exécuter des requêtes sur des ensembles de données stockés sur les serveurs de Telefónica, afin de reproduire intégralement les résultats de l'étude. Les décomptes bruts ou les informations individuelles des utilisateurs de téléphones portables ne peuvent pas être rendus publics, ni quitter les serveurs surveillés de Telefónica, pour des raisons contractuelles et de confidentialité.


Xroute

Il s'agit de la version asynchrone de calculateRoute.

L'appel de cette opération ne bloquera pas tant que le résultat n'aura pas été calculé. Au lieu d'un objet résultat, un objet Job est renvoyé qui identifie le calcul commencé. Pour obtenir des mises à jour de statut sur une tâche en cours, utilisez l'opération watchJob. S'il passe à SUCCEEDED, le calcul a réussi et le résultat peut être obtenu à l'aide de fetchRouteResponse. Si le travail s'est terminé avec le statut FAILED, fetchRouteResponse lève l'exception qui s'est produite pendant le calcul.

Il s'agit de la version asynchrone de calculateReachableAreas.

L'appel de cette opération ne bloquera pas tant que le résultat n'aura pas été calculé. Au lieu d'un objet résultat, un objet Job est renvoyé qui identifie le calcul commencé. Pour obtenir des mises à jour de statut sur une tâche en cours, utilisez l'opération watchJob. S'il passe à SUCCEEDED, le calcul a réussi et le résultat peut être obtenu à l'aide de fetchReachableAreasResponse. Si le travail s'est terminé avec le statut FAILED, fetchReachableAreasResponse lève l'exception qui s'est produite pendant le calcul.

Il s'agit de la version asynchrone de calculateReachableLocations.

L'appel de cette opération ne bloquera pas tant que le résultat n'aura pas été calculé. Au lieu d'un objet résultat, un objet Job est renvoyé qui identifie le calcul commencé. Pour obtenir des mises à jour de statut sur une tâche en cours, utilisez l'opération watchJob. S'il passe à SUCCEEDED, le calcul a réussi et le résultat peut être obtenu à l'aide de fetchReachableLocationsResponse. Si la tâche s'est terminée avec le statut FAILED, fetchReachableLocationsResponse lève l'exception qui s'est produite pendant le calcul.

Récupère les résultats de type ReachableAreasResponse pour la tâche donnée. Si le calcul s'est terminé avec une exception, fetchReachableAreasResponse le relancera. Si l'ID du travail est inconnu, une XServerException avec le message « unknown id » est levée.

Récupère les résultats de type ReachableLocationsResponse pour la tâche donnée. Si le calcul s'est terminé avec une exception, fetchReachableLocationsResponse le relancera. Si l'ID du travail est inconnu, une XServerException avec le message « unknown id » est levée.

Récupère les résultats de type RouteResponse pour la tâche donnée. Si le calcul s'est terminé avec une exception, fetchRouteResponse le relancera. Si l'ID du travail est inconnu, une XServerException avec le message « unknown id » est levée.

Renvoie le statut de la tâche donnée.

Cette opération se comporte exactement comme l'opération watchJob du service xRuntime.

Tente d'arrêter une tâche en cours d'exécution. Si le statut de la tâche passe à RÉUSSI, les résultats préliminaires peuvent être récupérés, s'ils sont disponibles.

Cette opération se comporte exactement comme l'opération stopJob du service xRuntime.

Tente de supprimer une tâche en cours. En cas de succès, le travail renvoyé aura l'état SUPPRIMÉ.

Cette opération se comporte exactement comme l'opération deleteJob du service xRuntime.


Idées de marquage à la Floride

Une grande partie du marquage ici semble être en deux groupes : spécifique au Texas et aux États-Unis/SR/CR. Je ne suis pas d'accord avec les deux styles de notation et j'aimerais apporter mes nouvelles idées.

Ce devrait être SEULEMENT Autoroutes inter-États, à péage ou non. Limite de vitesse supérieure à 35 mph (car de nombreux ponts autoroutiers ont une limite de vitesse faible.) Connectez-vous sur et hors des routes avec autoroute_link.

Ce devrait être toute route qui semble être une autoroute sans désignation Interstate. Les propriétés comprennent

  • limite de vitesse supérieure à 50 mph, 35 sur les ponts
  • divisé avec une médiane pour au moins la majeure partie de sa durée de vie
  • très peu ou pas d'intersections au niveau du sol (maximum d'environ 5 par comté)
  • pas de désignation Interstate

N'oubliez pas non plus que si un tronc a peu de niveaux pour environ 5 miles, mais pour 10 miles il en a beaucoup, divisez le chemin vers les propriétés trunk<freeway>-primary<many intersections> ou moins. La chaussée de Pineda en est un bon exemple.

Cela devrait être n'importe quelle route qui est un artère principale à travers la ville, ou relie deux villes ou villes dont les deux populations sont supérieures à 25 000 habitants. S'il relie au moins 3 villes, villes ou même hameaux, il mérite le premier tag.

Cela devrait être n'importe quelle route qui est un artère principale/moyenne à travers la ville, ou relie deux villes, villes ou hameaux. S'il relie deux villes avec une population de 25 000 habitants ou plus, il devrait être mis à niveau vers le primaire. S'il relie 3 villes, villes ou hameaux, il doit être mis à niveau vers le primaire. (MISE À JOUR) Cela pourrait relier deux villages avec une population de 10 000 habitants ou moins, tant que les routes partent toutes deux d'un secondaire+.

Cela devrait être n'importe quelle route qui est un artère moyenne/petite à travers la ville, ou a de nombreux non classés/résidentiels qui la croisent, est plus longue que la majorité des routes du quartier et se termine également sur une route classée tertiaire ou supérieure. Si la route continue au-delà du tertiaire+ et se termine ensuite par un résidentiel, divisez le chemin en tertiaire->résidentiel. Pourrait également relier un hameau à une ville, à condition que la route commence dans la ville et se termine par des impasses au hameau.

Cela devrait être n'importe quelle route de rang inférieur à un tertiaire, mais qui compte plus d'entreprises/d'industries que de maisons. Pourrait également relier deux hameaux, tant que la route commence dans un hameau et se termine en impasse dans l'autre.

Il devrait s'agir de n'importe quelle route de rang inférieur à une route tertiaire, mais comportant principalement (85<%) des maisons. Limite de vitesse généralement 25-35. Notez que les entrées TIGER ont bousillé et ajouté beaucoup de résidentiels, beaucoup d'entre eux pourraient se convertir en non classés. Cela devrait également être utilisé à la place de Highway=service pour l'accès aux routes résidentielles.

Cela devrait être n'importe quel chemin de terre qui a moins de 3 maisons dessus, ou une route traversant une propriété non développée. N'a pas nécessairement un accès public. Ajouter un type de piste.

Rues piétonnes vs sentiers pédestres

Les rues piétonnes ne devraient se trouver que dans les centres-villes, les parcs à thème et devraient être au moins aussi larges qu'une route à sens unique. Voir le centre-ville de St. Augustine pour un bon exemple. Les sentiers pédestres devraient être autre chose.

Si la limite de vitesse n'est pas spécifiée et que la route est pavée et se termine par un cul-de-sac, utilisez-la. Réglez la limite de vitesse à 15. Si la route n'est pas goudronnée mais qu'il y a un panneau "Slow Children At Play", utilisez-le également. Sinon, utilisez la route résidentielle.

Toute route pavée et principalement utilisée pour l'accès/le stationnement. S'il n'est pas pavé, envisagez d'utiliser Track.