Le phénomène des big data en transports - Entretien avec Robert Chapleau, ing. Ph. D., Polytechnique Montréal

Samedi 21 juin 2014
Technologie, Mobilité durable
Big data

AQTr :
De plus en plus, dans nos organisations, nos villes et nos administrations publiques, on assiste à l’émergence du phénomène des big data ou gestion de mégadonnées. Ces données issues des transactions pour prendre l’autobus ou le métro, ou tout simplement générées par notre téléphone intelligent, participent à l’évolution des informations. Que pensez-vous du phénomène des big data?

R.C. :
Le phénomène des big data, comme tout concept difficile à cerner, a un pouvoir mythique assez impressionnant. Il comporte aussi son lot d’inquiétudes, de risques et de défis techniques. D'aucuns, lorsqu'il est question du suivi de nos activités (cellulaires, cartes de crédit, cartes de fidélisation, historique des recherches sur le Web, localisation continue, manifestations sur les réseaux sociaux), ont raison de souhaiter une plus grande transparence des algorithmes qui fouillent profondément notre intimité ou ce qu’il en reste. Qui fouille? Pour qui? Pourquoi?

Dans le domaine des transports urbains, il y a, ostensiblement, deux courants : ceux qui voudraient « améliorer leur commerce », souhaitant ainsi utiliser la nouvelle information pour mieux assurer le marketing par une relation soutenue avec leur clientèle (CRM ou Customer Relationship Management); et ceux qui s’en tiennent à l’exploitation des données pour améliorer l’adéquation optimale entre l’offre et la demande afin d’assurer un service de qualité selon des normes de capacité. C’est cette dernière question qui nous apparaît comme un enjeu substantiel, parce qu’elle comporte des défis d’intervention à caractère plus durable.

La planification opérationnelle du transport urbain collectif bénéficie maintenant des apports des technologies liées aux Systèmes d’information géographique, les GPS ainsi que les cartes à puces. L’information clientèle qui en est déduite, popularisée par Google par son format GTFS, a créé des effets synergiques permettant maintenant de mieux cerner les enjeux du transport en commun.

AQTr : Est-ce que l’on dispose à votre avis des outils technologiques pour interpréter et donner du sens à ces informations collectées en vrac?

R.C. :
Les systèmes de comptage automatique des passagers (APC-AVL) combinés à la localisation des véhicules par GPS, ainsi que les systèmes de perception automatisés (AFC – cartes OPUS) constituent des mines d’information incontournables pour les gestionnaires et les planificateurs des réseaux de transport… à condition de greffer à ces « masses de données » une « intelligence innovatrice » remettant en question nos procédures classiques de planification opérationnelle. La technologie informationnelle, on pense ici à la loi de Moore où la puissance des ordinateurs double tous les 18 mois, suit très bien la montée en puissance des données. Les modèles que les chercheurs peuvent y adapter ne suivent malheureusement pas la même tendance, quoique les outils, et en particulier les logiciels « open source », se développent maintenant à un rythme étonnant. Oui, je crois que nous disposons déjà de bons outils (simulateurs, gestionnaires efficaces de bases de données, visualisateurs impressionnants), mais le défi particulier qui nous interpelle n’est pas là. Il faut passer à de nouveaux paradigmes : de l’image statique d’un système (profil de charge, point de charge maximum et capacité) à une appréhension d’un système dynamique impliquant un autre niveau de résolution. Passer de la ligne au véhicule! Une autre désagrégation analytique! Passer d’un flot de passagers à la prise en compte de chaque individu.

AQTr : Dans le domaine de recherche qui est le vôtre, que signifie big dans big data : téra, péta bytes?

R.C. :
Dans le contexte du transport collectif, et si je prends comme exemple la grande région de Montréal, déjà les transactions de validation de la carte OPUS comportent plus de 2 000 000 d’enregistrements par jour moyen de semaine, soit quelque 0,6 giga de transactions par année, ce qui occupe déjà plus de 120 gigaoctets de données avant traitement et enrichissement. Lorsque l’on considère un logiciel « humain » d’analyse comme Excel, limité à 1 mega d’enregistrements, – ce qui était suffisant, par exemple, pour traiter la totalité d’une enquête Origine- Destination typique de 350 000 déplacements –,on imagine bien les défis colossaux entraînés par les « trois vertus du big data » : volume, vitesse et variété. En ce qui concerne le volume et la vitesse, il faut y opposer une perspective de « laboratoire » où des données archivées seront conditionnées à des environnements précis correspondant aux situations de planification actuelle (jour moyen de semaine, samedi, dimanche). Des études sommaires sur la variabilité des données de jour en jour devraient confirmer la grande régularité de la demande, d’où une réduction possible de la complexité du traitement. D'autre part, lorsqu'on examine des données complètes pour une situation précise (un jour précis que l’on voudrait représentatif ), il nous est révélé une grande variété – souvent inattendue – de comportements. À cet égard, il y a un problème de choix, ou de construction, d’un ensemble de données régulier et représentatif, autrement dit, planifiable. Voilà pour la taille des bases de données de cartes à puces. D'autre part, à cela s’ajoutent de très nombreuses données GPS (chaque autobus en service échantillonné toutes les quatre secondes) contribuant encore à de nombreux gigas d’informations qui servent à établir la performance du service en matière de ponctualité, de conditions de circulation ainsi que de suivi d’apprentissage des chauffeurs.

En somme, la question de la taille des données dépend véritablement des questions posées, lesquelles déterminent les perspectives d’analyse. Diverses approches de décomposition demeurent disponibles soit pour analyser la charge du réseau, le facteur d’utilisation d’une ligne d’autobus, le monitoring de la ponctualité d’un chauffeur, le suivi d’une clientèle particulière, la compréhension de la demande d’un générateur de déplacements (collège, centre commercial, grand générateur, employeur) ou le déroulement d’un événement particulier.

AQTr : Est-ce qu’il y a des enjeux de standardisation de ces données?

R.C. :
Sans doute. Mais chaque base de données provenant d’institutions et de sources différentes a ses propres règles ou structures. Les principaux problèmes semblent provenir plutôt d’un manque de cohérence entre les données lors de l’identification des divers « objets » de transport (véhicules, circuits, lignes-directions-tracés, réseau de voirie de référence (toponymie des rues, localisation des arrêts), tournées, centre d’opération, etc. Même la spécification GTFS, suffisante pour l’information clientèle, laisse de nombreuses ambiguïtés pour l’aspect opérationnel. En particulier, le « monde des correspondances » (terminus intermodal, intégration tarifaire, réseaux piétonniers) comporte une complexité de modélisation peu commune.

AQTr : Comment le monde universitaire, et plus spécialement celui de la recherche-développement, appréhende-t-il ces nouvelles technologies? Y a-t-il des programmes, des forums…?

R.C. :
Non seulement dans le domaine de la recherche, mais aussi dans l’enseignement, les deux dernières décennies ont vu une insertion importante des technologies informationnelles amenant les concepts de bases de données, de réseaux de transport et de systèmes d’information géographique à un niveau fondamental, notamment dans la formation des ingénieurs civils et industriels. Aux grades supérieurs, les étudiants sont régulièrement confrontés à des ensembles typiques de données (GPS, GIS, cartes à puces, données de recensement, enquêtes Origine-Destination), et ce, dans des cours dont l’intitulé demeure générique tel que « gestion des données de transport », « analyse des transports », « réseaux de transport urbain », « systèmes intelligents de transport » et « transport en commun ». C’est ainsi que, finalement, les projets de recherche apparaissent dans une continuité d’appréhension d’une plus grande complexité expérimentale. Incidemment, les récents développements en logiciels open source (SUMO, MatSim, NeXTA, TRANSIMS, Quantum GIS, Open-Jump) et en données ouvertes (HackTaVille, sites de STM, STL, RTL, AMT, Ville de Montréal, Toronto…) ont grandement facilité cet apprivoisement du big data par les chercheurs.

AQTr : Est-ce que tout cela est simplement une tendance passagère ou le big data aura un impact significatif sur nos vies et transformera notre relation avec le transport?

R.C. :
On réalise bien que le big data s’inscrit dans une continuité de la complexité. On vit continuellement une réingénierie des processus informationnels où l’adaptation à de nouveaux instruments, de nouvelles données et de nouveaux modèles permet d’aborder des questions sous de nouvelles dimensions. À ce moment-ci, les big data autorisent l’examen du transport urbain à un niveau de résolution beaucoup plus fin ainsi que dans son dynamisme (micro-simulation de la demande et de l’offre). Comme l’organisation du transport est une chose « artificielle » (dans le sens de créer de toute pièce par l’humain), il est certain que l’information doit constituer le fondement de sa conception et de sa gestion. En outre, le transport en commun est reconnu comme un système en coproduction (rencontre de convergence entre un fournisseur de service et son client), et la qualité des échanges d’information est un gage de succès de cette entreprise.

AQTr : Finalement, quand assistera-t-on au premier diplômé en big data?

R.C. :
Explicitement, est-ce bien nécessaire de recourir à cette appellation? Je ne crois pas. Déjà la majorité de nos préoccupations de recherche y est consacrée. La formation de nos professionnels s’y est bien adaptée. Culturellement, il devient nécessaire que les entreprises reconnaissent que les big data, outre l’entreposage des données, ne sont pas réservés aux services informatiques; les planificateurs et les analystes des transports doivent être en mesure d’en tirer parti d’une manière créative et opérationnelle, et ce, dans un contexte pluridisciplinaire. À mon avis, dans cette mouvance informationnelle « googléienne », il faut faire une place à un « autodidactisme » orienté (organisationnel ou personnel) si l’on désire faire du développement méthodologique durable.

Sur la toile

https://aqtr.com/association/actualites/revue-routes-transports-edition-printemps-2024-est-disponible
17 juin 2024

AQTr

https://www.quebec.ca/nouvelles/actualites/details/plan-daction-2023-2026-en-matiere-de-securite-sur-les-sites-de-travaux-routiers-des-milieux-plus-securitaires-pour-les-travailleurs-en-chantier-routier-49256
4 juillet 2023

MTMD

https://aqtr.com/association/actualites/revue-routes-transport-edition-printemps-2023-est-disponible
4 juillet 2023

AQTr