Le 20 août 2018, une jeune militante suédoise de 15 ans s’est assise devant le Parlement suédois avec une pancarte protestant contre l’inaction climatique. Le lendemain, Greta Thurnberg était rejointe par une poignée d’autres manifestants. La semaine suivante, ils étaient des centaines. Quelques mois plus tard, le mouvement est devenu mondial et YouthForClimate se créait avec pour but d’inciter les politiques à agir contre le changement climatique.

Le mouvement n’a pas tardé à atteindre la Belgique. Début 2019, les jeunes ont commencé à manifester tous les jeudis à travers le pays. Afin de canaliser l’énergie exprimée chaque semaine dans les rues, les organisateurs du mouvement YouthForClimate en Belgique ont rapidement compris la nécessité d’une plateforme citoyenne, et en février la plateforme participative de Youth4Climate voyait le jour. Très vite, la plateforme est devenue un vrai lieu de débat et de discussions constructives : en un peu moins de 3 mois, les utilisateurs ont posté plus de 1 700 idées pour le climat et voté plus de 32 000 fois pour les initiatives qu’ils voulaient soutenir.

Comme pour tous les projets de participation, c’est ici que le vrai défi a commencé. Afin de transformer les contributions en des propositions concises et utilisables avant que l’élan du mouvement ne retombe, il était nécessaire de traiter un grand volume de données dans un laps de temps très court. Il nous a donc paru naturel d’utiliser la fonctionnalité d’analyse automatisée de la plateforme.

Accompagner YouthForClimate dans le processus d’analyse et de collecte des idées récoltées a été pour nous l’occasion de tester notre technologie IA à grande échelle et de l’entraîner sur un corpus de plusieurs milliers de contributions, écrites dans des langues différentes. Voici quelques-unes des leçons que nous avons tirées de cette expérience.

Leçon 1 : l’humain d’abord, la machine ensuite

Dans le but de soumettre un rapport concis et concret aux élus, Go Vocal et les organisateurs de YouthForClimate ont décidé de traduire les 1,700 idées postées sur la plateforme en une liste de priorités pour le climat. Les thèmes existant sur la plateforme et qui avaient déjà été assignés à certaines idées ne pouvaient pas être utilisés pour définir ces priorités. D’une part, la plupart de ces thèmes étaient trop vagues pour déterminer de véritables priorités; d’autre part, une grande partie des utilisateurs avaient choisi de ne pas classer leurs idées, ce qui signifie que la plupart des idées n’étaient pas étiquetées.

La classification automatique n’était pas une option non plus : avec des conversations aussi complexes et un si grand nombre de messages, les algorithmes ont besoin d’être cadrés avant de pouvoir obtenir des résultats fiables. Sans donner des instructions aux algorithmes sur la façon de classer les idées, le modèle de classification appliqué aurait été hors contexte ou trop vaste.


Les 15 priorités pour le climat définies sur la plateforme de Youth4Climate

La solution consistait donc à manuellement déterminer les priorités en lisant les idées et en utilisant les sujets récurrents. Afin d’éviter de devoir lire les 1700 idées recueillies sur la plateforme, nous avons décidé de nous concentrer d’abord sur les plus populaires, c’est à dire celles qui avaient reçu le plus de votes. 74% des votes étaient ainsi concentrés sur seulement 15% des idées, ce qui semblait confirmer que ces 217 idées étaient représentatives des priorités exprimées sur la plateforme. Les idées ayant recueilli plus de 100 votes (60 idées au total, soit 43 % du total des votes) nous ont donné les 10 premières priorités. Les idées qui ont recueilli entre 50 et 100 voix (57 idées, soit 15% des voix) nous ont donné 5 priorités supplémentaires. Ces 15 priorités étaient suffisantes pour couvrir le reste des idées : nous avons lu encore 139 idées supplémentaires ayant recueilli entre 20 et 50 votes, et toutes correspondaient à au moins une des 15 priorités identifiées.

Une fois ces priorités définies, nous avons utilisé la technologie IA pour les appliquer aux 1 400 autres idées. Ces idées ont été étiquetées selon la méthode de la similarité : chaque idée non étiquetée a été automatiquement comparée à une idée étiquetée. La comparaison se fait en repérant les mots similaires, puis en vérifiant le contexte dans lequel ils sont utilisés. Il ne suffit pas que deux idées utilisent le mot “fils” : nous voulons aussi nous assurer que le mot signifie la même chose dans les deux commentaires. L’inverse est également vrai : si une idée mentionne “des fils” et qu’une autre idée mentionne “la couture”, l’algorithme les rassemble. Une fois que l’algorithme a trouvé l’idée étiquetée la plus similaire, il a applique la même catégorie à l’idée non étiquetée.

Leçon 2 : anticiper les biais

En termes d’idées et de commentaires recueillis, Youth4Climate a été l’une des plus grandes plateformes avec lesquelles nous avons travaillé. Cela a donc été l’occasion pour nous de former notre algorithme sur des jeux de données plus étendus que ceux que nous voyons habituellement sur d’autres plateformes. Ce faisant, nous avons affiner notre approche et faire quelques ajustements à notre produit.

Tout d’abord, nous sommes conscients que laisser les humains définir les catégories comporte toujours une part de biais. Même en essayant d’être fidèles aux idées exprimées, il existe toujours une fraction de partialité dans la façon dont nous sélectionnons et catégorisons ce que nous pensons être le plus important dans les idées. En étant conscients de ce biais possible, nous avons pu essayer de l’ignorer et de rester aussi neutres que possible.

Nous avons décidé que les idées les plus populaires étaient aussi les plus pertinentes, mais il se peut bien sûr que certaines idées n’ayant pas reçu un grand nombre de votes aient également émis des priorités valables. De plus, l’algorithme de la plateforme affiche d’abord des idées ayant reçu le plus de votes, renforçant ainsi les propositions dominantes. Afin d’éviter ce biais sur les futures plateformes, nous avons maintenant randomisé l’ordre des idées sur les pages des projets.

Enfin, cette expérience a confirmé que le multilinguisme ne constitue pas un frein aux projets de participation citoyenne. La traduction automatique a permis aux utilisateurs parlant différentes langues de lire, de commenter et de voter pour des idées dans des langues différentes, éliminant ainsi le biais linguistique. Pendant la phase d’analyse, nous avons pu travailler avec les 3 langues de la plateforme (français, néerlandais et anglais) en traduisant les idées dans une seule langue et en menant l’analyse sur cette base commune. Le regroupement des idées et la classification ont marché de façon tout aussi efficace sur les idées en langue originale que sur les idées traduites.

Leçon 3 : transparence, transparence, transparence !

L’analyse des contributions n’est pas tout : pour que la boucle soit bouclée, il est également nécessaire de partager les résultats avec les participants. Dans un esprit de co-construction et de transparence, les organisateurs de Youth4Climate se sont efforcés de garder le processus aussi ouvert que possible.

Une fois les 15 priorités définies, les résultats ont été publiés sur la plateforme avec une explication sur la façon dont les idées ont été traitées. Les résultats et la méthodologie ont également été partagés par courriel avec tous les utilisateurs qui avaient créé un compte sur la plateforme, qu’ils aient soumis une idée ou non. Cette approche a contribué à accroître la confiance dans le processus et à maintenir l’intérêt des utilisateurs longtemps après leur interaction avec la plateforme. Il a également contribué à ré-orienter les utilisateurs sur la plateforme pour la phase suivante du projet.

Frise chronologique du projet sur la plateforme de Youth4Climate

Les 15 priorités citoyennes ont été traduites en nouvelles “idées” sur la plateforme, pour lesquelles les citoyens peuvent voter. Chacune de ces priorités est accompagnée d’une brève description et comporte des liens vers les idées connexes les plus populaires postées par les citoyens au cours de la première phase. Une fois finie la nouvelle phase de vote, les organisateurs de Youth4Climate partageront les propositions avec les élus et les présenteront à un panel d’experts avec lequel ils sont en contact. Ces phases à venir ont été expliquées sur la plateforme, exposant clairement aux utilisateurs où va le projet et pourquoi leur vote est important.

Cette expérience a été très enrichissante pour Go Vocal. Cela nous a permis de travailler avec un groupe issu de la société civile, sur un sujet qui nous passionne. Tout au long du processus, nous avons également été en mesure de recueillir des enseignements précieux que nous pourrons mettre en œuvre sur les futures plateformes. Si vous voulez en savoir plus sur l’utilisation de l’intelligence artificielle chez Go Vocal, c’est par ici.