Malgré la quantité croissante de données acoustiques sous-marines qui apparaissent chaque jour, seule une petite proportion est cataloguée. MERIDIAN met au point une plateforme de crowdsourcing pour l'étiquetage de jeux de données qui peuvent être alors utilisés pour entraîner des modèles d'apprentissage automatique. La plateforme permettra aux utilisateurs de créer des sessions d'étiquetage de leurs jeux de données et d'inviter des participants à le faire. Puisqu’elle présente une structure flexible, il est possible de choisir le public qui aura accès à un jeu de données particulier. Il peut s’agir d'un groupe restreint d'experts ou de toute personne ayant accès à Internet.
Cette plateforme peut d’ailleurs être employée en classe en tant que ressource pédagogique. Nous n’en sommes qu’à un stade précoce de développement, mais les fonctionnalités mises en œuvre sont suffisantes pour réaliser une activité éducative sur le Web destinée aux élèves du primaire en Nouvelle-Écosse. Dans ce cas, aucune étiquette n’a été attribuée puisque les données utilisées étaient déjà cataloguées. Il s’agissait donc d’une activité ludique pour les étudiants qui souhaitent en apprendre davantage sur la bioacoustique marine et les problèmes causés par la pollution sonore. Cette activité sera présentée au 6e Colloque international en éducation du CRIFPEen avril sous le titre « Un programme éducatif de Big Data pour les enfants Mi’kmaq de la Nouvelle-Écosse ».
Nous poursuivons l’élaboration de cet outil. Nous espérons toutefois qu’il sera mis en œuvre dans plusieurs contextes. Par exemple, des experts en bioacoustique peuvent l'utiliser en tant que plateforme de collaboration entre différentes institutions. Il peut également servir aux initiatives scientifiques citoyennes qui mobilisent des volontaires dans le monde entier. Ces circonstances sont propices à l’augmentation de données étiquetées qui, à leur tour, favorisent le développement de la recherche basée sur l’intelligence artificielle.