De nombreuses espèces marines utilisent des sons pour naviguer, communiquer et détecter des proies. Des biologistes marins et d’autres chercheurs en océanographie écoutent des bruits produits par les animaux marins à plusieurs fins, notamment pour repérer des espèces en danger ou pour étudier leur comportement social. Au cours des dernières années, des experts du monde entier font de plus en plus appel aux appareils d’écoute et d’enregistrement. En ce sens, de grandes quantités de données sont produites, pouvant difficilement faire l’objet d’une analyse manuelle. MERIDIAN élabore des suites logicielles et des outils qui mettent en œuvre des techniques de pointe de deep learning (apprentissage profond) dans le champ de la bioacoustique sous-marine. Nous envisageons de produire une bibliothèque de modèles entraînés pouvant être facilement adaptés ou améliorés en cas de besoin. Nous allons continuer nos efforts pour nous consacrer aux projets décrits dans les sections qui suivent. Les résultats seront publiés dans les prochains mois. N’hésitez donc pas à consulter cette page ou à vous abonner à bulletin d’information.
Projets:
Détection de poissons
Il est connu que des centaines d’espèces de poissons produisent des sons. Nous développons des modèles qui s’appuient sur des réseaux convolutifs temporels (architecture de réseau neuronal généralement appliquée aux données vidéo) pour repérer automatiquement des sons de poissons parmi des données obtenues par le biais d’hydrophones. Ainsi, les chercheurs pourront s’en servir pour analyser de grandes quantités de données encore inexplorées. Les premières espèces avec lesquelles nous travaillons sont la morue de l’Arctique et la morue charbonnière. À ce propos, nous comptons sur la collaboration de M. Francis Juanes, Ph.D., et de Mme Amalis Riera, Ph.D., biologistes de l’équipe MERIDIAN à l’Université de Victoria. Ces chercheurs se consacrent à l’étude de ces espèces ainsi qu’à la collecte de données dans des environnements naturels et contrôlés.
Détection et classification des baleines
Nous élaborons des modèles d'apprentissage profond en conciliant des réseaux neuronaux convolutifs et récurrents pour repérer et classifier plusieurs espèces de baleines (ex. : baleine noire, rorqual boréal, rorqual commun, baleine à bosse). Nous comptons sur la collaboration et l’expertise de quelques groupes et institutions qui mettent des données à notre disposition. Par exemple, M. Chris Taggart, Ph.D., et Mme Kim Davies, Ph.D., du département d'océanographie de l'Université Dalhousie étudient la baleine noire de l'Atlantique Nord, une espèce en voie de disparition, à l'aide de diverses méthodes, dont notamment celles utilisées en acoustique sous-marine. Nous utilisons des données que ces chercheurs ont recueillies avec des robots sous-marins autonomes pour développer des détecteurs. S’ajoute à cela les jeux de données partagés par M. Yvan Simard, Ph.D., chef de l’équipe MERIDIAN à Rimouski, et par nos collaborateurs à Ocean Networks Canada. Ces experts veillent à ce que nos efforts soient bien alignés avec les besoins de la communauté de l’acoustique sous-marine.
Application d’entraînement interactive
Un des avantages de l'apprentissage profond dans l’élaboration de détecteurs et de classificateurs est que nous pouvons tirer parti de la grande plasticité des réseaux neuronaux. Ces derniers permettent de créer un modèle qui peut être adapté selon les besoins. MERIDIAN met sur pied une application où les utilisateurs peuvent interagir avec un réseau neuronal pendant son entraînement, en fournissant de la rétroaction sur sa performance. Le modèle peut subséquemment employer les saisies de l'expert pour obtenir de meilleurs résultats. L’utilisateur peut appliquer un modèle préalablement entraîné à un échantillon d'un nouveau jeu de données et, par la suite, évaluer sa performance. Dans le cas où les résultats ne sont pas satisfaisants, l'utilisateur peut introduire plus données et indiquer si les résultats sont corrects. Au cours de ce processus, l'application accumule les saisies de l'utilisateur pour améliorer les capacités de détection / classification du modèle. Cela peut s’avérer utile lorsqu’un modèle préalablement entraîné est efficace dans une situation donnée (ex. : repérage de la baleine à bosse dans une zone affectée par le bruit la circulation maritime) mais que sa performance est réduite dans un nouveau contexte (ex. : une zone avec un niveau élevé de bruit sismique). Avec l'aide de l'utilisateur, le modèle peut s'adapter plus rapidement au nouvel environnement. Cette application possède l’avantage de fonctionner en tant que plateforme d’annotation, une tâche courante de l’expert en bioacoustique. De cette façon, un réseau neuronal peut apprendre tout en observant le travail de l'analyste.
Bibliothèque de logiciels libres de droits
La plupart de nos outils sont destinés aux utilisateurs qui ne détiennent pas de compétences avancées en apprentissage machine et en développement de logiciels. Les modèles et les applications sur lesquels nous travaillons n’exigent pas de connaissances approfondies en programmation ni en informatique. Nous voulons néanmoins nous assurer que les développeurs impliqués dans l'acoustique sous-marine bénéficient de notre travail. Cela inclut le code dont nous nous servons pour développer nos modèles dans une bibliothèque de logiciels libres de droits. Ce dernier comprend, entre autres, des architectures de réseaux neuronaux utiles à la production de détecteurs et de classificateurs, des algorithmes d’augmentation des données, des utilitaires permettant de traiter de grands jeux de données ainsi que plusieurs algorithmes de traitement du signal. Nous conseillons à ceux qui souhaitent entraîner un nouveau modèle d’essayer une variante d’une architecture de réseau ou de consulter la base de code pour comprendre comment les choses fonctionnent. Toute personne intéressée sera en mesure de le faire une fois que nous aurons publié la première version de notre bibliothèque. Les développeurs y trouveront également une vaste documentation avec des tutoriels, une suite de tests ainsi que des directives sur les manières de contribuer.
Ensemble de données d’entraînement
Le succès de l’apprentissage profond dans une variété de tâches est en grande partie attribué à la quantité de données existantes pour entraîner des modèles. Toutefois, lorsqu’il est question de l’acoustique sous-marine, il reste encore un long chemin à parcourir pour compiler des jeux de données utiles à l’entraînement des détecteurs et des classificateurs. Il faut également déployer des efforts pour les décrire correctement et les rendre disponibles. MERIDIAN envisage de mettre au point une série de jeux de données pouvant être utilisés dans l’entraînement des détecteurs et des classificateurs de plusieurs espèces qui s’appuient sur l'apprentissage profond. Ces jeux de données peuvent être utilisés avec les algorithmes inclus dans notre bibliothèque. D’ailleurs, le standard basé sur le HDF5 que nous élaborons facilite la tâche des développeurs souhaitant concevoir leurs propres modèles en utilisant d'autres bibliothèques. Nous développons également une application permettant d’assembler des jeux de données d’entraînement à partir de données accessibles au public et de techniques d’augmentation de données. Par exemple, un chercheur peut vouloir utiliser l'un de nos modèles préalablement entraînés pour détecter les orques, mais il constate que la présence de dauphins dans son jeu de données engendre souvent de faux positifs. Il peut ensuite utiliser l'application pour ajouter des cris de dauphins à un jeu de données d'orques et entraîner de nouveau le modèle. Cette démarche peut réduire la possibilité d’obtenir de faux positifs.