Une application permettant la coopération d’analystes humains et de réseaux neuronaux artificiels dans l'analyse de grands jeux de données acoustiques marines…
Auto Conduite par xkcd.com
Le suivi acoustique passif (PAM) est une méthode très efficace et rentable largement utilisée en écologie pour étudier les animaux dans les environnements terrestre et marin. Cette méthode permet de recueillir des données précieuses sur de longues périodes de temps sans grands efforts. L’enregistrement de ces « paysages sonores » a d'importantes applications scientifiques et sociétales. D’une part, il s’agit d’une source unique de données pour les scientifiques sur des sujets allant des comportements d'animaux aux changements de la biodiversité. D’autre part, les connaissances acquises peuvent éclairer les prises de décision en matière d'environnement et de conservation.
Cependant, tout le potentiel du suivi acoustique passif reste à explorer en raison du manque d'outils analytiques automatisés. Étant donné la nature complexe et dynamique de l’environnement sonore sous-marin, l’analyse est généralement effectuée par un expert ou par un algorithme soigneusement conçu et hautement spécialisé. Ce dernier exige d’importants efforts de mise en œuvre, ce qui représente une difficulté dans l’application du suivi acoustique passif et un obstacle à la mise en pratique de cette méthode à grande échelle.
Les réseaux neuronaux profonds se sont avérés utiles dans les tâches liées à la reconnaissance d'images, à la segmentation vidéo ainsi qu’au traitement de la parole et sont fort prometteurs pour les applications en acoustique marine. Il est possible de voir, par exemple, les efforts déployés récemment par Google pour entraîner un réseau neuronal à convolution permettant de détecter les chants des baleines à bosse. Le succès du deep learning (apprentissage profond) dépend toutefois de la disponibilité de grands jeux de données validés qui sont utilisés pour entraîner les réseaux neuronaux. En acoustique marine, les jeux de données validés sont rarement assez volumineux pour entraîner un réseau neuronal profond. Pourtant, tout espoir n'est pas perdu. Il est possible que, au lieu de remplacer humains, la coopération entre ces derniers et le réseau permette d’exploiter les avantages des réseaux neuronaux profonds.
Actuellement, MERIDIAN explore cette idée grâce à la création d'une application visuelle d'apprentissage (inter)active qui permettra à l'analyste de vérifier et de corriger les classifications proposées par le réseau neuronal. Cela favorisera l’amélioration de la performance du réseau neuronal au fur et à mesure que son jeu de données d’entraînement grandit. Plus le réseau neuronal devient confiant dans ses prédictions, plus l'analyste pourra lui confier davantage de décisions, accélérant ainsi la tâche d’analyse générale. Un tel cycle de rétroaction peut engendrer un entraînement plus efficace des réseaux neuronaux permettant ainsi que de gagner du temps précieux. L’analyste sera ainsi en mesure de traiter les données et de vérifier les performances du détecteur rapidement. Pour atteindre cet objectif, nous explorons divers systèmes d’entraînement en vue de trouver la stratégie la plus efficace pour le réseau neuronal, en exploitant diverses techniques d’augmentation des données et d’apprentissage par transfert.
Une application d’apprentissage interactif qui s’appuie sur l’apprentissage profond pourrait un jour faire partie d’une boîte à outils standard mise à la disposition des écologistes marins pour analyser de grandes quantités de données acoustiques. Cependant, le succès de l’apprentissage profond en acoustique marine dépendra de la disponibilité de grands jeux de données d’entraînement librement partagés entre des groupes de recherche de la communauté. Nous reviendrons sur ce sujet dans un autre article du blogue…