Rechercher dans une vidéo ou un audio sur Internet


Navigateur de conférences permet de rechercher des mots-clés dans des vidéos de cours et de conférences sur Internet

Selon cet article de Technology Review, les chercheurs du MIT ont développé un outil de recherche audio et vidéo qui résout l'un des principaux problèmes dans ce domaine: comment diviser une grande classe universitaire en blocs gérables, localiser les mots-clés et diriger vers utilisateurs envers eux. Ce moteur de recherche s'appuie sur des décennies de recherche sur la reconnaissance vocale par le MIT et d'autres institutions pour convertir l'audio en texte et permettre des recherches en son sein.

Le navigateur de conférences est apparu à un moment où de plus en plus d'universités publient des vidéos et des podcasts de leurs cours en ligne. Bien que son contenu puisse être très utile, localiser des informations spécifiques dans les classes est compliqué et parfois frustrant pour les étudiants, habitués à trouver ce dont ils ont besoin en moins d'une seconde avec Google.

«C'est l'un des plus gros problèmes pour les universités du pays», déclare Jim Glass, chercheur au MIT. «C'est un véritable défi de savoir comment les diffuser et faciliter l'accès des élèves à des parties spécifiques de la classe qui pourraient les intéresser.

Les éléments fondamentaux du navigateur de conférences existent depuis plus de 30 ans dans les laboratoires de recherche du MIT et ailleurs, tels que BBN Technologies, Carnegie Mellon, SRI International ou l'Université de Californie du Sud. Leurs initiatives ont abouti à un logiciel qui est finalement assez bon pour guider la personne moyenne, dit Premkumar Natarajan, un scientifique au BBN.

Quelques entreprises, telles que les moteurs de recherche vidéo et audio en ligne Blinkx et EveryZing, utilisent déjà un logiciel qui convertit l'audio en texte interrogeable, mais les chercheurs du MIT ont rencontré des problèmes spécifiques en l'utilisant pour des conférences. académique. D'une part, l'anglais n'est pas la langue maternelle de beaucoup de locuteurs, ce qui rend difficile les systèmes de transcription automatisés formés pour travailler avec des accents américains. D'autre part, les mots qui prédominent dans les cours de sciences sont souvent peu connus. Enfin, dit Regina Barzilay, professeur d'informatique au MIT, les classes ont tendance à avoir une structure très mal discernable, ce qui rend difficile la division et l'organisation de leur contenu pour faciliter la recherche.

Pour résoudre ces problèmes, les chercheurs ont d'abord mis en place le logiciel qui convertit l'audio en texte. Ils ont formé le logiciel à comprendre certains accents en utilisant des transcriptions précises de petits morceaux d'enregistrements audio. Pour aider le logiciel à identifier les mots inhabituels, les chercheurs lui ont fourni des données supplémentaires, telles que des textes de livres et de conférences, qui aident le logiciel à transcrire avec précision quatre mots sur cinq. Cependant, si le système est utilisé avec une personne dont la langue maternelle n'est pas l'anglais et pour laquelle l'accent et le vocabulaire n'ont pas été formés, la précision peut chuter à 50% (une précision aussi faible ne serait pas utile pour un transcription, mais oui pour une recherche par mot-clé).


Vidéo: 5 astuces pour mieux chercher sur google


Article Précédent

Beauté, santé et poids idéal avec "golden milk"

Article Suivant

Les meilleurs parcs naturels du monde