Scraping de registres d'études cliniques

Le site Covid-NMA permet de visualiser des informations sur les études cliniques ayant pour sujet la Covid-19. Les données utilisées pour ces visualisations sont issues d’un entrepôt qui les récupère sur des sites appelés registres. Un registre est un site Web à partir duquel ont peut obtenir différentes informations sur les études cliniques autour des médicaments et autres vaccins. Ces registres sont public et il est obligatoire de déposer une description sur un registre lorsqu’une étude clinique est réalisée.

Ce projet POM consiste à reprendre des modules de récupération de données qui utilisent les sites Web publiques des registre d’études cliniques dans le monde pour alimenter un entrepôt de données servant à alimenter le site Covid-NMA.

Un certain nombre de modules ont déjà été développés mais devraient être repris à des fins d’harmonisation. Cela consituera une première étape qui permettra de prendre en main le contexte et les APIs utilisées pour ce développement. Dans un deuxième temps on s’attachera à développer de nouveaux modules pour des registres dont les données ne sont pas encore récupérées.

Maître de conférences en Informatique