Medclean vise à explorer une approche innovante qui se fonde sur le nettoyage et la transformation virtuels de données cliniques et de sciences du vivant guidés par les requêtes. Au lieu de réaliser le nettoyage directement sur les données originelles comme le font les approches existantes, nous proposons de le faire de manière virtuelle en se focalisant exclusivement sur les données qui seront dans la portée des requêtes. Cette approche est à la fois respectueuse de la confidentialité des données (c’est à dire, nettoyer uniquement les résultats - qui passent la phase de filtrage à travers les politiques de sécurité - des requêtes), capable de garantir un passage à l’échelle et en adéquation avec le niveau de qualité des données dans les cas où ses dernières ne peuvent pas être corrigées. Les données impliquées dans l’étude et issues de nos partenaires (HEGP et INSB) sont des données cliniques standards, des données de séquençage ainsi que des images annotées, issues des microscopes photoniques.