Les sciences de la vie sont confrontées à un afflux massif de données issues notamment de projets de séquençage à large échelle. Ces informations, cruciales pour notre compréhension du vivant, doivent être analysées, intégrées et mises à la disposition de la communauté scientifique.
Les banques de données qui répertorient les séquences d’ADN et de protéines jouent un rôle-clé dans la diffusion des données et leur utilisation par les chercheurs, notamment celles qui sont annotées et qui contiennent non seulement la séquence d‚intérêt, mais aussi des informations biologiques qui lui sont associées.
Ce séminaire a pour but de présenter les différentes banques de données disponibles sur internet, et en particulier UniProtKB http://www.uniprot.org. Des exemples illustreront différentes questions, telles que: d’où viennent les séquences? Sont-elles toujours correctes? Les protéines prédites existent-elles? Comment avoir un jeu complet de séquences de protéines humaines? Où les modifications post-traductionnelles sont-elles répertoriées?