Descriptif des enseignements
Sommaire
- 1 Master 1 - Semestre 7
- 1.1 Harmonisation des connaissances en biologie - EMBIA1IM - 3 ECTS
- 1.2 Algorithmique et complexité - EMBIA1JM - 3 ECTS
- 1.3 Programmation en bioinformatique - EMBIA1BM - 3 ECTS
- 1.4 Mathématiques pour la biologie - EMBIA1EM - 3 ECTS
- 1.5 Traitement des données biologiques - EMBIA1FM - 3 ECTS
- 1.6 Introduction aux bases de données - EMBIA1AM - 3 ECTS
- 1.7 Bioinformatique des séquences - EMBIA1CM - 3 ECTS
- 1.8 Bioinformatique pour la Génomique - EMBIA1DM - 3 ECTS
- 1.9 Traitement de graphes et réseaux biologiques - EMBIA1KM - 3 ECTS
- 1.10 Génétique évolutive et quantitative - EMBIA1GM - 3 ECTS
- 2 Master 1 - Semestre 8
- 2.1 Programmation avancée - EMBIA2AM - 6 ECTS
- 2.2 Fouille de données - EMBIA2DM - 3 ECTS
- 2.3 Traitement de données post-génomiques - EMBIA2BM - 6 ECTS
- 2.4 Evolution moléculaire - EMBIA2EM - 3 ECTS
- 2.5 Projet tutoré - EMBIA2CM - 3 ECTS
- 2.6 Modélisation moléculaire - EMBIA2FM - 3 ECTS
- 2.7 Analyse de données multivariées - EMBEA2AM - 3 ECTS
- 2.8 Biostatistiques : Utilisation avancée du modèle linéaire - EMBEA2EM - 3 ECTS
- 2.9 Stage - EMBEA2IM - 0 ECTS
- 3 Master 2 - Semestre 9
- 3.1 Bases de données avancées - EIBIA3AM - 3 ECTS
- 3.2 Apprentissage automatique - EIBIA3BM - 3 ECTS
- 3.3 Intégration de données hétérogènes - EIBIA3CM - 3 ECTS
- 3.4 Biologie des systèmes 1 : modélisation et simulation de réseaux biologiques - EIBIA3DM - 6 ECTS
- 3.5 Biologie des systèmes 2 - EIBIA3EM - 9 ECTS
- 3.6 Connaissance de l'entreprise - EIBTA3YM - 3 ECTS
- 3.7 Communication scientifique - EIBIA3FM - 3 ECTS
Master 1 - Semestre 7
Harmonisation des connaissances en biologie - EMBIA1IM - 3 ECTS
Responsable(s) | Philippe Rousseau & Valérie Lobiois |
Mots-clés | Biologie cellulaire ; Biologie Moléculaire ; Génétique mendélienne et moléculaire |
Objectifs | Cette UE est pour les étudiants ne provenant pas de biologie. Les étudiants venant de biologie suivront l'UE d'Algorithmique et complexité. L’objectif est de fournir un enseignement de mise à niveau en Biologie Cellulaire, Biologie Moléculaire et Génétique à des étudiants venant de licences en Physique ou en Informatique. |
Prérequis | |
Contenu | Biologie Cellulaire : Introduction générale à la biologie cellulaire. Notion de cellule procaryote et eucaryote. Organisation de la cellule (compartimentation et dynamique intracellulaire). Expression génique et régulation. Mouvements cellulaires. Prolifération, différenciation et mort cellulaire. Enseignement intéractif privilégiant un travail collectif.
Analyse Génétique : Relation gène-fonction. Notions de mutation et d’allèle. Lois de transmission de caractères héréditaires chez les eucaryotes (i.e. : monogénique et digénique). Notions d’indépendance et de liaison génique. Transmission génétique chez les procaryotes. Biologie Moléculaire : Structure du matériel génétique, notions de gène et de génôme. Présentation des grands processus moléculaires de la cellule (i.e. : réplication, transcription, traduction). |
Références | Biologie (Campbell et Reece - De Boeck) |
Compétences | Niveau de base (licence) en Biologie Moléculaire, Biologie Cellulaire et Génétique |
Algorithmique et complexité - EMBIA1JM - 3 ECTS
Responsable(s) | Jérôme Farinas |
Mots-clés | Algorithmique ; structures ; instructions conditionnelles ; séquences nucléiques et protéiques ; annotations structurées ; complexité asymptotique |
Objectifs | Cette UE est pour les étudiants provenant de biologie. Les autres étudiants suivront l'UE d'Harmonisation des connaissances en biologie.
Décomposer un programme en éléments de plus petite taille. Analyser le comportement de programmes simples fondés sur les variables, expressions, affectations, E/S, structure de contrôle, fonctions... Créer des algorithmes résolvant des problèmes simples : transcription ADN en ARN, traduction en protéines. Implémenter des algorithmes, les tester et les déboguer. Comprendre les notions et les techniques qui permettent d’analyser la complexité d’algorithmes. Initiation aux systèmes Unix : gestion des fichiers, commandes de base. |
Prérequis | Mathématiques élémentaires |
Contenu | Algorithmique
Concepts de la programmation
Complexité Introduction des notions et techniques qui permettent d’analyser la complexité d’algorithmes. Complexité de boucles, pour ou tantque, dans le cas le pire et le cas moyen. Systèmes Unix :
|
Références | Algorithmes - Notions de base. Thomas H. Cormen. Dunod, 2013.
Unix, Initiation et utilisation : Colin, Armspach, Ostré-Waerzeggers, Dunod, 2004 |
Compétences | Modéliser un problème simple et savoir implémenter un algorithme pour le résoudre.
Analyser la complexité d’algorithmes itératifs et de structures de données. |
Programmation en bioinformatique - EMBIA1BM - 3 ECTS
Responsable(s) | Thomas Pellegrini |
Mots-clés | Algorithmique ; structures ; instructions conditionnelles ; programmation impérative ; Biopython ; séquences génomiques nucléiques et protéiques ; annotations structurées ; ontologies |
Objectifs | Apprentissage de la programmation structurée avec des langages impératifs.Savoir utiliser des structures classiques. Mise en œuvre en utilisant un langage impératif. Utilisation de bibliothèques de programmation dédiée à la bioinformatique, notamment pour la manipulation de séquences (nucléiques et protéiques) ainsi que l’exploitation de diverses sources et format de données. |
Prérequis | Algorithmique (UE EMBIA1JM) |
Contenu | Notions fondamentales
Notions complémentaires
|
Références | Apprendre à programmer avec Python 3, Gérard Swinnen, Eyrolles |
Compétences | Maîtriser les notions fondamentales théoriques et pratiques d'un langage impératif
Savoir décomposer un problème en petits sous-problèmes et être capable d'implémenter une solution Savoir comment évaluer la performance d'un programme |
Mathématiques pour la biologie - EMBIA1EM - 3 ECTS
Responsable(s) | Sandrine Mouysset & Roland Barriot |
Mots-clés | systèmes linéaires ; vecteurs/valeurs propres ; équations différentielles ; probabilités |
Objectifs | Initiation théorique aux bases d'algèbre linéaire, d'analyse et de probabilités. Représentation matricielle. Modélisation de problèmes dynamiques : résolution d'équations différentielles. Présentation des algorithmes numériques pour résoudre ces problèmes. Probabilités. Mise en application dans le cadre d’un projet applicatif en biologie des notions théoriques et algorithmes vus en cours. |
Prérequis | |
Contenu | Algèbre Linéaire
Analyse
Probabilités
|
Références | Mathématiques pour les Sciences de la vie et de la Terre – C. David, S. Mustapha, F. Viens, N. Capron, edition Dunod |
Compétences | Savoir utiliser des outils mathématiques d'algèbre linéaire, d'analyse et de probabilités pour représenter et analyser des données biologiques, modéliser des problèmes dynamiques. |
Traitement des données biologiques - EMBIA1FM - 3 ECTS
Responsable(s) | Maxime Bonhomme |
Mots-clés | statistiques descriptives ; probabilités ; échantillonnage ; test statistique ; analyse transcriptomique |
Objectifs | A la fin de cette UE, les étudiants auront acquis les notions fondamentales pour (i) décrire des données biologiques (incluant des données de transcriptome), (ii) tester des hypothèses liées aux données grâce à des méthodes statistiques dédiées, et (iii) interpréter biologiquement les résultats de ce traitement. |
Prérequis | Connaissances de bases en mathématiques. Notion d'expression génique. |
Contenu | Cours :
Ce contenu sera traité au travers d’exemples biologiques.
|
Références | The R Book (Mickael J Crawley) |
Compétences | Savoir décrire des données biologiques (incluant des données de transcriptome). Savoir tester des hypothèses liées aux données biologiques récoltées suite à l'experimentation/l'échantillonnage, et utiliser des approches statistiques courantes en sciences biologiques. Savoir interpréter biologiquement les résultats du traitement statistique. Maitriser un outil informatique appliqué à l’analyse statistique (logiciel R). |
Introduction aux bases de données - EMBIA1AM - 3 ECTS
Responsable(s) | Shaoyi YIN |
Mots-clés | bases de données relationnelles ; modélisation ; algèbre relationnelle ; LDD ; LMD ; language SQL |
Objectifs | L'objectif de ce cours est d'apprendre aux étudiants à concevoir une base de données et de l’interroger en algèbre relationnelle ainsi qu'en langage déclaratif tel que le langage SQL. |
Prérequis | |
Contenu |
|
Références | Gardarin G., "Bases de données", Edition Eyrolles, 2003 (ISBN 2-212-11281-5). |
Compétences |
|
Bioinformatique des séquences - EMBIA1CM - 3 ECTS
Responsable(s) | Catherine Mathé |
Mots-clés | Algorithmes pour la comparaison de séquences ; heuristique ; profils |
Objectifs | Comprendre les concepts et algorithmes sous-jacents aux principaux outils de comparaison de séquences biologiques afin d’être capable de choisir la méthode la plus pertinente pour répondre à une problématique. |
Prérequis | Connaissance de biologie moléculaire et de bases en bioanalyse (contenu des banques, interrogation, recherche d'homologues). |
Contenu | Les cours viseront à montrer la différence entre un alignement exact (Needleman et AW56 Smith et Waterman) ou approché via des heuristiques (type BLAST) ; l'intérêt de la méthode de programmation dynamique pour la comparaison de séquences ; comprendre les différentes approches en alignement multiple de séquences : méthodes locales et globales, progressives versus itératives ; connaître les méthodes de caractérisation (signature, profile) et la recherche de motifs communs entre plusieurs séquences.
La mise en pratique de ces différentes méthodes sera faite lors de séances de travaux dirigés et pratiques, en insistant sur leurs avantages ou leurs limites. |
Références | Bio-informatique. Principes d'utilisation des outils. 2010. D. Tagu, J.L. Risler, coord. Ed Quae
Bioinformatique - Cours et applications. 2ème édition. 2015. G. Deléage et M. Gouy. Dunod |
Compétences | Etre capable d'élaborer une stratégie et de choisir et utiliser les méthodes ad hoc pour comparer des ensembles de séquences et en dégager des informations pertinentes. |
Bioinformatique pour la Génomique - EMBIA1DM - 3 ECTS
Responsable(s) | Gwennaele Fichant |
Mots-clés | Annotation de génomes ; Modèle de Markov caché ; génomique comparative ; alignement de génomes ; synténie |
Objectifs | Cet enseignement permettra aux étudiants d'acquérir les approches d'analyses des données de génomes, plus particulièrement l'annotation des séquences génomiques et la génomique comparative. Les concepts et les questions biologiques sous-jacents à ces approches seront abordés et seront suivis de leur mise en pratique sur des cas concrets. |
Prérequis | |
Contenu | Les cours aborderont :
1) la description de la conception d'un prédicteur de gène et des différentes méthodes qui doivent être mise en œuvre pour effectuer les mesures nécessaires sur la séquence génomique analysée (type contenu, signal, similarité) et comment ces différentes informations sont intégrées dans un modèle de structure de gène qui sera ensuite implémenté dans une solution logicielle permettant de réaliser la prédiction de la structure optimale. Parmi ces approches, les modèles de Markov cachés (HMM) permettant de réaliser des modèles probabilistes d’une suite de problèmes linéaires labellisés seront plus particulièrement développés. 2) la description des concepts et des hypothèses fonctionnelles qui sous-tendent les approches de génomique comparative. 3) la description des méthodes d'alignement de génomes qui permettent d'identifier les régions coeurs de l'ensemble des génomes analysés et qui sont donc utilisées en génomique comparative. Les séances de TD permettront d'illustrer les approches exposées en cours par l’analyse de problématiques biologiques tirées de publications scientifiques en anglais. Les séances de TP auront lieu sur ordinateur de manière à mettre en pratique les approches et démarches théoriques décrites en cours. |
Références | Biological sequences analysis: Probabilistic Models of Proteins and Nucleic Acids (1998) R. Durbin, S. Eddy, A. Krogh, G. Mitchison. Cambridge University Press. |
Compétences |
Traitement de graphes et réseaux biologiques - EMBIA1KM - 3 ECTS
Responsable(s) | Roland Barriot |
Mots-clés | parcours ; plus courts chemins ; marches aléatoires ; partitionnement de graphes ; détection de communautés ; modularité ; réseau d'interaction ; réseau de régulation ; réseau métabolique |
Objectifs | Dans ce module, les étudiants aborderont les concepts et les algorithmes de base en théorie des graphes. Quelques problèmes classiques de biologie seront revisités à la lumière de ces concepts. Les réseaux d’interactions moléculaires (régulation transcriptionnelle, réseaux métaboliques, réseaux d’interactions protéiques) et les problèmes de graphes associés constitueront des applications privilégiées. |
Prérequis | Algorithmique ; Programmation ; Métabolisme ; Génétique |
Contenu | Concepts et définitions
Graphes et réseaux rencontrés en biologie et bioinformatique Représentations informatiques et manipulations Formats de stockage Logiciels de visualisations, d'éditions et d'analyse Librairies et boites à outils Algorithme de parcours et de dessin Arbres couvrants Détection de motifs Partitionnement et détection de communautés |
Références | Introduction to Algorithms, Corsen, Leiserson and Rivest, MIT Press and McGraw-Hill |
Compétences | Générer, éditer, manipuler et visualiser différents types de graphes.
Elaborer et mettre en œuvres des méthodes originales de parcours de réseaux biologiques. Comparer les résultats de différentes méthodes de partitionnement de graphes, sélectionner les résultats biologiquement pertinents et interpréter les communautés obtenues. |
Génétique évolutive et quantitative - EMBIA1GM - 3 ECTS
Responsable(s) | Maxime Bonhomme |
Mots-clés | génétique ; population ; évolution ; caractère quantitatif ; cartographie génétique |
Objectifs | Ce module permettra aux étudiants d'acquérir et de mettre en pratique les concepts fondamentaux de l’évolution génétique et phénotypique des populations par des approches de génétique des populations et de génétique des caractères quantitatifs. L’accent sera mis sur les approches statistiques nécessaires à l’analyse des données génétiques, dont le nombre a explosé suite au séquençage à haut débit. Des problèmes concrets de génétique végétale mais aussi animale seront abordés. |
Prérequis | Notion de génétique Mendélienne (ségrégation des caractères) et de polymorphisme moléculaire. |
Contenu | Cours:
TD : Application des notions abordées, au travers d’exercices. TP : Mise en pratique avec R et divers logiciels d’analyse génétique, au travers d’exemples issus du monde végétal et animal. |
Références | Précis de génétique des populations (Jean-Pierre Henry, Pierre-Henry Gouyon, ed Dunond)
Introduction to quantitative genetics (Falconer & Mackay) Handbook of statistical genetics (Balding, Bishop, Cannings) |
Compétences | Savoir mesurer le polymorphisme génétique des populations, et connaitre l'effet des systèmes de reproduction et des forces évolutives sur la diversité allélique et génotypique.
Savoir décrire un caractère quantitatif et évaluer l'importance des gènes et de l'apparentement dans la variabilité du caractère (héritabilité). Connaitre le principe des approches de cartographie génétique des caractères quantitatifs (QTL, association). |
Master 1 - Semestre 8
Programmation avancée - EMBIA2AM - 6 ECTS
Responsable(s) | Mathieu Raynal |
Mots-clés | Modélisation objet ; UML ; Programmation orientée objet ; JAVA ; Classes ; Objets ; Héritage |
Objectifs |
|
Prérequis |
|
Contenu | Partie génie logiciel : Modélisation avec UML
Partie programmation orientée objet - Langage JAVA
|
Références | |
Compétences | Être capable de modéliser et développer une application complète (avec, par exemple, la gestion de la lecture et écriture dans des fichiers, et la conception d'une interface graphique) en utilisant la programmation orientée objet. |
Fouille de données - EMBIA2DM - 3 ECTS
Responsable(s) | Roland Barriot |
Mots-clés | prétraitement des données ; classification et prédiction ; caractérisation et discrimination ; règles d’association |
Objectifs | Cette UE a pour but d’initier les étudiants aux techniques modernes de fouilles de données permettant de
prédire, par exemple, si celui qui achète du pain et du beurre va acheter de la confiture, s’il est raisonnable pour une banque d'attribuer une carte de crédit, si la protéase PfSUB1 joue un rôle dans la division de Plasmodium falciparum (parasite responsable de la malaria), ou encore de diagnostiquer un sous-type de cancer du sein à partir de données de puces à ADN de la patiente. En général, plusieurs méthodes peuvent être utilisées, plus ou moins performantes : il s’agit donc de les comprendre, d’apprendre à les mettre en œuvre et d’estimer leur performances. |
Prérequis | Statistiques, programmation |
Contenu | Mesures de distance, similarité, dissemblance
Normalisation et transformation Classification - Arbre de décision et forêts aléatoires - Méthodes bayésiennes - k plus proches voisins - Analyse discriminante linéaire Clustering - k means, k medoids - Clustering hiérarchique - Méthodes basées sur la densité - Méthodes basées sur une grille Evaluation des performances Extraction de règles d'association et d'itemsets fréquents Logiciels, librairies et boites à outils disponibles |
Références | Data Mining: Concepts and Techniques, J. Han and M. Kamber, 2006. |
Compétences | Constituer un jeu de données d'apprentissage pour l'inférence d'un modèle prédictif.
Evaluer les performances d'une méthode de classification, d'un classificateur, ou d'un jeu de paramètres. Sélectionner et mettre en œuvre une méthode de clustering ainsi que évaluer et interpréter le résultat obtenu. |
Traitement de données post-génomiques - EMBIA2BM - 6 ECTS
Responsable(s) | Raphael Mourad |
Mots-clés | Haut-débit ; Assemblage de génome ; SNP ; RNA-seq ; small RNA-seq ; Protéomique |
Objectifs | Cette unité d'enseignement a pour objectif de fournir une large palette de connaissances et de compétences en bioinformatiques et biostatistiques appliquées à un domaine en constante évolution en biologie moderne: la post-génomique. Cette dernière cherche à étudier la fonction et l'expression des gènes séquencés en génomique par la caractérisation systématique du rôle des mutations, de l'expression des ARN messagers, des ARN non-codants, ainsi que des protéines. Les données générées par la post-génomique sont extrêmement volumineuses et de très grandes dimensions (Big Data). C'est pourquoi elles nécessitent le développement et l'utilisation d'outils adaptés provenant à la fois de l'informatique et des statistiques. Les applications sont nombreuses: génétique humaine, cancérologie, métagénomique, mais aussi, amélioration des espèces d'intérêt agronomique et étude de l'évolution des espèces. |
Prérequis | Connaissances en biologie moléculaire, génomique, biochimie des protéines, ainsi qu'en algorithmique, théorie des graphes et traitement statistique de données. |
Contenu | Cette unité d'enseignement comporte 4 ateliers différents: assemblage de génome et détection de SNP, analyse de données RNA-seq , analyse de données small RNA-seq et analyse de données protéomiques . Le premier atelier consiste à appréhender et savoir utiliser les concepts et méthodes pour la manipulation de gros fichiers de séquences, l'alignement des séquences sur le génome, l'assemblage de novo de génomes, la détection de SNP ainsi que leur annotation fonctionnelle. Le second atelier traite de la mesure du niveau d'expression des ARN messagers, de l'analyse différentielle, des méthodes d'enrichissement d'ensemble de gènes et de la détection de variants d'épissage alternatif. Le troisième atelier permet de caractériser les différentes familles d'ARN non codants produites par les protocoles de séquençage, d'employer les banques de données pour annoter ses ARN non codants et de maîtriser les méthodes bioinformatiques pour parser les séquences, générer la matrice de comptage qui servira d'entrée à la normalisation et à l'analyse différentielle. Le quatrième atelier consiste à identifier et quantifier les protéines d'un mélange complexe de protéines à partir de données issues de spectrométrie de masse avec, par exemple, des cartes peptidiques massiques ou par spectrométrie de masse en tandem. Pour cela, des algorithmes bioinformatiques sont utilisés pour l’identification de peptides et de protéines à l'aide des base de données usuelles. |
Références | Pevsner. Bioinformatics and Functional Genomics, 2015.
Datta and Nettelton. Statistical Analysis of Next Generation Sequencing Data, 2014. Wu and Choudry, Next Generation Sequencing in Cancer Research, 2013. |
Compétences | L'étudiant acquiera des compétences variées en analyse de données haut-débit de types séquençage nouvelle génération et spectrométrie de masse. L'étudiant sera ainsi capable d'utiliser les outils les plus populaires pour l'analyse de données haut-débit tels que le logiciel R, mais sera aussi en mesure d'interpréter et d'intégrer les données dans leur contexte biologique. |
Evolution moléculaire - EMBIA2EM - 3 ECTS
Responsable(s) | Gwennaele Fichant |
Mots-clés | évolution ; méthodes de reconstruction d’arbre phylogénétique ; congruence ; bootstrap ; sélection naturelle ; dérive |
Objectifs | Cet enseignement a pour but d'initier les étudiants aux analyses d'évolution moléculaire. Les concepts et méthodes développées dans cette discipline seront détaillés et seront accompagnés par leur mise en pratique sur des cas concrets de reconstruction phylogénétique. L'accent sera mis sur l'interprétation évolutive des arbres obtenus. |
Prérequis | |
Contenu | Cette UE introduira les concepts de l’évolution puis présentera les différents modèles d'évolution des séquences génomiques (ADN et protéines) et les différentes approches de reconstruction d’arbres (parcimonie, méthode de distances, méthode du maximum de vraisemblance). Les méthodes permettant le choix du modèle évolutif le plus adapté aux données traitées, celles utilisées pour analyser la stabilité de la topologie et celles permettant l'analyse de la congruence de plusieurs arbres seront également développées. L'étude de l'impact des forces évolutives (sélection naturelle, dérive,…) sur le polymorphisme des séquences sera aussi abordé. Les concepts et approches vus en cours seront illustrés par des cas concrets (évolution des séquences d'une famille de protéines, pression de sélection sur certains gènes et régions du génome, reconstruction de la phylogénie d'un ensemble d'espèces, etc) lors de séances de TP sur ordinateurs. Au cours des TD, l'accent sera mis sur l'interprétation évolutive des topologies d'arbres (détection des évènements de duplication et/ou perte de gène, de transferts horizontaux etc.) |
Références | Concepts et Méthodes en Phylogénie Moléculaire (2010). Guy Perrière et Céline Brochier-Armanet. Collection IRIS, Springer
Computational Molecular Evolution. Ziheng Yang. Oxford University Press. |
Compétences | Mettre en œuvre une analyse évolutive des séquences d'une famille de gènes/protéines en utilisant les bonnes pratiques du choix du modèle évolutif le plus adapté aux données et des méthodes de reconstruction d'arbres.
Evaluer les différents types de sélection et leur impact sur le polymorphisme des séquences, et mettre en oeuvre une méthode de recherche de traces de sélection (tests de neutralité). Interpréter un arbre phylogénétique pour proposer un scénario évolutif des séquences analysées. |
Projet tutoré - EMBIA2CM - 3 ECTS
Responsable(s) | Jérôme Farinas |
Mots-clés | méthodologie de travail ; travail en groupe ; suivi de projet ; techniques web |
Objectifs | Mettre en œuvre des techniques de méthodologie de travail et d'organisation de projet informatiques |
Prérequis | |
Contenu | Partie I Méthodologie de travail en groupe et de suivi de projet. Techniques de publication Web. Partie II |
Références | PMI, management de projet : un référentiel de connaissances, AFNOR, 2004
Management d'un projet système d'information : principes, techniques, mise en œuvre et outils, Chantal Morley, Dunod, 2006 |
Compétences | maîtrise des techniques de management des projets informatiques dans le domaine de la bioinformatique |
Modélisation moléculaire - EMBIA2FM - 3 ECTS
Responsable(s) | Georges Czaplicki |
Mots-clés | Visualisation et manipulation de molécules ; structure et dynamique moléculaire ; champs de force ; minimisation d'énergie ; complexe récepteur-ligand |
Objectifs | Ce module a pour but d'initier les étudiants aux concepts de base de la modélisation moléculaire. A l'issu de cet enseignement l'étudiant sera capable de créer une molécule et de déterminer sa structure optimale, tant in vacuo que dans un complexe récepteur-ligand. |
Prérequis | |
Contenu | Présentation de concepts de base de la modélisation de structures biomoléculaires. Seront abordés les aspects théoriques et computationnels de la détermination de structures tridimensionnelles de molécules d'intérêt biologique par l'approche empirique, basée sur le champ de force et l'optimisation de géométrie. La partie pratique du module sera consacrée à la création, visualisation, modification et optimisation de structures moléculaires. |
Références | "Molecular Modelling: Principles and Applications", Andrew Leach, Prentice Hall, 2001.
"Molecular Modelling for Beginners", Alan Hinchliffe, John Wiley & Sons Ltd, 2003. "Molecular Modeling and Simulation", Tamar Schlick, Springer-Verlag New York Inc., 2010. |
Compétences | Savoir créer une molécule et savoir déterminer sa structure optimale, tant in vacuo que dans un complexe récepteur-ligand. |
Analyse de données multivariées - EMBEA2AM - 3 ECTS
Responsable(s) | Gael Grenouillet |
Mots-clés | Analyses multivariées ; structure des tableaux de données en écologie ; liaisons entre descripteurs (biologiques, environnementaux, ...). |
Objectifs | A l'issue de cet enseignement, les étudiants devront être à même :
|
Prérequis | Une UE de biostatistiques élémentaires est exigée, ainsi que des connaissances de base du logiciel R. |
Contenu | Cet enseignement propose une présentation des principales méthodes d'analyse adaptées aux données multidimensionnelles. Les méthodes abordées seront illustrées à partir d'exemples réels provenant d'études écologiques. L'enseignement cherchera à montrer plus particulièrement en quoi (1) la nature complexe des systèmes biologiques conduit souvent à la nécessité de prendre en compte un grand nombre de descripteurs, et (2) l'écologie est un champ d'application privilégié des diverses méthodes abordées.
Les aspects théoriques indispensables à la compréhension et à la bonne utilisation de ces méthodes seront traités au cours des CM. Les TP, en salle informatique, permettront aux étudiants de mettre en pratique ces méthodes et donner une place importante à l'interprétation écologique des résultats statistiques. Enfin, un projet réalisé en fin d'UE par binôme permettra aux étudiants d'être confrontés à un problème biologique concret. Ce projet portera sur l'analyse d'un jeu de données collecté dans le cadre d'une étude écologique et aboutira à la rédaction d'un rapport et une présentation orale du travail effectué. |
Références | Escoffier & Pagès. Analyses factorielles simples et multiples – Objectifs, méthodes et interprétation. Dunod
Lebart, Piron, & Morineau. Statistiques exploratoire multidimensionnelle. Dunod |
Compétences |
Biostatistiques : Utilisation avancée du modèle linéaire - EMBEA2EM - 3 ECTS
Responsable(s) | Christophe Andalo & Jean-Baptiste Ferdy |
Mots-clés | Statistique ; Modèle linéaire ; Modèle linéaire généralisé |
Objectifs | À l'issue de cet enseignement, les étudiants devront être à même d'analyser un jeu de données complexe en utilisant des modèles linéaires (lm) ou le des modèles linéaires généralisés (glm). Ils devront maîtriser suffisamment les bases théoriques de ces outils pour pouvoir montrer la pertinence de leur choix d'analyse, et interpréter en détail les résultats obtenus. |
Prérequis | Statistiques descriptives, lois de probabilités usuelles, test d'hypothèse, régression linéaire, ANOVA, ANCOVA, utilisation basique du logiciel R. |
Contenu | Cet enseignement propose une présentation détaillée des applications du modèle linéaire et du modèle linéaire généralisé à l'analyse des données biologiques. Les éléments théoriques permettant de comprendre les conditions d'application de ces méthodes d'analyse seront expliqués. L'accent sera mis sur les outils permettant de vérifier que ces conditions d'application sont bien remplies, et sur la démarche à adopter lorsqu'elles ne le sont pas.
L'enseignement sera illustré en travaux pratiques par l'analyse détaillée de jeux de données tirés de travaux en écologie, biologie comportementale et biologie évolutive. |
Références | The R Book, 2nd Edition. M.J. Crawley 2012. Wiley |
Compétences |
Stage - EMBEA2IM - 0 ECTS
Responsable(s) | Gwennaele Fichant |
Mots-clés | Immersion professionnelle |
Objectifs | Ce stage optionnel permet aux étudiants d'avoir un premier contact avec le monde professionnel et donc une première immersion dans une équipe de recherche et développement appartenant soit à un laboratoire du milieu académique ou d'une entreprise. |
Prérequis | |
Contenu | Un stage optionnel d'un à deux mois est proposé en fin d'année universitaire car le besoin d'acquérir et/ou de renforcer des compétences dans différents champs disciplinaires (informatique, mathématiques et bioinformatique) ne permet pas d'introduire un stage obligatoire dans le cursus. Il est cependant fortement conseillé d'effectuer ce stage car il permettra d'apprendre à travailler en équipe, d'organiser son travail de manière à répondre aux échéances exigées par l'encadrant, de trouver des solutions pour résoudre des problèmes qui n'avaient pas été envisagés au départ. C'est également l'opportunité de confronter sa formation académique à des problématiques concrètes et de de mettre en oeuvre les compétences acquises. Il constitue une bonne préparation au stage obligatoire de 6 mois de la seconde année de master. |
Références | |
Compétences |
Master 2 - Semestre 9
Bases de données avancées - EIBIA3AM - 3 ECTS
Responsable(s) | Riad Mokadem |
Mots-clés | Bases de données ; Système de gestion de bases de données ; PL/SQL |
Objectifs | L'objectif de ce cours est de présenter les différentes étapes pour l'évaluation d'une requête relationnelle dans un environnement centralisé. Puis, une introduction à un langage procédural est faite afin d'interroger une base de données. |
Prérequis | Les concepts fondamentaux des bases de données |
Contenu | Traitement d'une requête relationnelle dans un environnement centralisé, langage procédural/SQL, vues relationnelles |
Références | Georges Gardarin - Bases de Données - EYROLLES |
Compétences |
Apprentissage automatique - EIBIA3BM - 3 ECTS
Responsable(s) | Gilles Richard |
Mots-clés | Apprentissage automatique ; Règles d’association ; Réseau de neurones multi-couches |
Objectifs | Equiper les étudiants avec une compréhension des techniques modernes d'apprentissage-fouille de données |
Prérequis | UE de fouille de données du M1 bioinformatique ou équivalent |
Contenu | Approche logique :
Approches numériques :
|
Références | Machine learning (1997) Tom M. Mitchel, Publisher: McGraw-Hill |
Compétences |
Intégration de données hétérogènes - EIBIA3CM - 3 ECTS
Responsable(s) | Abdelkader Hameurlain & Roland Barriot |
Mots-clés | bases de données réparties ; bases de données fédérées ; intégration de bases de données ; médiateur ; graphes ; fusion de données génomiques |
Objectifs | Ce module a pour but d’enseigner aux étudiants comment répartir et intégrer les données hétérogènes issues des approches post-génomiques à différents niveaux.
L'intégration peut s'effectuer au niveau du format des données, au niveau du schéma de bases de données ou encore au de niveau de leur localisation et de leur organisation. Selon le domaine d'application et l'exploitation envisagée des données, les approches varient. Par exemple, la synthèse des connaissances et données peut s'effectuer sous forme de multigraphes ou de matrices pour la priorisation de gènes candidats. Elle peut aussi s'effectuer sous forme d'ordres partiels sur les ensembles dans le contexte de la caractérisation d'ensembles de gènes ou de protéines issus d'expériences à haut débit. |
Prérequis | |
Contenu | Objectifs et fonctions des bases de données réparties.
Conception d'une base de données répartie. Principes d'évaluation de requêtes réparties. Architecture Médiateur-Adaptateur. Principaux problèmes posés par la conception et l'utilisation d'un système d'intégration. Approches existantes pour l'intégration de données biologiques : interconnexion des données, entrepôts de données, approches par médiateurs, synthèse des connaissances et modélisation, transformation et projection des données. Intégration sous forme de multigraphes. Caractérisation d’un ensemble et confrontation de sources de données. Priorisation de gènes candidats et clustering de gènes par fusion de données génomiques. |
Références | Le Client-Serveur, G. et O. Gardarin, Eyrolles, 1996.
Kernel-based Data Fusion for Machine Learning, S. Yu, L.-C. Tranchevent, B. Moor, Y. Moreau, Springer, 2011 |
Compétences | Exploiter un système d'intégration virtuel de données dans un contexte biologique.
Identifier au sein d'un ensemble d'entités biologiques quelles sont les caractéristiques commnunes issues de données hétérogènes en terme de représentation et de sémantique. |
Biologie des systèmes 1 : modélisation et simulation de réseaux biologiques - EIBIA3DM - 6 ECTS
Responsable(s) | Gwennaele Fichant & Georges Czaplicki |
Mots-clés | Biologie des systèmes ; intégration des données ; systèmes biologiques dynamiques ; réseaux d'interactions ; modélisation |
Objectifs | Cet enseignement a pour but d'initier les étudiants à la biologie des systèmes,discipline émergente, dont l'objectif est de caractériser les composants élémentaires d'un système biologique (par exemple, une voie de régulation, une cellule, un écosystème etc.) pour mettre à jour les propriétés qui résultent de leurs interactions, ceci afin de mieux comprendre le comportement dynamique du système dans sa globalité. Les concepts et méthodes développées dans cette discipline seront détaillés et seront accompagnés par leur mise en pratique sur des cas concrets de modélisation de processus biologiques. |
Prérequis | Notions de calcul matriciel; équations différentielles; méthodes de traitement des graphes; méthodes d'analyse des données d'expression obtenues par les techniques à haut débit (NGS); intégration de données. |
Contenu | Les enseignements aborderont : La construction d'un réseau d'interactions en extrayant et intégrant les données expérimentales disponibles (données d'expression, données d'interaction etc.). Pour cela, les différentes approches vues au cours de la première année de master, notamment dans les UE de traitement des données génomiques et post-génomiques et de traitement des graphes et réseaux biologiques seront utilisées et intégrées pour détecter les interactions entre composants du système biologique analysé et pour construire la topologie du réseau d'interactions résultant.
La description des méthodes d'analyse dynamique des réseaux biologiques et de prédiction de leur comportement. Les approches qualitative ainsi que les approches quantitatives seront abordées. Dans le cas des approches qualitatives, la modélisation par équations différentielles linéaires par morceaux et les modèles logiques seront plus particulièrement développés ainsi que les modèles déterministes basés sur les équations différentielles ordinaires, pour les approches quantitatives. Les réseaux de Pétri, outils graphiques et mathématiques permettant de modéliser le comportement dynamique d'un système par une approche qualitative ou quantitative seront également décrits. Les TP aborderont des cas pratiques issus de divers domaines de la biologie comme : les réactions enzymatiques, la croissance de biomasse, l'analyse de processus périodiques et la modélisation de réseaux de régulation. |
Références | An introduction to Systems Biology: Design principles of Biological Circuits (2007). Uri Alon. Chapman & Hall/CRC |
Compétences | Intégrer différentes sources de données en dégageant et interprétant en terme biologique les associations entre les différents types de données de manière à inférer des réseaux de relations pour analyser et comprendre des processus biologiques |
Biologie des systèmes 2 - EIBIA3EM - 9 ECTS
Responsable(s) | Gwennaele Fichant |
Mots-clés | Biologie des Systèmes ; systèmes biologiques dynamiques ; métabolomique ; modélisation ; simulation |
Objectifs | Cet enseignement a pour objectif de former les étudiants à la démarche de la recherche et à l’autoformation en abordant des problématiques scientifiques d’actualité liée au domaine de la biologie des systèmes sous diverses formes d’enseignement (ateliers, conférences). Il a donc également pour but de renforcer les compétences des étudiants en biologie des systèmes. Les approches abordées dans l'UE Biologie des Systèmes 1 seront renforcées et la nature des réseaux étudiés sera diversifiée. De ce fait, de nouvelles méthodes de modélisation seront abordées. |
Prérequis | UE Biologie des Systèmes 1 |
Contenu | Différentes problématiques scientifiques en relation avec la biologie des systèmes seront abordées sous forme d'ateliers ce qui requerra une participation active des étudiants comme par exemple la préparation de l'atelier par la lecture et la présentation orale de publications scientifiques sur le sujet, réalisation de projets personnels ou en groupe, etc.
Parmi les problématiques qui seront abordées, nous pouvons citer : l'analyse topologique et la visualisation des réseaux métaboliques, ainsi que l'analyse du flux des métabolites dans ces réseaux, l'analyse des données de métagénomiques pour l'identification et la caractérisation de communautés microbienne, la phylogénomique, la génétique statistique, incluant la génétique des populations, la génétique quantitative et les modèles qui y sont attachés, la cartographie génétique. Cette liste n’est pas exhaustive et pourra évoluer d’année en année en fonction de l’évolution de la discipline. De plus, dans la mesure du possible, des conférences-débats seront organisées avec des professionnels de manière à mettre en contact les étudiants avec le monde de la recherche et de l'innovation. |
Références | |
Compétences | Comprendre le comportement dynamique d'un système ou processus biologique et prédire son comportement dans de nouvelles conditions en représentant les connaissances scientifiques disponibles dans un modèle mathématique et en confrontant les résultats des simulations numériques aux résultats expérimentaux afin d'aider aux développements d'expérimentations plus ciblées. |
Connaissance de l'entreprise - EIBTA3YM - 3 ECTS
Responsable(s) | Pierre Gavard |
Mots-clés | Entreprises ; brevets ; démarche qualité |
Objectifs | L'objectif est de fournir aux étudiants les bases de la vie d'une entreprise en ce qui concerne l'organisation et le fonctionnement mais aussi au niveau de la propriété intellectuelle et des brevets, les normes qualités et la réglementation. Cet enseignement apporte aussi, au travers de travaux dirigés, les bases du marketing. |
Prérequis | |
Contenu | Connaissance de l'entreprise : objectif et structure d'une entreprise, différents types d'entreprises (PME, groupe), la base des règles de la communication et de management.
Propriété intellectuelle : les bases de la propriété intellectuelle, les règles pour le dépôt des brevets et les recherches de brevets. Normes qualités et réglementation : sensibilisation à la qualité (présentation générale, définitions et objectifs, bases de la règlementation). |
Références | |
Compétences |
Communication scientifique - EIBIA3FM - 3 ECTS
Responsable(s) | Gwennaele Fichant |
Mots-clés | analyse critique de publication ; rédaction scientifique ; recherche bibliographique ; présentation orale |
Objectifs | L’objectif est d'apprendre et de mettre en œuvre la synthèse et la présentation de travaux scientifiques via différents supports de communication. |
Prérequis | |
Contenu | Formation aux bases de données bibliographiques et aux outils de gestion de références bibliographiques.
Méthodes pour la communication orale et écrite. Elaboration de support de communication : diapositives, présentations interactives, poster. Rédaction d'une synthèse de l'état de l'art sous forme d'une revue en anglais respectant un format de journal international. En pratique, chaque étudiant se verra proposer une publication scientifique en relation avec les thématiques abordées dans les UE de biologie des systèmes 1 et 2. L'étudiant devra présenter cette publication à l'oral avec un support écrit en anglais. Le thème de cette publication servira de point de départ pour la synthèse et la rédaction de la mini-revue dont le format suivra celui demandé pour l'écriture d'une revue dans le journal international Genome Biology. |
Références | |
Compétences | Produire une synthèse critique de la bibliographie relative au sujet étudié en ayant évalué la pertinence des informations collectées pour proposer de nouveaux développements et/ou aborder de nouvelles questions de recherche appliquée ou fondamentale. |