Descriptif des enseignements

De Master de Bioinformatique de Toulouse
Aller à : navigation, rechercher

Sommaire

Master 1 - Semestre 7

Harmonisation des connaissances en biologie - EMBIA1IM - 3 ECTS

Responsable(s) Philippe Rousseau & Valérie Lobiois
Mots-clés Biologie cellulaire ; Biologie Moléculaire ; Génétique mendélienne et moléculaire
Objectifs Cette UE est pour les étudiants ne provenant pas de biologie. Les étudiants venant de biologie suivront l'UE d'Algorithmique et complexité. L’objectif est de fournir un enseignement de mise à niveau en Biologie Cellulaire, Biologie Moléculaire et Génétique à des étudiants venant de licences en Physique ou en Informatique.
Prérequis
Contenu Biologie Cellulaire : Introduction générale à la biologie cellulaire. Notion de cellule procaryote et eucaryote. Organisation de la cellule (compartimentation et dynamique intracellulaire). Expression génique et régulation. Mouvements cellulaires. Prolifération, différenciation et mort cellulaire. Enseignement intéractif privilégiant un travail collectif.

Analyse Génétique : Relation gène-fonction. Notions de mutation et d’allèle. Lois de transmission de caractères héréditaires chez les eucaryotes (i.e. : monogénique et digénique). Notions d’indépendance et de liaison génique. Transmission génétique chez les procaryotes. Biologie Moléculaire : Structure du matériel génétique, notions de gène et de génôme. Présentation des grands processus moléculaires de la cellule (i.e. : réplication, transcription, traduction).

Références Biologie (Campbell et Reece - De Boeck)
Compétences Niveau de base (licence) en Biologie Moléculaire, Biologie Cellulaire et Génétique

Algorithmique et complexité - EMBIA1JM - 3 ECTS

Responsable(s) Jérôme Farinas
Mots-clés Algorithmique ; structures ; instructions conditionnelles ; séquences nucléiques et protéiques ; annotations structurées ; complexité asymptotique
Objectifs Cette UE est pour les étudiants provenant de biologie. Les autres étudiants suivront l'UE d'Harmonisation des connaissances en biologie.

Décomposer un programme en éléments de plus petite taille. Analyser le comportement de programmes simples fondés sur les variables, expressions, affectations, E/S, structure de contrôle, fonctions... Créer des algorithmes résolvant des problèmes simples : transcription ADN en ARN, traduction en protéines. Implémenter des algorithmes, les tester et les déboguer. Comprendre les notions et les techniques qui permettent d’analyser la complexité d’algorithmes. Initiation aux systèmes Unix : gestion des fichiers, commandes de base.

Prérequis Mathématiques élémentaires
Contenu Algorithmique
  • Syntaxe élémentaire, notion de variables, constantes...
  • Expressions et affectations
  • Entrées­-sorties simples
  • Structures de contrôle
  • Types de données (entiers, réels, chaîne de caractères, tableaux, listes, dictionnaires)
  • Fonctions

Concepts de la programmation

  • Concept d'algorithme
  • Types d'erreur
  • Compréhension des programmes
  • Algorithmes simples (moyenne, min, max d’une liste, manipulation de séquences ADN, transcription ARN, traduction protéines)
  • Stratégies de résolution de problèmes

Complexité Introduction des notions et techniques qui permettent d’analyser la complexité d’algorithmes. Complexité de boucles, pour ou tant­que, dans le cas le pire et le cas moyen.

Systèmes Unix :

  • introduction aux système de gestion de fichiers
  • commandes SHELL de base, notions de filtrages et d'entrées sorties
Références Algorithmes­ - Notions de base. Thomas H. Cormen. Dunod, 2013.

Unix, Initiation et utilisation : Colin, Armspach, Ostré-Waerzeggers, Dunod, 2004

Compétences Modéliser un problème simple et savoir implémenter un algorithme pour le résoudre.

Analyser la complexité d’algorithmes itératifs et de structures de données.

Programmation en bioinformatique - EMBIA1BM - 3 ECTS

Responsable(s) Thomas Pellegrini
Mots-clés Algorithmique ; structures ; instructions conditionnelles ; programmation impérative ; Biopython ; séquences génomiques nucléiques et protéiques ; annotations structurées ; ontologies
Objectifs Apprentissage de la programmation structurée avec des langages impératifs.Savoir utiliser des structures classiques. Mise en œuvre en utilisant un langage impératif. Utilisation de bibliothèques de programmation dédiée à la bioinformatique, notamment pour la manipulation de séquences (nucléiques et protéiques) ainsi que l’exploitation de diverses sources et format de données.
Prérequis Algorithmique (UE EMBIA1JM)
Contenu Notions fondamentales
  • Expressions : types de données élémentaires, affectation, opérateurs arithmétiques
  • Conditions : structures conditionnelles / expressions booléennes
  • Itérations : structures itératives, types listes et chaînes de caractères
  • Fonctions définies par le programmeur
  • Gestion des entrées et sorties : interactif, lecture et écriture de fichiers, formats compressés

Notions complémentaires

  • Types structurés : dictionnaires
  • Expressions régulières
  • Modules : importation et création
  • Modules spécifiques : matplotlib (graphique), biopython (bio-informatique), numpy (algèbre), pandas (analyse de données)
  • Algorithmes de tri
  • Algorithmes de comptage, de recherche et de comparaison de séquences ADN
Références Apprendre à programmer avec Python 3, Gérard Swinnen, Eyrolles
Compétences Maîtriser les notions fondamentales théoriques et pratiques d'un langage impératif

Savoir décomposer un problème en petits sous-problèmes et être capable d'implémenter une solution Savoir comment évaluer la performance d'un programme

Mathématiques pour la biologie - EMBIA1EM - 3 ECTS

Responsable(s) Sandrine Mouysset & Roland Barriot
Mots-clés systèmes linéaires ; vecteurs/valeurs propres ; équations différentielles ; probabilités
Objectifs Initiation théorique aux bases d'algèbre linéaire, d'analyse et de probabilités. Représentation matricielle. Modélisation de problèmes dynamiques : résolution d'équations différentielles. Présentation des algorithmes numériques pour résoudre ces problèmes. Probabilités. Mise en application dans le cadre d’un projet applicatif en biologie des notions théoriques et algorithmes vus en cours.
Prérequis
Contenu Algèbre Linéaire
  • Opérations élémentaires sur les matrices
  • Déterminant
  • Diagonalisation : recherche de vecteurs/valeurs propres.
  • résolutions de systèmes linéaires,

Analyse

  • intégration,
  • équations différentielles,
  • optimisation,
  • Droite de régression : problème des moindres carrés ordinaires

Probabilités

  • Probabilités conditionnelles, règles de Bayes
  • Variables aléatoires discrètes et continues : lois de probabilités, espérances, variances, covariance, corrélation
  • modèle linéaire
Références Mathématiques pour les Sciences de la vie et de la Terre – C. David, S. Mustapha, F. Viens, N. Capron, edition Dunod
Compétences Savoir utiliser des outils mathématiques d'algèbre linéaire, d'analyse et de probabilités pour représenter et analyser des données biologiques, modéliser des problèmes dynamiques.

Traitement des données biologiques - EMBIA1FM - 3 ECTS

Responsable(s) Maxime Bonhomme
Mots-clés statistiques descriptives ; probabilités ; échantillonnage ; test statistique ; analyse transcriptomique
Objectifs A la fin de cette UE, les étudiants auront acquis les notions fondamentales pour (i) décrire des données biologiques (incluant des données de transcriptome), (ii) tester des hypothèses liées aux données grâce à des méthodes statistiques dédiées, et (iii) interpréter biologiquement les résultats de ce traitement.
Prérequis Connaissances de bases en mathématiques. Notion d'expression génique.
Contenu Cours :
  • statistiques descriptives (une ou plusieurs variables, représentations graphiques, introduction aux analyses multivariées)
  • statistiques inférentielles (loi de probabilité, distribution d’échantillonnage, estimation ponctuelle, estimation par intervalle de confiance, tests paramétriques/ non paramétriques)

Ce contenu sera traité au travers d’exemples biologiques.

  • introduction au traitement des données post-génomiques par l’analyse de données de transcriptome (filtrage, normalisation, test d’expression différentielle d’un gène, recherche de co-régulations géniques par clustering).
Références The R Book (Mickael J Crawley)
Compétences Savoir décrire des données biologiques (incluant des données de transcriptome). Savoir tester des hypothèses liées aux données biologiques récoltées suite à l'experimentation/l'échantillonnage, et utiliser des approches statistiques courantes en sciences biologiques. Savoir interpréter biologiquement les résultats du traitement statistique. Maitriser un outil informatique appliqué à l’analyse statistique (logiciel R).

Introduction aux bases de données - EMBIA1AM - 3 ECTS

Responsable(s) Shaoyi YIN
Mots-clés bases de données relationnelles ; modélisation ; algèbre relationnelle ; LDD ; LMD ; language SQL
Objectifs L'objectif de ce cours est d'apprendre aux étudiants à concevoir une base de données et de l’interroger en algèbre relationnelle ainsi qu'en langage déclaratif tel que le langage SQL.
Prérequis
Contenu
  1. Définition, objectifs des bases de données et fonctions des SGBD
  2. Modèles de données
    • Modèle conceptuel : modèle Entité/Association E/A
    • Modèle logique : modèle relationnel
  3. Algèbre relationnelle
  4. Langages de définition et de manipulation des bases de données relationnelles
    • LDD : Langage de Définition de Données
    • LMD: Langage de Manipulation de Données
Références Gardarin G., "Bases de données", Edition Eyrolles, 2003 (ISBN 2-212-11281-5).
Compétences
  • Maîtriser les concepts fondamentaux des bases de données relationnelles
  • Savoir concevoir une base de données relationnelle
  • Maîtriser le langage SQL

Bioinformatique des séquences - EMBIA1CM - 3 ECTS

Responsable(s) Catherine Mathé
Mots-clés Algorithmes pour la comparaison de séquences ; heuristique ; profils
Objectifs Comprendre les concepts et algorithmes sous-jacents aux principaux outils de comparaison de séquences biologiques afin d’être capable de choisir la méthode la plus pertinente pour répondre à une problématique.
Prérequis Connaissance de biologie moléculaire et de bases en bioanalyse (contenu des banques, interrogation, recherche d'homologues).
Contenu Les cours viseront à montrer la différence entre un alignement exact (Needleman et AW56 Smith et Waterman) ou approché via des heuristiques (type BLAST) ; l'intérêt de la méthode de programmation dynamique pour la comparaison de séquences ; comprendre les différentes approches en alignement multiple de séquences : méthodes locales et globales, progressives versus itératives ; connaître les méthodes de caractérisation (signature, profile) et la recherche de motifs communs entre plusieurs séquences.

La mise en pratique de ces différentes méthodes sera faite lors de séances de travaux dirigés et pratiques, en insistant sur leurs avantages ou leurs limites.

Références Bio-informatique. Principes d'utilisation des outils. 2010. D. Tagu, J.L. Risler, coord. Ed Quae

Bioinformatique - Cours et applications. 2ème édition. 2015. G. Deléage et M. Gouy. Dunod

Compétences Etre capable d'élaborer une stratégie et de choisir et utiliser les méthodes ad hoc pour comparer des ensembles de séquences et en dégager des informations pertinentes.

Bioinformatique pour la Génomique - EMBIA1DM - 3 ECTS

Responsable(s) Gwennaele Fichant
Mots-clés Annotation de génomes ; Modèle de Markov caché ; génomique comparative ; alignement de génomes ; synténie
Objectifs Cet enseignement permettra aux étudiants d'acquérir les approches d'analyses des données de génomes, plus particulièrement l'annotation des séquences génomiques et la génomique comparative. Les concepts et les questions biologiques sous-jacents à ces approches seront abordés et seront suivis de leur mise en pratique sur des cas concrets.
Prérequis
Contenu Les cours aborderont :

1) la description de la conception d'un prédicteur de gène et des différentes méthodes qui doivent être mise en œuvre pour effectuer les mesures nécessaires sur la séquence génomique analysée (type contenu, signal, similarité) et comment ces différentes informations sont intégrées dans un modèle de structure de gène qui sera ensuite implémenté dans une solution logicielle permettant de réaliser la prédiction de la structure optimale. Parmi ces approches, les modèles de Markov cachés (HMM) permettant de réaliser des modèles probabilistes d’une suite de problèmes linéaires labellisés seront plus particulièrement développés. 2) la description des concepts et des hypothèses fonctionnelles qui sous-tendent les approches de génomique comparative. 3) la description des méthodes d'alignement de génomes qui permettent d'identifier les régions coeurs de l'ensemble des génomes analysés et qui sont donc utilisées en génomique comparative. Les séances de TD permettront d'illustrer les approches exposées en cours par l’analyse de problématiques biologiques tirées de publications scientifiques en anglais. Les séances de TP auront lieu sur ordinateur de manière à mettre en pratique les approches et démarches théoriques décrites en cours.

Références Biological sequences analysis: Probabilistic Models of Proteins and Nucleic Acids (1998) R. Durbin, S. Eddy, A. Krogh, G. Mitchison. Cambridge University Press.
Compétences

Traitement de graphes et réseaux biologiques - EMBIA1KM - 3 ECTS

Responsable(s) Roland Barriot
Mots-clés parcours ; plus courts chemins ; marches aléatoires ; partitionnement de graphes ; détection de communautés ; modularité ; réseau d'interaction ; réseau de régulation ; réseau métabolique
Objectifs Dans ce module, les étudiants aborderont les concepts et les algorithmes de base en théorie des graphes. Quelques problèmes classiques de biologie seront revisités à la lumière de ces concepts. Les réseaux d’interactions moléculaires (régulation transcriptionnelle, réseaux métaboliques, réseaux d’interactions protéiques) et les problèmes de graphes associés constitueront des applications privilégiées.
Prérequis Algorithmique ; Programmation ; Métabolisme ; Génétique
Contenu Concepts et définitions

Graphes et réseaux rencontrés en biologie et bioinformatique Représentations informatiques et manipulations Formats de stockage Logiciels de visualisations, d'éditions et d'analyse Librairies et boites à outils Algorithme de parcours et de dessin Arbres couvrants Détection de motifs Partitionnement et détection de communautés

Références Introduction to Algorithms, Corsen, Leiserson and Rivest, MIT Press and McGraw-Hill
Compétences Générer, éditer, manipuler et visualiser différents types de graphes.

Elaborer et mettre en œuvres des méthodes originales de parcours de réseaux biologiques. Comparer les résultats de différentes méthodes de partitionnement de graphes, sélectionner les résultats biologiquement pertinents et interpréter les communautés obtenues.

Génétique évolutive et quantitative - EMBIA1GM - 3 ECTS

Responsable(s) Maxime Bonhomme
Mots-clés génétique ; population ; évolution ; caractère quantitatif ; cartographie génétique
Objectifs Ce module permettra aux étudiants d'acquérir et de mettre en pratique les concepts fondamentaux de l’évolution génétique et phénotypique des populations par des approches de génétique des populations et de génétique des caractères quantitatifs. L’accent sera mis sur les approches statistiques nécessaires à l’analyse des données génétiques, dont le nombre a explosé suite au séquençage à haut débit. Des problèmes concrets de génétique végétale mais aussi animale seront abordés.
Prérequis Notion de génétique Mendélienne (ségrégation des caractères) et de polymorphisme moléculaire.
Contenu Cours:
  • Génétique des populations: mesures du polymorphisme génétique, modèle de Hardy-Weinberg, systèmes de reproduction (autogamie, consanguinité,..), forces évolutives (mutation, sélection, dérive génétique, migration).
  • Génétique quantitative: modèle polygénique des caractères quantitatifs, modèle qualitatif, notion d’héritabilité, notion de ressemblance / apparentement génétique, principes de la cartographie de Quantitative Trait Loci (QTL) et de la génétique d’association.

TD : Application des notions abordées, au travers d’exercices.

TP : Mise en pratique avec R et divers logiciels d’analyse génétique, au travers d’exemples issus du monde végétal et animal.

Références Précis de génétique des populations (Jean-Pierre Henry, Pierre-Henry Gouyon, ed Dunond)

Introduction to quantitative genetics (Falconer & Mackay) Handbook of statistical genetics (Balding, Bishop, Cannings)

Compétences Savoir mesurer le polymorphisme génétique des populations, et connaitre l'effet des systèmes de reproduction et des forces évolutives sur la diversité allélique et génotypique.

Savoir décrire un caractère quantitatif et évaluer l'importance des gènes et de l'apparentement dans la variabilité du caractère (héritabilité).

Connaitre le principe des approches de cartographie génétique des caractères quantitatifs (QTL, association).

Master 1 - Semestre 8

Programmation avancée - EMBIA2AM - 6 ECTS

Responsable(s) Mathieu Raynal
Mots-clés Modélisation objet ; UML ; Programmation orientée objet ; JAVA ; Classes ; Objets ; Héritage
Objectifs
  • Maitriser la modélisation objets d’un programme informatique
  • Connaitre les différents concepts de la programmation orientée objet
  • Savoir développer une application en utilisant une approche orientée objet
  • Maitriser l’utilisation d’API dans le développement d’un programme informatique
  • Connaitre les principaux éléments permettant de concevoir et développer une interface graphique
Prérequis
  • Bonne connaissance des base de l’algorithmique
  • Première expérience avec un langage de programmation
Contenu Partie génie logiciel : Modélisation avec UML
  • Introduction sur l'intéret de la modélisation
  • Présentation des cas d'utilisation et des principaux diagrammes (diagramme de classe, de séquence, d’état transition)

Partie programmation orientée objet - Langage JAVA

  • Introduction du langage JAVA
  • Présentation des différents outils de compilation, éxecution, documentation, etc. et des principaux environnements de programmation (Eclipse, NetBeans)
  • Notion de classe et objet
    • Principales caractéristiques d'une classe (notion d'attributs, constructeurs, méthodes, visibilité)
    • Instanciation des classes,
    • Utilisation de package
    • Lien avec la modélisation UML
  • Notion avancée de programmation orientée objet : héritage, interface, classe abstraite
  • Gestion des exceptions
  • Présentation d'API
    • Différentes structures de données
    • Gestion des flux de données : utilisation de fichiers, lecture et écriture dans des flux, sérialisation, parseur XML
    • Introduction aux interfaces graphiques et à la programmation événementielle
Références
Compétences Être capable de modéliser et développer une application complète (avec, par exemple, la gestion de la lecture et écriture dans des fichiers, et la conception d'une interface graphique) en utilisant la programmation orientée objet.

Fouille de données - EMBIA2DM - 3 ECTS

Responsable(s) Roland Barriot
Mots-clés prétraitement des données ; classification et prédiction ; caractérisation et discrimination ; règles d’association
Objectifs Cette UE a pour but d’initier les étudiants aux techniques modernes de fouilles de données permettant de

prédire, par exemple, si celui qui achète du pain et du beurre va acheter de la confiture, s’il est raisonnable pour une banque d'attribuer une carte de crédit, si la protéase PfSUB1 joue un rôle dans la division de Plasmodium falciparum (parasite responsable de la malaria), ou encore de diagnostiquer un sous-type de cancer du sein à partir de données de puces à ADN de la patiente. En général, plusieurs méthodes peuvent être utilisées, plus ou moins performantes : il s’agit donc de les comprendre, d’apprendre à les mettre en œuvre et d’estimer leur performances.

Prérequis Statistiques, programmation
Contenu Mesures de distance, similarité, dissemblance

Normalisation et transformation Classification - Arbre de décision et forêts aléatoires - Méthodes bayésiennes - k plus proches voisins - Analyse discriminante linéaire Clustering - k means, k medoids - Clustering hiérarchique - Méthodes basées sur la densité - Méthodes basées sur une grille Evaluation des performances Extraction de règles d'association et d'itemsets fréquents Logiciels, librairies et boites à outils disponibles

Références Data Mining: Concepts and Techniques, J. Han and M. Kamber, 2006.
Compétences Constituer un jeu de données d'apprentissage pour l'inférence d'un modèle prédictif.

Evaluer les performances d'une méthode de classification, d'un classificateur, ou d'un jeu de paramètres. Sélectionner et mettre en œuvre une méthode de clustering ainsi que évaluer et interpréter le résultat obtenu.

Traitement de données post-génomiques - EMBIA2BM - 6 ECTS

Responsable(s) Raphael Mourad
Mots-clés Haut-débit ; Assemblage de génome ; SNP ; RNA-seq ; small RNA-seq ; Protéomique
Objectifs Cette unité d'enseignement a pour objectif de fournir une large palette de connaissances et de compétences en bioinformatiques et biostatistiques appliquées à un domaine en constante évolution en biologie moderne: la post-génomique. Cette dernière cherche à étudier la fonction et l'expression des gènes séquencés en génomique par la caractérisation systématique du rôle des mutations, de l'expression des ARN messagers, des ARN non-codants, ainsi que des protéines. Les données générées par la post-génomique sont extrêmement volumineuses et de très grandes dimensions (Big Data). C'est pourquoi elles nécessitent le développement et l'utilisation d'outils adaptés provenant à la fois de l'informatique et des statistiques. Les applications sont nombreuses: génétique humaine, cancérologie, métagénomique, mais aussi, amélioration des espèces d'intérêt agronomique et étude de l'évolution des espèces.
Prérequis Connaissances en biologie moléculaire, génomique, biochimie des protéines, ainsi qu'en algorithmique, théorie des graphes et traitement statistique de données.
Contenu Cette unité d'enseignement comporte 4 ateliers différents: assemblage de génome et détection de SNP, analyse de données RNA-seq , analyse de données small RNA-seq et analyse de données protéomiques . Le premier atelier consiste à appréhender et savoir utiliser les concepts et méthodes pour la manipulation de gros fichiers de séquences, l'alignement des séquences sur le génome, l'assemblage de novo de génomes, la détection de SNP ainsi que leur annotation fonctionnelle. Le second atelier traite de la mesure du niveau d'expression des ARN messagers, de l'analyse différentielle, des méthodes d'enrichissement d'ensemble de gènes et de la détection de variants d'épissage alternatif. Le troisième atelier permet de caractériser les différentes familles d'ARN non codants produites par les protocoles de séquençage, d'employer les banques de données pour annoter ses ARN non codants et de maîtriser les méthodes bioinformatiques pour parser les séquences, générer la matrice de comptage qui servira d'entrée à la normalisation et à l'analyse différentielle. Le quatrième atelier consiste à identifier et quantifier les protéines d'un mélange complexe de protéines à partir de données issues de spectrométrie de masse avec, par exemple, des cartes peptidiques massiques ou par spectrométrie de masse en tandem. Pour cela, des algorithmes bioinformatiques sont utilisés pour l’identification de peptides et de protéines à l'aide des base de données usuelles.
Références Pevsner. Bioinformatics and Functional Genomics, 2015.

Datta and Nettelton. Statistical Analysis of Next Generation Sequencing Data, 2014. Wu and Choudry, Next Generation Sequencing in Cancer Research, 2013.

Compétences L'étudiant acquiera des compétences variées en analyse de données haut-débit de types séquençage nouvelle génération et spectrométrie de masse. L'étudiant sera ainsi capable d'utiliser les outils les plus populaires pour l'analyse de données haut-débit tels que le logiciel R, mais sera aussi en mesure d'interpréter et d'intégrer les données dans leur contexte biologique.

Evolution moléculaire - EMBIA2EM - 3 ECTS

Responsable(s) Gwennaele Fichant
Mots-clés évolution ; méthodes de reconstruction d’arbre phylogénétique ; congruence ; bootstrap ; sélection naturelle ; dérive
Objectifs Cet enseignement a pour but d'initier les étudiants aux analyses d'évolution moléculaire. Les concepts et méthodes développées dans cette discipline seront détaillés et seront accompagnés par leur mise en pratique sur des cas concrets de reconstruction phylogénétique. L'accent sera mis sur l'interprétation évolutive des arbres obtenus.
Prérequis
Contenu Cette UE introduira les concepts de l’évolution puis présentera les différents modèles d'évolution des séquences génomiques (ADN et protéines) et les différentes approches de reconstruction d’arbres (parcimonie, méthode de distances, méthode du maximum de vraisemblance). Les méthodes permettant le choix du modèle évolutif le plus adapté aux données traitées, celles utilisées pour analyser la stabilité de la topologie et celles permettant l'analyse de la congruence de plusieurs arbres seront également développées. L'étude de l'impact des forces évolutives (sélection naturelle, dérive,…) sur le polymorphisme des séquences sera aussi abordé. Les concepts et approches vus en cours seront illustrés par des cas concrets (évolution des séquences d'une famille de protéines, pression de sélection sur certains gènes et régions du génome, reconstruction de la phylogénie d'un ensemble d'espèces, etc) lors de séances de TP sur ordinateurs. Au cours des TD, l'accent sera mis sur l'interprétation évolutive des topologies d'arbres (détection des évènements de duplication et/ou perte de gène, de transferts horizontaux etc.)
Références Concepts et Méthodes en Phylogénie Moléculaire (2010). Guy Perrière et Céline Brochier-Armanet. Collection IRIS, Springer

Computational Molecular Evolution. Ziheng Yang. Oxford University Press.

Compétences Mettre en œuvre une analyse évolutive des séquences d'une famille de gènes/protéines en utilisant les bonnes pratiques du choix du modèle évolutif le plus adapté aux données et des méthodes de reconstruction d'arbres.

Evaluer les différents types de sélection et leur impact sur le polymorphisme des séquences, et mettre en oeuvre une méthode de recherche de traces de sélection (tests de neutralité). Interpréter un arbre phylogénétique pour proposer un scénario évolutif des séquences analysées.

Projet tutoré - EMBIA2CM - 3 ECTS

Responsable(s) Jérôme Farinas
Mots-clés méthodologie de travail ; travail en groupe ; suivi de projet ; techniques web
Objectifs Mettre en œuvre des techniques de méthodologie de travail et d'organisation de projet informatiques
Prérequis
Contenu Partie I

Méthodologie de travail en groupe et de suivi de projet. Techniques de publication Web.

Partie II
Projets en groupes de 3 à 4 personnes. Travail sur des thématiques de Bioinformatique mettant en œuvre de la programmation, des bases de données et de la création de sites Web. Utilisation de techniques de travail en groupe et de suivi de projets. Évaluation par des rapports de suivi de projet et une soutenance orale.

Références PMI, management de projet : un référentiel de connaissances, AFNOR, 2004

Management d'un projet système d'information : principes, techniques, mise en œuvre et outils, Chantal Morley, Dunod, 2006

Compétences maîtrise des techniques de management des projets informatiques dans le domaine de la bioinformatique

Modélisation moléculaire - EMBIA2FM - 3 ECTS

Responsable(s) Georges Czaplicki
Mots-clés Visualisation et manipulation de molécules ; structure et dynamique moléculaire ; champs de force ; minimisation d'énergie ; complexe récepteur-ligand
Objectifs Ce module a pour but d'initier les étudiants aux concepts de base de la modélisation moléculaire. A l'issu de cet enseignement l'étudiant sera capable de créer une molécule et de déterminer sa structure optimale, tant in vacuo que dans un complexe récepteur-ligand.
Prérequis
Contenu Présentation de concepts de base de la modélisation de structures biomoléculaires. Seront abordés les aspects théoriques et computationnels de la détermination de structures tridimensionnelles de molécules d'intérêt biologique par l'approche empirique, basée sur le champ de force et l'optimisation de géométrie. La partie pratique du module sera consacrée à la création, visualisation, modification et optimisation de structures moléculaires.
Références "Molecular Modelling: Principles and Applications", Andrew Leach, Prentice Hall, 2001.

"Molecular Modelling for Beginners", Alan Hinchliffe, John Wiley & Sons Ltd, 2003. "Molecular Modeling and Simulation", Tamar Schlick, Springer-Verlag New York Inc., 2010.

Compétences Savoir créer une molécule et savoir déterminer sa structure optimale, tant in vacuo que dans un complexe récepteur-ligand.

Analyse de données multivariées - EMBEA2AM - 3 ECTS

Responsable(s) Gael Grenouillet
Mots-clés Analyses multivariées ; structure des tableaux de données en écologie ; liaisons entre descripteurs (biologiques, environnementaux, ...).
Objectifs A l'issue de cet enseignement, les étudiants devront être à même :
  • d'organiser des données et de formuler une problématique pertinente
  • de choisir la (ou les) méthode(s) d'analyse en fonction de la nature des données et de la problématique formulée
  • de mettre en œuvre ces méthodes (utilisation du logiciel R)
  • de représenter graphiquement et d'interpréter les résultats
  • de rédiger les conclusions dans un rapport de synthèse
Prérequis Une UE de biostatistiques élémentaires est exigée, ainsi que des connaissances de base du logiciel R.
Contenu Cet enseignement propose une présentation des principales méthodes d'analyse adaptées aux données multidimensionnelles. Les méthodes abordées seront illustrées à partir d'exemples réels provenant d'études écologiques. L'enseignement cherchera à montrer plus particulièrement en quoi (1) la nature complexe des systèmes biologiques conduit souvent à la nécessité de prendre en compte un grand nombre de descripteurs, et (2) l'écologie est un champ d'application privilégié des diverses méthodes abordées.

Les aspects théoriques indispensables à la compréhension et à la bonne utilisation de ces méthodes seront traités au cours des CM. Les TP, en salle informatique, permettront aux étudiants de mettre en pratique ces méthodes et donner une place importante à l'interprétation écologique des résultats statistiques. Enfin, un projet réalisé en fin d'UE par binôme permettra aux étudiants d'être confrontés à un problème biologique concret. Ce projet portera sur l'analyse d'un jeu de données collecté dans le cadre d'une étude écologique et aboutira à la rédaction d'un rapport et une présentation orale du travail effectué.

Références Escoffier & Pagès. Analyses factorielles simples et multiples – Objectifs, méthodes et interprétation. Dunod

Lebart, Piron, & Morineau. Statistiques exploratoire multidimensionnelle. Dunod

Compétences

Biostatistiques : Utilisation avancée du modèle linéaire - EMBEA2EM - 3 ECTS

Responsable(s) Christophe Andalo & Jean-Baptiste Ferdy
Mots-clés Statistique ; Modèle linéaire ; Modèle linéaire généralisé
Objectifs À l'issue de cet enseignement, les étudiants devront être à même d'analyser un jeu de données complexe en utilisant des modèles linéaires (lm) ou le des modèles linéaires généralisés (glm). Ils devront maîtriser suffisamment les bases théoriques de ces outils pour pouvoir montrer la pertinence de leur choix d'analyse, et interpréter en détail les résultats obtenus.
Prérequis Statistiques descriptives, lois de probabilités usuelles, test d'hypothèse, régression linéaire, ANOVA, ANCOVA, utilisation basique du logiciel R.
Contenu Cet enseignement propose une présentation détaillée des applications du modèle linéaire et du modèle linéaire généralisé à l'analyse des données biologiques. Les éléments théoriques permettant de comprendre les conditions d'application de ces méthodes d'analyse seront expliqués. L'accent sera mis sur les outils permettant de vérifier que ces conditions d'application sont bien remplies, et sur la démarche à adopter lorsqu'elles ne le sont pas.

L'enseignement sera illustré en travaux pratiques par l'analyse détaillée de jeux de données tirés de travaux en écologie, biologie comportementale et biologie évolutive.

Références The R Book, 2nd Edition. M.J. Crawley 2012. Wiley
Compétences

Stage - EMBEA2IM - 0 ECTS

Responsable(s) Gwennaele Fichant
Mots-clés Immersion professionnelle
Objectifs Ce stage optionnel permet aux étudiants d'avoir un premier contact avec le monde professionnel et donc une première immersion dans une équipe de recherche et développement appartenant soit à un laboratoire du milieu académique ou d'une entreprise.
Prérequis
Contenu Un stage optionnel d'un à deux mois est proposé en fin d'année universitaire car le besoin d'acquérir et/ou de renforcer des compétences dans différents champs disciplinaires (informatique, mathématiques et bioinformatique) ne permet pas d'introduire un stage obligatoire dans le cursus. Il est cependant fortement conseillé d'effectuer ce stage car il permettra d'apprendre à travailler en équipe, d'organiser son travail de manière à répondre aux échéances exigées par l'encadrant, de trouver des solutions pour résoudre des problèmes qui n'avaient pas été envisagés au départ. C'est également l'opportunité de confronter sa formation académique à des problématiques concrètes et de de mettre en oeuvre les compétences acquises. Il constitue une bonne préparation au stage obligatoire de 6 mois de la seconde année de master.
Références
Compétences

Master 2 - Semestre 9

Bases de données avancées - EIBIA3AM - 3 ECTS

Responsable(s) Riad Mokadem
Mots-clés Bases de données ; Système de gestion de bases de données ; PL/SQL
Objectifs L'objectif de ce cours est de présenter les différentes étapes pour l'évaluation d'une requête relationnelle dans un environnement centralisé. Puis, une introduction à un langage procédural est faite afin d'interroger une base de données.
Prérequis Les concepts fondamentaux des bases de données
Contenu Traitement d'une requête relationnelle dans un environnement centralisé, langage procédural/SQL, vues relationnelles
Références Georges Gardarin - Bases de Données - EYROLLES
Compétences

Apprentissage automatique - EIBIA3BM - 3 ECTS

Responsable(s) Gilles Richard
Mots-clés Apprentissage automatique ; Règles d’association ; Réseau de neurones multi-couches
Objectifs Equiper les étudiants avec une compréhension des techniques modernes d'apprentissage-fouille de données
Prérequis UE de fouille de données du M1 bioinformatique ou équivalent
Contenu Approche logique :
  • Induction versus déduction
  • Règles d'association
  • Programmation logique inductive

Approches numériques :

  • Réseaux Bayesiens
  • Réseau de neurones, Perceptron et backpropagation
  • Réseau de neurones multi-couches
  • Machines à vecteurs support (SVM)
Références Machine learning (1997) Tom M. Mitchel, Publisher: McGraw-Hill
Compétences

Intégration de données hétérogènes - EIBIA3CM - 3 ECTS

Responsable(s) Abdelkader Hameurlain & Roland Barriot
Mots-clés bases de données réparties ; bases de données fédérées ; intégration de bases de données ; médiateur ; graphes ; fusion de données génomiques
Objectifs Ce module a pour but d’enseigner aux étudiants comment répartir et intégrer les données hétérogènes issues des approches post-génomiques à différents niveaux.

L'intégration peut s'effectuer au niveau du format des données, au niveau du schéma de bases de données ou encore au de niveau de leur localisation et de leur organisation. Selon le domaine d'application et l'exploitation envisagée des données, les approches varient. Par exemple, la synthèse des connaissances et données peut s'effectuer sous forme de multigraphes ou de matrices pour la priorisation de gènes candidats. Elle peut aussi s'effectuer sous forme d'ordres partiels sur les ensembles dans le contexte de la caractérisation d'ensembles de gènes ou de protéines issus d'expériences à haut débit.

Prérequis
Contenu Objectifs et fonctions des bases de données réparties.

Conception d'une base de données répartie. Principes d'évaluation de requêtes réparties. Architecture Médiateur-Adaptateur. Principaux problèmes posés par la conception et l'utilisation d'un système d'intégration. Approches existantes pour l'intégration de données biologiques : interconnexion des données, entrepôts de données, approches par médiateurs, synthèse des connaissances et modélisation, transformation et projection des données. Intégration sous forme de multigraphes. Caractérisation d’un ensemble et confrontation de sources de données. Priorisation de gènes candidats et clustering de gènes par fusion de données génomiques.

Références Le Client-Serveur, G. et O. Gardarin, Eyrolles, 1996.

Kernel-based Data Fusion for Machine Learning, S. Yu, L.-C. Tranchevent, B. Moor, Y. Moreau, Springer, 2011

Compétences Exploiter un système d'intégration virtuel de données dans un contexte biologique.

Identifier au sein d'un ensemble d'entités biologiques quelles sont les caractéristiques commnunes issues de données hétérogènes en terme de représentation et de sémantique.

Biologie des systèmes 1 : modélisation et simulation de réseaux biologiques - EIBIA3DM - 6 ECTS

Responsable(s) Gwennaele Fichant & Georges Czaplicki
Mots-clés Biologie des systèmes ; intégration des données ; systèmes biologiques dynamiques ; réseaux d'interactions ; modélisation
Objectifs Cet enseignement a pour but d'initier les étudiants à la biologie des systèmes,discipline émergente, dont l'objectif est de caractériser les composants élémentaires d'un système biologique (par exemple, une voie de régulation, une cellule, un écosystème etc.) pour mettre à jour les propriétés qui résultent de leurs interactions, ceci afin de mieux comprendre le comportement dynamique du système dans sa globalité. Les concepts et méthodes développées dans cette discipline seront détaillés et seront accompagnés par leur mise en pratique sur des cas concrets de modélisation de processus biologiques.
Prérequis Notions de calcul matriciel; équations différentielles; méthodes de traitement des graphes; méthodes d'analyse des données d'expression obtenues par les techniques à haut débit (NGS); intégration de données.
Contenu Les enseignements aborderont : La construction d'un réseau d'interactions en extrayant et intégrant les données expérimentales disponibles (données d'expression, données d'interaction etc.). Pour cela, les différentes approches vues au cours de la première année de master, notamment dans les UE de traitement des données génomiques et post-génomiques et de traitement des graphes et réseaux biologiques seront utilisées et intégrées pour détecter les interactions entre composants du système biologique analysé et pour construire la topologie du réseau d'interactions résultant.

La description des méthodes d'analyse dynamique des réseaux biologiques et de prédiction de leur comportement. Les approches qualitative ainsi que les approches quantitatives seront abordées. Dans le cas des approches qualitatives, la modélisation par équations différentielles linéaires par morceaux et les modèles logiques seront plus particulièrement développés ainsi que les modèles déterministes basés sur les équations différentielles ordinaires, pour les approches quantitatives. Les réseaux de Pétri, outils graphiques et mathématiques permettant de modéliser le comportement dynamique d'un système par une approche qualitative ou quantitative seront également décrits.

Les TP aborderont des cas pratiques issus de divers domaines de la biologie comme : les réactions enzymatiques, la croissance de biomasse, l'analyse de processus périodiques et la modélisation de réseaux de régulation.

Références An introduction to Systems Biology: Design principles of Biological Circuits (2007). Uri Alon. Chapman & Hall/CRC
Compétences Intégrer différentes sources de données en dégageant et interprétant en terme biologique les associations entre les différents types de données de manière à inférer des réseaux de relations pour analyser et comprendre des processus biologiques

Biologie des systèmes 2 - EIBIA3EM - 9 ECTS

Responsable(s) Gwennaele Fichant
Mots-clés Biologie des Systèmes ; systèmes biologiques dynamiques ; métabolomique ; modélisation ; simulation
Objectifs Cet enseignement a pour objectif de former les étudiants à la démarche de la recherche et à l’autoformation en abordant des problématiques scientifiques d’actualité liée au domaine de la biologie des systèmes sous diverses formes d’enseignement (ateliers, conférences). Il a donc également pour but de renforcer les compétences des étudiants en biologie des systèmes. Les approches abordées dans l'UE Biologie des Systèmes 1 seront renforcées et la nature des réseaux étudiés sera diversifiée. De ce fait, de nouvelles méthodes de modélisation seront abordées.
Prérequis UE Biologie des Systèmes 1
Contenu Différentes problématiques scientifiques en relation avec la biologie des systèmes seront abordées sous forme d'ateliers ce qui requerra une participation active des étudiants comme par exemple la préparation de l'atelier par la lecture et la présentation orale de publications scientifiques sur le sujet, réalisation de projets personnels ou en groupe, etc.

Parmi les problématiques qui seront abordées, nous pouvons citer : l'analyse topologique et la visualisation des réseaux métaboliques, ainsi que l'analyse du flux des métabolites dans ces réseaux, l'analyse des données de métagénomiques pour l'identification et la caractérisation de communautés microbienne, la phylogénomique, la génétique statistique, incluant la génétique des populations, la génétique quantitative et les modèles qui y sont attachés, la cartographie génétique. Cette liste n’est pas exhaustive et pourra évoluer d’année en année en fonction de l’évolution de la discipline.

De plus, dans la mesure du possible, des conférences-débats seront organisées avec des professionnels de manière à mettre en contact les étudiants avec le monde de la recherche et de l'innovation.

Références
Compétences Comprendre le comportement dynamique d'un système ou processus biologique et prédire son comportement dans de nouvelles conditions en représentant les connaissances scientifiques disponibles dans un modèle mathématique et en confrontant les résultats des simulations numériques aux résultats expérimentaux afin d'aider aux développements d'expérimentations plus ciblées.

Connaissance de l'entreprise - EIBTA3YM - 3 ECTS

Responsable(s) Pierre Gavard
Mots-clés Entreprises ; brevets ; démarche qualité
Objectifs L'objectif est de fournir aux étudiants les bases de la vie d'une entreprise en ce qui concerne l'organisation et le fonctionnement mais aussi au niveau de la propriété intellectuelle et des brevets, les normes qualités et la réglementation. Cet enseignement apporte aussi, au travers de travaux dirigés, les bases du marketing.
Prérequis
Contenu Connaissance de l'entreprise : objectif et structure d'une entreprise, différents types d'entreprises (PME, groupe), la base des règles de la communication et de management.

Propriété intellectuelle : les bases de la propriété intellectuelle, les règles pour le dépôt des brevets et les recherches de brevets.

Normes qualités et réglementation : sensibilisation à la qualité (présentation générale, définitions et objectifs, bases de la règlementation).

Références
Compétences

Communication scientifique - EIBIA3FM - 3 ECTS

Responsable(s) Gwennaele Fichant
Mots-clés analyse critique de publication ; rédaction scientifique ; recherche bibliographique ; présentation orale
Objectifs L’objectif est d'apprendre et de mettre en œuvre la synthèse et la présentation de travaux scientifiques via différents supports de communication.
Prérequis
Contenu Formation aux bases de données bibliographiques et aux outils de gestion de références bibliographiques.

Méthodes pour la communication orale et écrite. Elaboration de support de communication : diapositives, présentations interactives, poster. Rédaction d'une synthèse de l'état de l'art sous forme d'une revue en anglais respectant un format de journal international. En pratique, chaque étudiant se verra proposer une publication scientifique en relation avec les thématiques abordées dans les UE de biologie des systèmes 1 et 2. L'étudiant devra présenter cette publication à l'oral avec un support écrit en anglais. Le thème de cette publication servira de point de départ pour la synthèse et la rédaction de la mini-revue dont le format suivra celui demandé pour l'écriture d'une revue dans le journal international Genome Biology.

Références
Compétences Produire une synthèse critique de la bibliographie relative au sujet étudié en ayant évalué la pertinence des informations collectées pour proposer de nouveaux développements et/ou aborder de nouvelles questions de recherche appliquée ou fondamentale.