Descriptif des enseignements

De Master de Bioinformatique de Toulouse
Révision de 8 février 2022 à 16:32 par Gwennaele (discussion | contributions) (Master 1 - Semestre 7)

Aller à : navigation, rechercher


Mots Clefs : Biologie cellulaire ; Biologie Moléculaire ; Génétique mendélienne et moléculaire </font>

Bioanalyse

ECTS : 3
Objectifs
Cet enseignement a pour but de former les étudiants aux approches bio-informatiques utilisées dans le cadre de l'analyse de séquences biologiques. Les concepts sous-jacents à ces approches seront décrits et seront suivis de leur mise en pratique.
Prérequis
Utilisation d'un navigateur web, notion de Biologie Moléculaire (ADN, ARN, protéines…)
Contenu
Les cours viseront en une présentation : des différentes banques de données et des systèmes d'interrogation ; des méthodes de recherche par similarité dans ces banques (Blast, Psi-Blast); des méthodes utilisées pour la comparaison de deux séquences (matrice de points, alignement global et local) ainsi que celles développées pour les alignements multiples; des matrices de substitution (PAM, BLOSUM etc..) ; des approches dédiées à la recherche de motifs, signatures et profils. Les séances sur ordinateur illustreront les démarches et approches de bioanalyse décrites en cours, en utilisant des logiciels dédiés et des données biologiques disponibles dans les bases de données.
Références
Cours et applications (2015). Gilbert Deléage et Manolo Gouy. 2ème édition. DUNOD
Mots Clefs : Banque, BLAST, alignements, domaines et motifs.

Algorithmique et complexité

ECTS : 3
Objectifs
Cette UE est pour les étudiants provenant de biologie. Les autres étudiants suivront l'UE d'Harmonisation des connaissances en biologie. Décomposer un programme en éléments de plus petite taille. Analyser le comportement de programmes simples fondés sur les variables, expressions, affectations, E/S, structure de contrôle, fonctions... Créer des algorithmes résolvant des problèmes simples : transcription ADN en ARN, traduction en protéines. Implémenter des algorithmes, les tester et les déboguer. Comprendre les notions et les techniques qui permettent d’analyser la complexité d’algorithmes. Initiation aux systèmes Unix : gestion des fichiers, commandes de base.
Prérequis
Mathématiques élémentaires Contenu
Algorithmique

  • Syntaxe élémentaire, notion de variables, constantes...
  • Expressions et affectations
  • Entrées­-sorties simples
  • Structures de contrôle
  • Types de données (entiers, réels, chaîne de caractères, tableaux, listes, dictionnaires)
  • Fonctions

Concepts de la programmation

  • Concept d'algorithme
  • Types d'erreur
  • Compréhension des programmes
  • Algorithmes simples (moyenne, min, max d’une liste, manipulation de séquences ADN, transcription ARN, traduction protéines)
  • Stratégies de résolution de problèmes

Complexité
Introduction des notions et techniques qui permettent d’analyser la complexité d’algorithmes. Complexité de boucles, pour ou tant­que, dans le cas le pire et le cas moyen. Systèmes Unix

  • introduction aux système de gestion de fichiers
  • commandes SHELL de base, notions de filtrages et d'entrées sorties

Références
Algorithmes­ - Notions de base. Thomas H. Cormen. Dunod, 2013.
Unix, Initiation et utilisation : Colin, Armspach, Ostré-Waerzeggers, Dunod, 2004

Programmation en bioinformatique

ECTS : 3
Objectifs
Apprentissage de la programmation structurée avec des langages impératifs.Savoir utiliser des structures classiques. Mise en œuvre en utilisant un langage impératif. Utilisation de bibliothèques de programmation dédiée à la bioinformatique, notamment pour la manipulation de séquences (nucléiques et protéiques) ainsi que l’exploitation de diverses sources et format de données.
Prérequis
UE Algorithmique et complexité
Contenu
Notions fondamentales

  • Expressions : types de données élémentaires, affectation, opérateurs arithmétiques
  • Conditions : structures conditionnelles / expressions booléennes
  • Itérations : structures itératives, types listes et chaînes de caractères
  • Fonctions définies par le programmeur
  • Gestion des entrées et sorties : interactif, lecture et écriture de fichiers, formats compressés

Notions complémentaires

  • Types structurés : dictionnaires
  • Expressions régulières
  • Modules : importation et création
  • Modules spécifiques : matplotlib (graphique), biopython (bio-informatique), numpy (algèbre), pandas (analyse de données)
  • Algorithmes de tri
  • Algorithmes de comptage, de recherche et de comparaison de séquences ADN

Références
Apprendre à programmer avec Python 3, Gérard Swinnen, Eyrolles
Mots clefs : Algorithmique ; structures ; instructions conditionnelles ; programmation impérative ; Biopython ; séquences génomiques nucléiques et protéiques ; annotations structurées ; ontologies

Mathématiques pour la biologie

ECTS : 3
Objectifs
Initiation théorique aux bases d'algèbre linéaire, d'analyse et de probabilités. Représentation matricielle. Modélisation de problèmes dynamiques : résolution d'équations différentielles. Présentation des algorithmes numériques pour résoudre ces problèmes. Probabilités. Mise en application dans le cadre d’un projet applicatif en biologie des notions théoriques et algorithmes vus en cours.
Prérequis
Contenu
Algèbre Linéaire

  • Opérations élémentaires sur les matrices
  • Déterminant
  • Diagonalisation : recherche de vecteurs/valeurs propres.
  • résolutions de systèmes linéaires,

Analyse

  • intégration,
  • équations différentielles,
  • optimisation,
  • Droite de régression : problème des moindres carrés ordinaires

Probabilités

  • Probabilités conditionnelles, règles de Bayes
  • Variables aléatoires discrètes et continues : lois de probabilités, espérances, variances, covariance, corrélation
  • modèle linéaire

Références
Mathématiques pour les Sciences de la vie et de la Terre – C. David, S. Mustapha, F. Viens, N. Capron, edition Dunod
Mots Clefs : systèmes linéaires ; vecteurs/valeurs propres ; équations différentielles ; probabilités

Traitement des données biologiques

ECTS : 3
Objectifs
Acquisition des notions fondamentales de l’analyse statistique appliquée aux données biologiques, et maîtrise de l’utilisation du logiciel R/Rstudio. Les étudiants doivent pouvoir (i) décrire des données biologiques associées à un plan expérimental, (ii) tester des hypothèses biologiques liées aux données par des méthodes statistiques adaptées, et (iii) interpréter biologiquement les résultats de ces traitements.
Prérequis
Connaissances de bases en mathématiques. Notion d'expression génique.
Contenu

  • Statistiques descriptives (une ou plusieurs variables qualitatives et/ou quantitatives, représentations graphiques, introduction aux analyses multivariées).
  • Statistiques inférentielles (loi de probabilité, distribution d’échantillonnage, estimation ponctuelle, estimation par intervalle de confiance, tests paramétriques et non paramétriques, tests multiples).
  • Introduction au traitement des données post-génomiques par l’analyse de données multivariées telles que des données de transcriptome : différence d’expression des gènes, recherche de co-régulations géniques par analyses multivariées et clustering, caractérisation d’ensembles de gènes.

Références
The R Book (Mickael J Crawley)
Mots clefs : statistiques descriptives ; probabilités ; échantillonnage ; test statistique ; analyse transcriptomique

Introduction aux bases de données

ECTS : 3
Objectifs
L'objectif de ce cours est d'apprendre aux étudiants à concevoir une base de données et de l’interroger en algèbre relationnelle ainsi qu'en langage déclaratif tel que le langage SQL.
Prérequis
Contenu

  1. Définition, objectifs des bases de données et fonctions des SGBD
  2. Modèles de données
    • Modèle conceptuel : modèle Entité/Association E/A
    • Modèle logique : modèle relationnel
  3. Algèbre relationnelle
  4. Langages de définition et de manipulation des bases de données relationnelles
    • LDD : Langage de Définition de Données
    • LMD: Langage de Manipulation de Données

Références
Gardarin G., "Bases de données", Edition Eyrolles, 2003 (ISBN 2-212-11281-5).
Mots Clefs : bases de données relationnelles ; modélisation ; algèbre relationnelle ; LDD ; LMD ; language SQL

Bioinformatique des séquences

ECTS : 3
Objectifs
Comprendre les concepts et algorithmes sous-jacents aux principaux outils de comparaison de séquences biologiques afin d’être capable de choisir la méthode la plus pertinente pour répondre à une problématique.| Prérequis
Connaissance de biologie moléculaire et de bases en bioanalyse (contenu des banques, interrogation, recherche d'homologues). Contenu
Les cours viseront à montrer la différence entre un alignement exact (Needleman et AW56 Smith et Waterman) ou approché via des heuristiques (type BLAST) ; l'intérêt de la méthode de programmation dynamique pour la comparaison de séquences ; comprendre les différentes approches en alignement multiple de séquences : méthodes locales et globales, progressives versus itératives ; connaître les méthodes de caractérisation (signature, profile) et la recherche de motifs communs entre plusieurs séquences. La mise en pratique de ces différentes méthodes sera faite lors de séances de travaux dirigés et pratiques, en insistant sur leurs avantages ou leurs limites.
Références
Bio-informatique. Principes d'utilisation des outils. 2010. D. Tagu, J.L. Risler, coord. Ed Quae
Bioinformatique - Cours et applications. 2ème édition. 2015. G. Deléage et M. Gouy. Dunod
Mots clefs : Algorithmes pour la comparaison de séquences ; heuristique ; profils

Bioinformatique pour la Génomique

ECTS : 3
Objectifs
Cet enseignement permettra aux étudiants d'acquérir les approches d'analyses des données de génomes, plus particulièrement l'annotation des séquences génomiques et la génomique comparative. Les concepts et les questions biologiques sous-jacents à ces approches seront abordés et seront suivis de leur mise en pratique sur des cas concrets.
Prérequis
Contenu
Les cours aborderont :

  • La description de la conception d'un prédicteur de gène et des différentes méthodes qui doivent être mise en œuvre pour effectuer les mesures nécessaires sur la séquence génomique analysée (type contenu, signal, similarité) et comment ces différentes informations sont intégrées dans un modèle de structure de gène qui sera ensuite implémenté dans une solution logicielle permettant de réaliser la prédiction de la structure optimale. Parmi ces approches, les modèles de Markov cachés (HMM) permettant de réaliser des modèles probabilistes d’une suite de problèmes linéaires labellisés seront plus particulièrement développés.
  • la description des concepts et des hypothèses fonctionnelles qui sous-tendent les approches de génomique comparative.

Les séances de TP auront lieu sur ordinateur de manière à mettre en pratique les approches et démarches théoriques décrites en cours.
Références
Biological sequences analysis: Probabilistic Models of Proteins and Nucleic Acids (1998) R. Durbin, S. Eddy, A. Krogh, G. Mitchison. Cambridge University Press.| competences
Mots Clefs : Annotation de génomes ; Modèle de Markov caché ; génomique comparative ; alignement de génomes ; synténie

Traitement de graphes et réseaux biologiques

ECTS : 3
Objectifs
Dans ce module, les étudiants aborderont les concepts et les algorithmes de base en théorie des graphes. Quelques problèmes classiques de biologie seront revisités à la lumière de ces concepts. Les réseaux d’interactions moléculaires (régulation transcriptionnelle, réseaux métaboliques, réseaux d’interactions protéiques) et les problèmes de graphes associés constitueront des applications privilégiées.
Prérequis
Algorithmique ; Programmation ; Métabolisme ; Génétique| Contenu

  • Concepts et définitions
  • Graphes et réseaux rencontrés en biologie et bioinformatique
  • Représentations informatiques et manipulations
  • Formats de stockage
  • Logiciels de visualisations, d'éditions et d'analyse
  • Librairies et boites à outils
  • Algorithme de parcours et de dessin
  • Arbres couvrants
  • Détection de motifs
  • Partitionnement et détection de communautés

Références
Introduction to Algorithms, Corsen, Leiserson and Rivest, MIT Press and McGraw-Hill
Mots Clefs : parcours ; plus courts chemins ; marches aléatoires ; partitionnement de graphes ; détection de communautés ; modularité ; réseau d'interaction ; réseau de régulation ; réseau métabolique

Génétique évolutive et quantitative

ECTS : 3
Objectifs
Acquisition des concepts fondamentaux de la génétique évolutive (génétique des populations) et de la génétique quantitative (architecture génétique des caractères quantitatifs, cartographie de QTL, association génotype/phénotype). Analyse de données génétiques et phénotypiques.
Prérequis
Notion de génétique Mendélienne (ségrégation des caractères) et de polymorphisme moléculaire.| Contenu

  • Génétique des populations : mesures du polymorphisme génétique, modèle de Hardy-Weinberg, systèmes de reproduction (autogamie, consanguinité, ...), forces évolutives (mutation, sélection, dérive génétique, migration).
  • Génétique quantitative : modèle polygénique des caractères quantitatifs, modèle qualitatif, notion d’héritabilité, notion de ressemblance / apparentement génétique, principes de la cartographie de Quantitative Trait Loci (QTL) et de la génétique d’association.
  • Ce contenu sera traité au travers d’exemples issus du monde végétal et de l’agronomie.

Références
Précis de génétique des populations (Jean-Pierre Henry, Pierre-Henry Gouyon, ed Dunond)
Introduction to quantitative genetics (Falconer & Mackay) Handbook of statistical genetics (Balding, Bishop, Cannings)
Mots Clefs : génétique ; population ; évolution ; caractère quantitatif ; cartographie génétique
-->

Master 1 - Semestre 8

Programmation avancée et génie logciel

ECTS : 6
Objectifs

  • Maitriser la modélisation objets d’un programme informatique
  • Connaitre les différents concepts de la programmation orientée objet
  • Savoir développer une application en utilisant une approche orientée objet
  • Maitriser l’utilisation d’API dans le développement d’un programme informatique
  • Connaitre les principaux éléments permettant de concevoir et développer une interface graphique

Prérequis

  • Bonne connaissance des base de l’algorithmique
  • Première expérience avec un langage de programmation|

Contenu
Partie génie logiciel : Modélisation avec UML

  • Introduction sur l'intérêt de la modélisation
  • Présentation des cas d'utilisation et des principaux diagrammes (diagramme de classe, de séquence, d’état transition)

Partie programmation orientée objet - Langage JAVA

  • Introduction du langage JAVA
  • Présentation des différents outils de compilation, éxecution, documentation, etc. et des principaux environnements de programmation (Eclipse, NetBeans)
  • Notion de classe et objet
    • Principales caractéristiques d'une classe (notion d'attributs, constructeurs, méthodes, visibilité)
    • Instanciation des classes,
    • Utilisation de package
    • Lien avec la modélisation UML
  • Notion avancée de programmation orientée objet : héritage, interface, classe abstraite
  • Gestion des exceptions
  • Présentation d'API
    • Différentes structures de données
    • Gestion des flux de données : utilisation de fichiers, lecture et écriture dans des flux, sérialisation, parseur XML
    • Introduction aux interfaces graphiques et à la programmation événementielle

Références
Mots Clefs : Modélisation objet ; UML ; Programmation orientée objet ; JAVA ; Classes ; Objets ; Héritage

Fouille de données

ECTS : 3
Objectifs
Cette UE a pour but d’initier les étudiants aux techniques modernes de fouilles de données permettant de prédire, par exemple, si celui qui achète du pain et du beurre va acheter de la confiture, s’il est raisonnable pour une banque d'attribuer une carte de crédit, si la protéase PfSUB1 joue un rôle dans la division de Plasmodium falciparum (parasite responsable de la malaria), ou encore de diagnostiquer un sous-type de cancer du sein à partir de données de puces à ADN de la patiente. En général, plusieurs méthodes peuvent être utilisées, plus ou moins performantes : il s’agit donc de les comprendre, d’apprendre à les mettre en œuvre et d’estimer leur performances.
Prérequis
Statistiques, programmation
Contenu

  • Mesures de distance, similarité, dissemblance
  • Normalisation et transformation
  • Classification
    • Arbre de décision et forêts aléatoires
    • Méthodes bayésiennes
    • k plus proches voisins
    • Analyse discriminante linéaire
  • Clustering
    • k means, k medoids
    • Clustering hiérarchique
    • Méthodes basées sur la densité
    • Méthodes basées sur une grille
  • Evaluation des performances
  • Extraction de règles d'association et d'itemsets fréquents
  • Logiciels, librairies et boites à outils disponibles

Références
Data Mining: Concepts and Techniques, J. Han and M. Kamber, 2006.
Mots Clefs : prétraitement des données ; classification et prédiction ; caractérisation et discrimination ; règles d’association

Traitement de données post-génomiques

ECTS : 6
Objectifs
Cette unité d'enseignement a pour objectif de fournir une large palette de connaissances et de compétences en bioinformatiques et biostatistiques appliquées à un domaine en constante évolution en biologie moderne: la post-génomique. Cette dernière cherche à étudier la fonction et l'expression des gènes séquencés en génomique par la caractérisation systématique du rôle des mutations, de l'expression des ARN messagers, des ARN non-codants, ainsi que des protéines. Les données générées par la post-génomique sont extrêmement volumineuses et de très grandes dimensions (Big Data). C'est pourquoi elles nécessitent le développement et l'utilisation d'outils adaptés provenant à la fois de l'informatique et des statistiques. Les applications sont nombreuses: génétique humaine, cancérologie, métagénomique, mais aussi, amélioration des espèces d'intérêt agronomique et étude de l'évolution des espèces.
Prérequis
Connaissances en biologie moléculaire, génomique, biochimie des protéines, ainsi qu'en algorithmique, théorie des graphes et traitement statistique de données.
Contenu
Cette unité d'enseignement comporte 4 ateliers différents: assemblage de génome et détection de SNP, analyse de données RNA-seq , analyse de données small RNA-seq et analyse de données protéomiques . Le premier atelier consiste à appréhender et savoir utiliser les concepts et méthodes pour la manipulation de gros fichiers de séquences, l'alignement des séquences sur le génome, l'assemblage de novo de génomes, la détection de SNP ainsi que leur annotation fonctionnelle. Le second atelier traite de la mesure du niveau d'expression des ARN messagers, de l'analyse différentielle, des méthodes d'enrichissement d'ensemble de gènes et de la détection de variants d'épissage alternatif. Le troisième atelier permet de caractériser les différentes familles d'ARN non codants produites par les protocoles de séquençage, d'employer les banques de données pour annoter ses ARN non codants et de maîtriser les méthodes bioinformatiques pour parser les séquences, générer la matrice de comptage qui servira d'entrée à la normalisation et à l'analyse différentielle. Le quatrième atelier consiste à identifier et quantifier les protéines d'un mélange complexe de protéines à partir de données issues de spectrométrie de masse avec, par exemple, des cartes peptidiques massiques ou par spectrométrie de masse en tandem. Pour cela, des algorithmes bioinformatiques sont utilisés pour l’identification de peptides et de protéines à l'aide des base de données usuelles.
Références
Pevsner. Bioinformatics and Functional Genomics, 2015.
Datta and Nettelton. Statistical Analysis of Next Generation Sequencing Data, 2014.
Wu and Choudry, Next Generation Sequencing in Cancer Research, 2013.
Mots Clefs : Haut-débit ; Assemblage de génome ; SNP ; RNA-seq ; small RNA-seq ; Protéomique

Génomique Environnementale

ECTS : 6
Objectifs

  • Mobiliser les concepts fondamentaux relatifs à la génomique environnementale, les objets qu’elle permet d’étudier (communauté complexe, génome d’organismes non modèles, niveau de variabilité, ADN ancien, détection d’espèces rares), les conditions de mise en oeuvre (échantillonnage, choix des marqueurs et des techniques de séquençage), les outils bioinformatiques nécéssaires (différents pipelines), les limitations et précautions (variabilité intra et interspécifique, contaminations, seuils…)
  • Identifier, choisir une combinaison de méthodes et d’outils analytiques relatifs aux NGS pour répondre à des questions d’écologie et d’évolution.
  • Interpréter des résultats issus de l’analyse de données de génomique environnementale - qu’ils soient originaires d’un article ou des analyses menées par les étudiants.
  • Exploiter des logiciels d’acquisition et d’analyse de données NGS avec un esprit critique.

Prérequis
Contenu
Les cours magistraux permettront d’introduire la génomique environnementale, ses questions, ses objets, ses technologies, puis d’explorer trois grands thèmes autour des usages de la génomique environnementale pour étudier (1) l’ADN ancien ou dégradé, (2) l’écologie microbienne et les interactions, et enfin (3) la comparaison des génomes, tant d’eucaryotes que de procaryotes.
Les TD seront dédiés à la présentation de cas d’étude sous forme d’article, pour pouvoir décrypter l’ensemble des étapes d’un projet de génomique environnementale, avec un oeil critique. Un des TD sera aussi dédié à une visite virtuelle ou non d’une plateforme de séquençage. L’application de ces techniques dans le domaine de l’écologie de la conservation sera aussi abordée dans le cadre des TD.
Enfin les TP aborderont deux des trois grands thèmes présentés, et permettront d’appliquer des outils bioinformatiques, et décrypter les lignes de commandes, et d’aboutir à des résultats que les étudiants devront interpréter.
Références
Mots Clefs

Analyse de données et modélisation en écologie

ECTS : 6
Objectifs
Maîtriser les méthodes d'analyse de données (outils statistiques et de modélisation) les plus communément utilisées pour l'analyse et la compréhension des phénomènes biologiques et écologiques. Faire le lien entre le questionnement biologique et les méthodes d'analyse à mettre en œuvre afin de maîtriser l'ensemble de la démarche expérimentale, depuis la formulation des hypothèses biologiques jusqu'à l'interprétation des résultats, en passant bien évidemment par l'analyse des données. Acquérir une bonne autonomie dans les analyses de données permettant de répondre à des problématiques écologiques simples mais variées.
Prérequis
Avoir déjà suivi un enseignement sur les probabilités, les statistiques descriptives et les tests d'hypothèses. Avoir des connaissances de base du logiciel R.
Contenu
Les concepts et méthodes d'analyse abordés concerneront les lois de probabilité, les tests d'hypothèses (paramétriques et non paramétriques), le modèle linéaire (plans expérimentaux, analyse de variance, régression simple et multiple), le modèle linéaire généralisé, la classification et l'analyse en composantes principales. Les aspects théoriques indispensables à la compréhension et à la bonne utilisation de ces méthodes seront traités au cours des CM. Les TP, qui auront lieu en salle informatique, permettront aux étudiants de mettre en pratique ces méthodes afin de répondre à des problématiques biologiques concrètes. Pour cela, ils seront familiarisés à un outil de traitement de données gratuit (le logiciel R). Une place importante sera donnée à l'interprétation écologique des résultats statistiques. Enfin, un projet réalisé en fin d'UE par binôme permettra aux étudiants d'être confrontés à un problème biologique concret. Ils devront ainsi identifier les méthodes d'analyse adaptées à la question biologique posée et acquérir les bons « réflexes » face aux difficultés de l'analyse de données en situation réelle.
Références
Bertrand F. & Maumy-Bertrand M. 2014. Initiation à la statistique avec R. Cours et exercices corrigés. Dunod.
Scherrer B. 2008. Biostatistique volume 1. Editeur Gaëtan Morin.
Crawley M.J. 2012. The R Book. Wiley.
Mots Clefs : Analyses univariées et bivariées, modélisation, tests d'hypothèses, programmation, simulation.

Ecologie évolutive

ECTS : 6
Objectifs

  • Caractériser les variations (d'effectifs, de génotypes, de phénotypes et d'histoires de vie) dans les populations naturelles,
  • Comprendre les mécanismes qui génèrent, maintiennent et modifient ces variations,
  • Maîtriser les outils de description et d'analyse de ces variations

Prérequis
Maîtrise des concepts basiques en écologie, biologie évolutive, génétique, dynamique des populations, statistique inférentielle, mathématiques bac S.
Contenu

  • Sélection naturelle (concepts et exemples)
  • Dynamique des populations
  • Génétique des populations (forces évolutives, structuration, régimes de reproduction, déséquilibre de liaison, coalescence)
  • Dynamique adaptative (introduction)
  • Génétique quantitative (héritabilité, équation du sélectionneur)
  • Evolution des histoires de vie (mortalité, fécondité, itéroparité/semelparité, sénescence, âge à maturité, longévité…)
  • Allocation au sexe de la descendance
  • Dynamique et évolution des interactions (co-évolution, co-adaptation)
  • Evolution expérimentale (expériences de terrain et en laboratoire, sélection artificielle)

Références
Thomas, F. et al. 2010. Biologie évolutive. Ed De Boeck
Mayhew, P. J. 2006. Discovering Evolutionary Ecology: Bringing Together Ecology and Evolution. Oxford Univ. Press.
Ricklefs, R. E., et Miller, G. L. 2005. Écologie. Ed De Boeck.
Mots Clefs : Sélection, dynamique et génétique des pop., génétique quantit., dynamique adaptative, interactions, évolution expérimentale, histoire de vie, allocation au sexe.

Ecologie des communautés et fonctionnement des écosystèmes

ECTS : 6
Objectifs
Les cours magistraux et les travaux dirigés apportent les bases conceptuelles et empiriques indispensables à la compréhension des règles d'assemblages des communautés et des forces régissant le fonctionnement des écosystèmes. L'écologie est présentée comme une discipline intégrative profondément enracinée dans les sciences naturelles, mais dont les bases théoriques dérivent de principes généraux issus de la biologie, de la physique et de la chimie. Les enseignements apportent aussi un éclairage sur l'écologie en tant que science appliquée au service de l'humanité.
Prérequis
Connaissances académiques en biologie des organismes et des populations. Compréhension de la démarche scientifique et des méthodes d'analyse de données.
Contenu
Cours :

  • Les multiples facettes de la biodiversité et leurs relations
  • Le concept de niche écologique : émergence, évolution, et applications
  • Règles d'assemblage et de dé-sassemblage des communautés
  • Dynamique des réseaux d'interactions
  • Evolution et stabilité des écosystèmes
  • Cycle de la matière organique; cycles des éléments et stoechiomètrie écologique
  • Rôle de la biodiversité dans le fonctionnement des écosystèmes et les services écologiques
  • Influence de la structure de l'habitat, des facteurs physico-chimiques et des communautés dans le fonctionnement des sols et des systèmes aquatiques
  • Ecologie appliquée : restauration et ingénierie écologique
  • L'écologie à l'échelle du paysage et des méta-écosystèmes

Travaux dirigés :

  • Outils numériques pour l'étude de la biodiversité et la modélisation des écosystèmes
  • Utilisation des biomarqueurs et des bioindicateurs en écologie

Références
Weathers K.C. et al. (2013) Fundamentals of Ecosystem Science. Academic Press
Morin P.J. (2011) Community Ecology, Wiley-Blackwell
Naeem S. et al. (2009) Biodiversity, Ecosystem Functioning, & Human Wellbeing: Oxford University Press
Mots Clefs : biodiversité, écosystème, autoécologie, synécologie, traits fonctionnels, cycle de la matière organique et des nutriments, ingénierie écologique.

Evolution moléculaire

ECTS : 3
Objectifs
Cet enseignement a pour but d'initier les étudiants aux analyses d'évolution moléculaire. Les concepts et méthodes développées dans cette discipline seront détaillés et seront accompagnés par leur mise en pratique sur des cas concrets de reconstruction phylogénétique. L'accent sera mis sur l'interprétation évolutive des arbres obtenus.
Prérequis
Contenu
Cette UE introduira les concepts de l’évolution puis présentera les différents modèles d'évolution des séquences génomiques (ADN et protéines) et les différentes approches de reconstruction d’arbres (parcimonie, méthode de distances, méthode du maximum de vraisemblance). Les méthodes permettant le choix du modèle évolutif le plus adapté aux données traitées, celles utilisées pour analyser la stabilité de la topologie et celles permettant l'analyse de la congruence de plusieurs arbres seront également développées. L'étude de l'impact des forces évolutives (sélection naturelle, dérive,…) sur le polymorphisme des séquences sera aussi abordé. Les concepts et approches vus en cours seront illustrés par des cas concrets (évolution des séquences d'une famille de protéines, pression de sélection sur certains gènes et régions du génome, reconstruction de la phylogénie d'un ensemble d'espèces, etc) lors de séances de TP sur ordinateurs. Au cours des TD, l'accent sera mis sur l'interprétation évolutive des topologies d'arbres (détection des évènements de duplication et/ou perte de gène, de transferts horizontaux etc.)
Références
Concepts et Méthodes en Phylogénie Moléculaire (2010). Guy Perrière et Céline Brochier-Armanet. Collection IRIS, Springer
Computational Molecular Evolution. Ziheng Yang. Oxford University Press.
Mots Clefs : évolution ; méthodes de reconstruction d’arbre phylogénétique ; congruence ; bootstrap ; sélection naturelle ; dérive

Projet tutoré

ECTS : 3
Objectifs
Mettre en œuvre des techniques de méthodologie de travail et d'organisation de projet informatiques
Prérequis
Contenu
Partie I
Méthodologie de travail en groupe et de suivi de projet. Techniques de publication Web.
Partie II
Projets en groupes de 3 à 4 personnes. Travail sur des thématiques de Bioinformatique mettant en œuvre de la programmation, des bases de données et de la création de sites Web. Utilisation de techniques de travail en groupe et de suivi de projets. Évaluation par des rapports de suivi de projet et une soutenance orale.
Références
PMI, management de projet : un référentiel de connaissances, AFNOR, 2004
Management d'un projet système d'information : principes, techniques, mise en œuvre et outils, Chantal Morley, Dunod, 2006
Mots Clefs : méthodologie de travail ; travail en groupe ; suivi de projet ; techniques web </font>

Introduction Modélisation Moléculaire

ECTS : 3
Objectifs
Ce module a pour but d'initier les étudiants aux concepts de base de la modélisation moléculaire. A l'issu de cet enseignement l'étudiant sera capable de créer une molécule et de déterminer sa structure optimale, tant in vacuo que dans un complexe récepteur-ligand.
Prérequis
Contenu
Présentation de concepts de base de la modélisation de structures biomoléculaires. Seront abordés les aspects théoriques et computationnels de la détermination de structures tridimensionnelles de molécules d'intérêt biologique par l'approche empirique, basée sur le champ de force et l'optimisation de géométrie. La partie pratique du module sera consacrée à la création, visualisation, modification et optimisation de structures moléculaires.
Références
Molecular Modelling: Principles and Applications", Andrew Leach, Prentice Hall, 2001.
"Molecular Modelling for Beginners", Alan Hinchliffe, John Wiley & Sons Ltd, 2003.
"Molecular Modeling and Simulation", Tamar Schlick, Springer-Verlag New York Inc., 2010.
Mots Clefs : Visualisation et manipulation de molécules ; structure et dynamique moléculaire ; champs de force ; minimisation d'énergie ; complexe récepteur-ligand

Analyse de données multivariées

ECTS : 3
Objectifs
A l'issue de cet enseignement, les étudiants devront être à même :

  • d'organiser des données et de formuler une problématique pertinente
  • de choisir la (ou les) méthode(s) d'analyse en fonction de la nature des données et de la problématique formulée
  • de mettre en œuvre ces méthodes (utilisation du logiciel R)
  • de représenter graphiquement et d'interpréter les résultats
  • de rédiger les conclusions dans un rapport de synthèse|

Prérequis
Une UE de biostatistiques élémentaires est exigée, ainsi que des connaissances de base du logiciel R.
Contenu
Cet enseignement propose une présentation des principales méthodes d'analyse adaptées aux données multidimensionnelles. Les méthodes abordées seront illustrées à partir d'exemples réels provenant d'études écologiques. L'enseignement cherchera à montrer plus particulièrement en quoi (1) la nature complexe des systèmes biologiques conduit souvent à la nécessité de prendre en compte un grand nombre de descripteurs, et (2) l'écologie est un champ d'application privilégié des diverses méthodes abordées.
Les aspects théoriques indispensables à la compréhension et à la bonne utilisation de ces méthodes seront traités au cours des CM. Les TP, en salle informatique, permettront aux étudiants de mettre en pratique ces méthodes et donner une place importante à l'interprétation écologique des résultats statistiques. Enfin, un projet réalisé en fin d'UE par binôme permettra aux étudiants d'être confrontés à un problème biologique concret. Ce projet portera sur l'analyse d'un jeu de données collecté dans le cadre d'une étude écologique et aboutira à la rédaction d'un rapport et une présentation orale du travail effectué.
Références
Escoffier & Pagès. Analyses factorielles simples et multiples – Objectifs, méthodes et interprétation. Dunod
Lebart, Piron, & Morineau. Statistiques exploratoire multidimensionnelle. Dunod
Mots Clefs : Analyses multivariées ; structure des tableaux de données en écologie ; liaisons entre descripteurs (biologiques, environnementaux, ...).

Biostatistiques : Utilisation avancée du modèle linéaire

ECTS : 3
Objectifs
A l'issue de cet enseignement, les étudiants devront être à même d'analyser un jeu de données complexe en utilisant des modèles linéaires (lm) ou le des modèles linéaires généralisés (glm). Ils devront maîtriser suffisamment les bases théoriques de ces outils pour pouvoir montrer la pertinence de leur choix d'analyse, et interpréter en détail les résultats obtenus.
Prérequis
Statistiques descriptives, lois de probabilités usuelles, test d'hypothèse, régression linéaire, ANOVA, ANCOVA, utilisation basique du logiciel R.
Contenu
Cet enseignement propose une présentation détaillée des applications du modèle linéaire et du modèle linéaire généralisé à l'analyse des données biologiques. Les éléments théoriques permettant de comprendre les conditions d'application de ces méthodes d'analyse seront expliqués. L'accent sera mis sur les outils permettant de vérifier que ces conditions d'application sont bien remplies, et sur la démarche à adopter lorsqu'elles ne le sont pas.
L'enseignement sera illustré en travaux pratiques par l'analyse détaillée de jeux de données tirés de travaux en écologie, biologie comportementale et biologie évolutive.
Références
The R Book, 2nd Edition. M.J. Crawley 2012. Wiley
Mots Clefs : Statistique ; Modèle linéaire ; Modèle linéaire généralisé

Stage (facultatif)

ECTS : 0
Objectifs
Ce stage optionnel permet aux étudiants d'avoir un premier contact avec le monde professionnel et donc une première immersion dans une équipe de recherche et développement appartenant soit à un laboratoire du milieu académique ou d'une entreprise.
Prérequis
Contenu
Un stage optionnel d'un à deux mois est proposé en fin d'année universitaire car le besoin d'acquérir et/ou de renforcer des compétences dans différents champs disciplinaires (informatique, mathématiques et bioinformatique) ne permet pas d'introduire un stage obligatoire dans le cursus. Il est cependant fortement conseillé d'effectuer ce stage car il permettra d'apprendre à travailler en équipe, d'organiser son travail de manière à répondre aux échéances exigées par l'encadrant, de trouver des solutions pour résoudre des problèmes qui n'avaient pas été envisagés au départ. C'est également l'opportunité de confronter sa formation académique à des problématiques concrètes et de de mettre en oeuvre les compétences acquises. Il constitue une bonne préparation au stage obligatoire de 6 mois de la seconde année de master.
Mots Clefs : Immersion professionnelle

Master 2 - Semestre 9

Bases de données avancées

ECTS : 3
Objectifs
L'objectif de ce cours est de présenter les différentes étapes pour l'évaluation d'une requête relationnelle dans un environnement centralisé. Puis, une introduction à un langage procédural est faite afin d'interroger une base de données.
Prérequis
Les concepts fondamentaux des bases de données
Contenu
Traitement d'une requête relationnelle dans un environnement centralisé, langage procédural/SQL, vues relationnelles
Références
Georges Gardarin - Bases de Données - EYROLLES
Mots Clefs : =Bases de données ; Système de gestion de bases de données ; PL/SQL

Introduction Apprentissage automatique

ECTS : 3
Objectifs
L'apprentissage automatique ou apprentissage artificiel est un champ d'étude de l'intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, il concerne la conception, l'analyse, l'optimisation, le développement et l'implémentation de telles méthodes. Les progrès récents de ce champ de l'IA font qu'il s'introduit dans tous les champs scientifiques, et en particulier la biologie et la génétique. Le but du module est donc de donner aux étudiants un aperçu global de l'apprentissage, à la fois l'apprentissage par renforcement et l'apprentissage à partir d'exemples. Pour ces 2 sous domaines, les principes théoriques sont introduits, des algorithmes sont présentés. La partie pratique consiste en l'implémentation en python de ces algorithmes ainsi que la manipulation des librairies essentielles au domaine (Keras, tensorflow, scikit-learn). A la fin du module, les étudiants sont capables d'analyser un jeu de données, de le préparer, de choisir un algorithme d'apprentissage adapté et de l'implémenter.
Prérequis
Calcul différentiel; Probabilités (les fondamentaux seulement)
Contenu
Apprentissage par renforcement

  • Définition
  • Equation de Bellman
  • Q-table – implémentation en python

Apprentissage à partir d’exemples

  • Principes génériques et fonction de perte
  • Minimisation et descente en gradient
  • Réseau de neurones
  • Re-implémentation de la Q-table via réseau de neurones
  • Convolution pour traitement d’images
  • Problèmes et solutions : vanishing gradient, overfitting, etc.
  • SVM

Références
Machine learning (1997) Tom M. Mitchel, Publisher: McGraw-Hill
Mots Clefs : Apprentissage automatique ; Règles d’association ; Réseau de neurones multi-couches

Gestion de données non structurées et applications post-génomiques

ECTS : 3
Objectifs
Prérequis
Contenu
Références
Mots Clefs :

Phylogénomique

ECTS : 3
Objectifs
Prérequis
Contenu
Références
Mots Clefs :

Métagénomique écologique et évolutive

ECTS : 3
Objectifs
Prérequis
Contenu
Références
Mots Clefs :

Biologie des systèmes 1

ECTS : 6
Objectifs
Cet enseignement a pour but d'initier les étudiants à la biologie des systèmes,discipline émergente, dont l'objectif est de caractériser les composants élémentaires d'un système biologique (par exemple, une voie de régulation, une cellule, un écosystème etc.) pour mettre à jour les propriétés qui résultent de leurs interactions, ceci afin de mieux comprendre le comportement dynamique du système dans sa globalité. Les concepts et méthodes développées dans cette discipline seront détaillés et seront accompagnés par leur mise en pratique sur des cas concrets de modélisation de processus biologiques.
Prérequis
Notions de calcul matriciel; équations différentielles; méthodes de traitement des graphes; méthodes d'analyse des données d'expression obtenues par les techniques à haut débit (NGS); intégration de données.
Contenu
Les enseignements aborderont : La construction d'un réseau d'interactions en extrayant et intégrant les données expérimentales disponibles (données d'expression, données d'interaction etc.). Pour cela, les différentes approches vues au cours de la première année de master, notamment dans les UE de traitement des données génomiques et post-génomiques et de traitement des graphes et réseaux biologiques seront utilisées et intégrées pour détecter les interactions entre composants du système biologique analysé et pour construire la topologie du réseau d'interactions résultant.
La description des méthodes d'analyse dynamique des réseaux biologiques et de prédiction de leur comportement. Les approches qualitative ainsi que les approches quantitatives seront abordées. Dans le cas des approches qualitatives, la modélisation par équations différentielles linéaires par morceaux et les modèles logiques seront plus particulièrement développés ainsi que les modèles déterministes basés sur les équations différentielles ordinaires, pour les approches quantitatives. Les réseaux de Pétri, outils graphiques et mathématiques permettant de modéliser le comportement dynamique d'un système par une approche qualitative ou quantitative seront également décrits.
Les TP aborderont des cas pratiques issus de divers domaines de la biologie comme : les réactions enzymatiques, la croissance de biomasse, l'analyse de processus périodiques et la modélisation de réseaux de régulation.
Références An introduction to Systems Biology: Design principles of Biological Circuits (2007). Uri Alon. Chapman & Hall/CRC
Mots Clefs : Biologie des systèmes ; intégration des données ; systèmes biologiques dynamiques ; réseaux d'interactions ; modélisation </font>

Biologie des systèmes 2

ECTS : 6
Objectifs
Cet enseignement a pour objectif de former les étudiants à la démarche de la recherche et à l’autoformation en abordant des problématiques scientifiques d’actualité liée au domaine de la biologie des systèmes sous diverses formes d’enseignement (ateliers, conférences). Il a donc également pour but de renforcer les compétences des étudiants en biologie des systèmes. Les approches abordées dans l'UE Biologie des Systèmes 1 seront renforcées et la nature des réseaux étudiés sera diversifiée. De ce fait, de nouvelles méthodes de modélisation seront abordées.
Prérequis
UE Biologie des Systèmes 1
Contenu
Différentes problématiques scientifiques en relation avec la biologie des systèmes seront abordées sous forme d'ateliers ce qui requerra une participation active des étudiants comme par exemple la préparation de l'atelier par la lecture et la présentation orale de publications scientifiques sur le sujet, réalisation de projets personnels ou en groupe, etc.
Parmi les problématiques qui seront abordées, nous pouvons citer : l'analyse topologique et la visualisation des réseaux métaboliques, ainsi que l'analyse du flux des métabolites dans ces réseaux, l'analyse des données de métagénomiques pour l'identification et la caractérisation de communautés microbienne, la génétique statistique, incluant la génétique des populations, la génétique quantitative et les modèles qui y sont attachés, la cartographie génétique. Cette liste n’est pas exhaustive et pourra évoluer d’année en année en fonction de l’évolution de la discipline. Références
Mots Clefs : Biologie des Systèmes ; systèmes biologiques dynamiques ; métabolomique ; modélisation ; simulation </font>

Ouverture : international, bioéthique, insertion professionnelle

ECTS : 3
Objectifs
Prérequis
Contenu
Références
Mots Clefs :
</font>

Communication scientifique

ECTS : 3
Objectifs
L’objectif est d'apprendre et de mettre en œuvre la synthèse et la présentation de travaux scientifiques via différents supports de communication.
Prérequis
Contenu
Elaboration de support de communication : diapositives, présentations interactives, poster. Rédaction d'une synthèse de l'état de l'art sous forme d'une revue en anglais respectant un format de journal international. En pratique, chaque étudiant se verra proposer une publication scientifique en relation avec les thématiques abordées dans les UE de biologie des systèmes 1 et 2. L'étudiant devra présenter cette publication à l'oral avec un support écrit en anglais. Le thème de cette publication servira de point de départ pour la synthèse et la rédaction de la mini-revue dont le format suivra celui demandé pour l'écriture d'une revue dans un journal international.
Références
Mots Clefs : analyse critique de publication ; rédaction scientifique ; recherche bibliographique ; présentation orale </font>