Unité de systèmes d'information Université Catholique de Louvain Faculté de Sciences Economiques, Politiques et Sociales Institut d'Administration et de Gestion Unité de systèmes d'information

Titulaire
Assistants
Objectifs
Description
Prérequis
Support
Valves

 


 

 
LINF2275
Analyse des données et prise de décision
  [30,30,0] 2ème quadrimestre
 

Support

1. Support des cours théoriques
2. Transparents des cours théoriques
3. Disponibilité des logiciels
4. Projet d'analyse de données


1. Support des cours théoriques
 
Nous nous baserons sur des chapitres photocopiés d'ouvrages de référence; ces photocopies seront mises à la disposition des étudiants. Nous nous baserons sur des chapitres des ouvrages suivants :
Alpaydin (2004), “Introduction to machine learning”. MIT Press.
Bardos (2001), "Analyse discriminante. Application au risque et scoring financier. Dunod.
Bishop (1995), "Neural networks for pattern recognition". Clarendon Press.
Bouroche & Saporta (1983), "L'analyse des données". Que Sais-je.
Cornuéjols & Miclet (2002), "Apprentissage artificiel. Concepts et algorithmes". Eyrolles.
Duda, Hart & Stork (2001), "Pattern classification, 2nd ed". John Wiley & Sons.
Disponible à http://www.quantlet.com/mdstat/scripts/mva/htmlbook/mvahtml.html
Dunham (2003), "Data mining. Introductory and advanced topics". Prentice-Hall.
Greenacre (1984), "Theory and applications of correspondence analysis". Academic Press.
Han & Kamber (2000), "Data mining: Concepts and techniques". Morgan Kaufmann.
Hand (1981), "Discrimination and classification". John Wiley & Sons.
Hardle & Simar (2003), "Applied multivariate statistical analysis". Springer-Verlag.
Hastie, Tibshirani & Friedman (2001), "The elements of statistical learning". Springer-Verlag.
Johnson & Wichern (2002), "Applied multivariate statistical analysis, 5th ed". Prentice-Hall.
Lebart, Morineau & Piron (1995), "Statistique exploratoire multidimensionnelle". Dunod.
Mitchell (1997), "Machine learning". McGraw-Hill.
Naim, Wuillemin, Leray, Pourret & Becker (2004), “Réseaux bayesiens”. Editions Eyrolles.
Nilsson (1998), “Artificial intelligence: A new synthesis”. Morgan Kaufmann.
Ripley (1996), "Pattern recognition and neural networks". Cambridge University Press.
Rosner (1995), "Fundamentals of biostatistics, 4th ed".Wadsworth Publishing Company.
Saporta (1990), "Probabilités, analyse des données et statistique". Editions Technip.
Theodoridis & Koutroumbas (2003), "Pattern recognition". Academic Press.
Therrien (1989), "Decision, estimation and classification". Wiley & Sons.
Venables & Ripley (2002), "Modern applied statistics with S. Springer-Verlag.
Webb (2002), "Statistical pattern recognition, 2nd ed". John Wiley and Sons.
 
2. Transparents des cours théoriques
 
cours 1 : Introduction générale
cours 2
cours 3 : Clustering
cours 4 : Classification
cours 5
cours 6 : PCA
cours 7 : Web mining
cours 8 : Association
cours 9 : Analyse discriminante
cours 13 : analyse canonique
cours 14 : Programmation dynamique
cours 18 : Reinforcement learning
   
 
3. Disponibilité des logiciels
 
Les logiciels utilisés sont disponibles en salle informatique. Notez que l'utilisation de SPSS est facultative. Si vous souhaitez travailler chez vous, vous pouvez acquérir une licence du logiciel pour un prix très modique.
Matlab Les informations concernant l'offre spéciale de la licence Matlab pour les étudiants peuvent être trouvées ici
SAS/JMP Disponible (au prix de 21€) chez Mme Marie-Jeanne Vervack, Equipe Informatique Facultaire, Place Montesquieu, 1/18, Tél. +32/10/47.42.56. Installé en salle informatique de l'IAG.
SPSS Disponible (au prix de 25€) au secrétariat de l'IAG. Installé en salle informatique de l'IAG.
R Downloadable gratuitement à partir de www.R-project.org. Installé en salle informatique de l'IAG et d'INGI.
S-Plus Version etudiant downloadable gratuitement à partir de www.insightful.com.
 
4. Projet d'analyse de données
 
Enoncé du projet de clustering
Données pour le projet de clustering
Enoncé pour le projet de credit scoring
Données pour le projet de credit scoring, fichier de description des données, exemple de code pour cross validation
Données test pour l'évaluation de votre meilleur modèle.
Le calcul du bénéfice engrangé avec ces données se fera à partir des formules suivantes :
Une personne qui rembourse correctement son prêt fournit en moyenne un bénéfice de:
   + (0.14 * montant_emprunté) euros
Une personne qui ne rembourse pas correctement son prêt fournit en moyenne un bénéfice de:
   - (0.35 * montant_emprunté) euros
Enoncé pour le projet de reconnaissance de caractère
Données pour le projet de reconnaissance de caractère (.mat)(.txt), exemple de code pour cross validation, commandes utiles pour le projet, un toolbox pour la classification
Enoncé pour le projet de reinforcement learning
   


Pour la rédaction du rapport des projets, vous trouverez ici les fichiers template (aussi bien latex que word) pour une mise en page sous forme de rapport scientifique.

 

 

[UCL] [ESPO] [IAG] [ISYS] [Pointeurs utiles]

Dernière mise à jour: 16-03-2007
Responsable: Marco Saerens
Réalisation technique: Francois Fouss