Unité de systèmes d'information Université Catholique de Louvain Faculté de Sciences Economiques, Politiques et Sociales Institut d'Administration et de Gestion Unité de systèmes d'information

Titulaire
Assistants
Objectifs
Description
Prérequis
Support
Valves

 


 

 
LINF2275
Analyse des données et prise de décision
  [30,30,0] 2ème quadrimestre
 

Description

1. Présentation du cours
2.
Projet d'analyse de données
3. Evaluation des connaissances

1. Présentation du cours

Les méthodes d'analyse de données quantitatives sont aujourd'hui utilisées dans presque tous les secteurs de l'activité humaine et font partie des connaissances de base de l'ingénieur, du gestionnaire, de l'économiste, etc. Dans ce cours, nous nous intéresserons à deux aspects de l'analyse des données, la statistique exploratoire et la modélisation statistique à des fins de prédiction. Comme cette discipline s'est enrichie d'un certain nombre de techniques propres à l'intelligence artificielle, l'on parle aussi parfois de data mining.

L'objectif de la statistique exploratoire est de synthétiser, résumer, structurer l'information contenue dans des données. Ainsi, elle permet de mettre en évidence des propriétés de l'échantillon et de suggérer des hypothèses. Elle utilise pour cela des représentations des données sous forme de tableaux, de graphiques, d'indicateurs numériques.

L'objectif de la modélisation statistique des données consiste généralement à rechercher une relation approximative entre une variable et plusieurs autres, la forme de cette relation étant linéaire ou non-linéaire. Lorsque la variable à prévoir est numérique, l'on parle de régression ou de modèle linéaire général. Si, en revanche, la variable à prévoir est qualitative (appartenance à une catégorie) ou ordinale (appartenance à une catégorie, les catégories étant ordonnées), l'on parle de discrimination ou classification.

Dans le cadre de ce cours, nous nous baserons sur un projet réel de modélisation statistique des données, de type "credit scoring". Ce projet permettra de mettre en pratique les diverses méthodes exposées au cours, ainsi que d'approfondir certains aspects théoriques.
 
 

2. Projet d'analyse de données

Comme déjà mentionné, dans le cadre de ce cours, nous nous baserons sur un projet réel de modélisation statistique des données, de type " credit scoring ". Ce projet permettra de mettre en pratique les diverses méthodes exposées au cours, ainsi que d'approfondir certains aspects théoriques.

L'objectif de ce projet est la mise en pratique concrète d'un certain nombre de techniques d'analyse de données quantitatives, à travers l'étude d'un cas pratique nécessitant l'utilisation de logiciels de traitement statistique de données (SAS/JMP, SPSS, R, S-Plus). L'application visée est le scoring d'une base de données de "credit scoring". En résumé, il s'agit de détecter les "mauvais payeurs" à partir d'une série de caractéristiques mesurées sur des individus, en vue d'accorder ou refuser un prêt financier. L'impact financier de ce système de scoring sera évalué sur des données réelles.

Le projet d'analyse de données se réalisera par groupes de deux étudiants et donnera lieu à un rapport final.

 

3. Evaluation des connaissances

Les connaissances seront évaluées sur base du projet et d'un examen oral.

La note globale sera la moyenne de la note collective du projet d'analyse de données quantitatives et de l'examen oral.

 

[UCL] [ESPO] [IAG] [ISYS] [Pointeurs utiles]

Dernière mise à jour: 28-02-2006
Responsable: Marco Saerens
Réalisation technique: Francois Fouss