|







 
|
| |
| LINF2275 |
Analyse
des données et prise de décision
|
| |
[30,30,0]
2ème quadrimestre |
|
| |
Description
1.
Présentation du cours
2. Projet
d'analyse de données
3. Evaluation des connaissances
1.
Présentation du cours
Les méthodes d'analyse de données quantitatives sont
aujourd'hui utilisées dans presque tous les secteurs
de l'activité humaine et font partie des connaissances
de base de l'ingénieur, du gestionnaire, de l'économiste,
etc. Dans ce cours, nous nous intéresserons à deux
aspects de l'analyse des données, la statistique exploratoire
et la modélisation statistique à des fins de prédiction.
Comme cette discipline s'est enrichie d'un certain
nombre de techniques propres à l'intelligence artificielle,
l'on parle aussi parfois de data mining.
L'objectif de la statistique exploratoire est de synthétiser,
résumer, structurer l'information contenue dans des
données. Ainsi, elle permet de mettre en évidence
des propriétés de l'échantillon et de suggérer des
hypothèses. Elle utilise pour cela des représentations
des données sous forme de tableaux, de graphiques,
d'indicateurs numériques.
L'objectif de la modélisation statistique des données
consiste généralement à rechercher une relation approximative
entre une variable et plusieurs autres, la forme de
cette relation étant linéaire ou non-linéaire. Lorsque
la variable à prévoir est numérique, l'on parle de
régression ou de modèle linéaire général. Si, en revanche,
la variable à prévoir est qualitative (appartenance
à une catégorie) ou ordinale (appartenance à une catégorie,
les catégories étant ordonnées), l'on parle de discrimination
ou classification.
Dans le cadre de ce cours, nous nous baserons sur
un projet réel de modélisation statistique des données,
de type "credit scoring". Ce projet permettra de mettre
en pratique les diverses méthodes exposées au cours,
ainsi que d'approfondir certains aspects théoriques.
|
|
|
| |
|
2.
Projet d'analyse de données
Comme
déjà mentionné, dans le cadre de ce cours, nous
nous baserons sur un projet réel de modélisation
statistique des données, de type " credit scoring
". Ce projet permettra de mettre en pratique les
diverses méthodes exposées au cours, ainsi que d'approfondir
certains aspects théoriques.
L'objectif de ce projet est la mise en pratique
concrète d'un certain nombre de techniques d'analyse
de données quantitatives, à travers l'étude d'un
cas pratique nécessitant l'utilisation de logiciels
de traitement statistique de données (SAS/JMP, SPSS,
R, S-Plus). L'application visée est le scoring d'une
base de données de "credit scoring". En résumé,
il s'agit de détecter les "mauvais payeurs" à partir
d'une série de caractéristiques mesurées sur des
individus, en vue d'accorder ou refuser un prêt
financier. L'impact financier de ce système de scoring
sera évalué sur des données réelles.
Le projet d'analyse de données se réalisera par
groupes de deux étudiants et donnera lieu à un rapport
final.
|
|
|
| |
|
3.
Evaluation des connaissances
Les
connaissances seront évaluées sur base du projet
et d'un examen oral.
La note globale sera la moyenne de la note collective
du projet d'analyse de données quantitatives et
de l'examen oral.
|
|
|
|
|
|