Skip to content
GitLab
Explore
Sign in
Primary navigation
Search or go to…
Project
B
BigData
Manage
Activity
Members
Labels
Plan
Issues
Issue boards
Milestones
Wiki
Code
Merge requests
Repository
Branches
Commits
Tags
Repository graph
Compare revisions
Snippets
Build
Pipelines
Jobs
Pipeline schedules
Artifacts
Deploy
Releases
Package registry
Model registry
Operate
Environments
Terraform modules
Monitor
Incidents
Analyze
Value stream analytics
Contributor analytics
CI/CD analytics
Repository analytics
Model experiments
Help
Help
Support
GitLab documentation
Compare GitLab plans
GitLab community forum
Contribute to GitLab
Provide feedback
Keyboard shortcuts
?
Snippets
Groups
Projects
Show more breadcrumbs
Simon Majorczyk
BigData
Commits
e1194758
Commit
e1194758
authored
3 months ago
by
Mohamed Sebabti
Browse files
Options
Downloads
Patches
Plain Diff
readme
parent
45575c2f
No related branches found
No related tags found
No related merge requests found
Changes
1
Show whitespace changes
Inline
Side-by-side
Showing
1 changed file
README.md
+40
-16
40 additions, 16 deletions
README.md
with
40 additions
and
16 deletions
README.md
+
40
−
16
View file @
e1194758
...
@@ -4,14 +4,14 @@
...
@@ -4,14 +4,14 @@
Ce projet vise à prédire la popularité d'une chanson à partir de ses caractéristiques audio. Deux modèles sont intégrés à une interface web :
Ce projet vise à prédire la popularité d'une chanson à partir de ses caractéristiques audio. Deux modèles sont intégrés à une interface web :
-
**Modèle binaire**
: prédit si une chanson est populaire (
'1'
) ou non (
'0'
)
-
**Modèle binaire**
: prédit si une chanson est populaire (
`1`
) ou non (
`0`
)
-
**Modèle de régression**
: prédit une
**valeur numérique**
de popularité (> 0)
-
**Modèle de régression**
: prédit une
**valeur numérique**
de popularité (> 0)
## 🧠 Modèles utilisés
## 🧠 Modèles utilisés
Les modèles sont basés sur des
**Random Forest**
, entraînés à partir de données Spotify (via Kaggle) :
Les modèles sont basés sur des
**Random Forest**
, entraînés à partir de données Spotify (via Kaggle) :
-
'
random_forest_model_binaire.pkl
'
: classification binaire
-
`
random_forest_model_binaire.pkl
`
: classification binaire
-
`random_forest_model_sup0.pkl`
: régression (>0)
-
`random_forest_model_sup0.pkl`
: régression (>0)
Les données sont
**normalisées**
à l’aide de
`StandardScaler`
pour chaque modèle.
Les données sont
**normalisées**
à l’aide de
`StandardScaler`
pour chaque modèle.
...
@@ -19,15 +19,43 @@ Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque m
...
@@ -19,15 +19,43 @@ Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque m
## 🛠️ Structure du projet
## 🛠️ Structure du projet
```
bash
```
bash
📁 bigdata
/
spotify-popularity-prediction-v2
/
│
│
├── app_glob.py
# Script principal Flask
├── templates/
# Contient les fichiers HTML pour l'interface Flask
├── index-glob.html
# Page HTML avec double formulaire
│ └── index-glob.html
# Interface principale avec onglets pour les 2 modèles
├── scaler_binaire.pkl
# Scaler du modèle binaire
│
├── scaler_sup0.pkl
# Scaler du modèle de régression
├── app_glob.py
# Application Flask combinant les deux modèles
├── random_forest_model_binaire.pkl
# Modèle Random Forest binaire
├── ml_binairefinal.py
# Script de machine learning pour le modèle binaire
├── random_forest_model_sup0.pkl
# Modèle Random Forest régression
├── mlsup0final.py
# Script de machine learning pour le modèle > 0
├── README.md
# Ce fichier
│
├── random_forest_model_binaire.pkl
# Modèle binaire entraîné
├── random_forest_model_sup0.pkl
# Modèle régression entraîné
├── scaler_binaire.pkl
# Scaler utilisé pour normaliser les données (binaire)
├── scaler_sup0.pkl
# Scaler utilisé pour normaliser les données (> 0)
│
├── data_binaire.csv
# Données utilisées pour le modèle binaire
├── data_sup_0popularity.csv
# Données utilisées pour le modèle > 0
├── data_clean.csv
# Données nettoyées
├── data_clean_test.csv
# Données nettoyées pour la competition KAAGLE
├── submission.csv
# Fichier de soumission pour la competition KAAGLE
│
├── analytics.ipynb
# Analyse exploratoire des données
├── analytics_for_test.ipynb
# Analyses complémentaires ou tests
│
├── model_comparasion_sup0.txt
# Comparatif des modèles (> 0)
├── model_comparasion_sup0v2.txt
# Version 2 du comparatif
├── modelbinairefinal.txt
# Résultats finaux modèle binaire
├── result_models_binaire.txt
# Résultats détaillés du modèle binaire
├── result_xgboost_binaire.txt
# Résultats du modèle XGBoost binaire
│
├── heatmap.png
# Visualisation des corrélations
├── ScreenAnneeRep.PNG
#Visualisation
│
├── spotify-dashboard.pbix
# Tableau de bord Power BI
├── test_model.py
# Script de test des modèles
├── dico des données.xlsx
# Dictionnaire des variables
└── README.md
# Documentation du projet (ce fichier)
```
```
## 💡 Fonctionnalités de l’interface
## 💡 Fonctionnalités de l’interface
...
@@ -106,15 +134,11 @@ http://127.0.0.1:5000/
...
@@ -106,15 +134,11 @@ http://127.0.0.1:5000/
3.
Cliquer sur
**"Prédire"**
3.
Cliquer sur
**"Prédire"**
4.
Le résultat s'affiche instantanément sous le formulaire
4.
Le résultat s'affiche instantanément sous le formulaire
## 📸 Aperçu de l’interface
<img
src=
"https://upload.wikimedia.org/wikipedia/commons/2/26/Spotify_logo_with_text.svg"
width=
"200"
alt=
"Spotify Logo"
>
*Interface en mode sombre, deux formulaires selon le type de modèle*
## 🧑💻 Auteurs
## 🧑💻 Auteurs
-
Mohamed Sebabti – Master SIAD
, Université Paris Cité
-
Imane El Hamzaoui - Klervi Dagorne - Simon Majorczyk
- Mohamed Sebabti – Master SIAD
-
[Collègues du projet Big Data SIAD]
– pour l'intégration Arduino ↔ base de données
-
[Collègues du projet Big Data SIAD]
## 📄 Licence
## 📄 Licence
...
...
This diff is collapsed.
Click to expand it.
Preview
0%
Loading
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Save comment
Cancel
Please
register
or
sign in
to comment