Skip to content
Snippets Groups Projects
Commit e1194758 authored by Mohamed Sebabti's avatar Mohamed Sebabti
Browse files

readme

parent 45575c2f
No related branches found
No related tags found
No related merge requests found
...@@ -4,14 +4,14 @@ ...@@ -4,14 +4,14 @@
Ce projet vise à prédire la popularité d'une chanson à partir de ses caractéristiques audio. Deux modèles sont intégrés à une interface web : Ce projet vise à prédire la popularité d'une chanson à partir de ses caractéristiques audio. Deux modèles sont intégrés à une interface web :
- **Modèle binaire** : prédit si une chanson est populaire ('1') ou non ('0') - **Modèle binaire** : prédit si une chanson est populaire (`1`) ou non (`0`)
- **Modèle de régression** : prédit une **valeur numérique** de popularité (> 0) - **Modèle de régression** : prédit une **valeur numérique** de popularité (> 0)
## 🧠 Modèles utilisés ## 🧠 Modèles utilisés
Les modèles sont basés sur des **Random Forest**, entraînés à partir de données Spotify (via Kaggle) : Les modèles sont basés sur des **Random Forest**, entraînés à partir de données Spotify (via Kaggle) :
- 'random_forest_model_binaire.pkl' : classification binaire - `random_forest_model_binaire.pkl` : classification binaire
- `random_forest_model_sup0.pkl` : régression (>0) - `random_forest_model_sup0.pkl` : régression (>0)
Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque modèle. Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque modèle.
...@@ -19,15 +19,43 @@ Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque m ...@@ -19,15 +19,43 @@ Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque m
## 🛠️ Structure du projet ## 🛠️ Structure du projet
```bash ```bash
📁 bigdata/ spotify-popularity-prediction-v2/
├── app_glob.py # Script principal Flask ├── templates/ # Contient les fichiers HTML pour l'interface Flask
├── index-glob.html # Page HTML avec double formulaire │ └── index-glob.html # Interface principale avec onglets pour les 2 modèles
├── scaler_binaire.pkl # Scaler du modèle binaire
├── scaler_sup0.pkl # Scaler du modèle de régression ├── app_glob.py # Application Flask combinant les deux modèles
├── random_forest_model_binaire.pkl # Modèle Random Forest binaire ├── ml_binairefinal.py # Script de machine learning pour le modèle binaire
├── random_forest_model_sup0.pkl # Modèle Random Forest régression ├── mlsup0final.py # Script de machine learning pour le modèle > 0
├── README.md # Ce fichier
├── random_forest_model_binaire.pkl # Modèle binaire entraîné
├── random_forest_model_sup0.pkl # Modèle régression entraîné
├── scaler_binaire.pkl # Scaler utilisé pour normaliser les données (binaire)
├── scaler_sup0.pkl # Scaler utilisé pour normaliser les données (> 0)
├── data_binaire.csv # Données utilisées pour le modèle binaire
├── data_sup_0popularity.csv # Données utilisées pour le modèle > 0
├── data_clean.csv # Données nettoyées
├── data_clean_test.csv # Données nettoyées pour la competition KAAGLE
├── submission.csv # Fichier de soumission pour la competition KAAGLE
├── analytics.ipynb # Analyse exploratoire des données
├── analytics_for_test.ipynb # Analyses complémentaires ou tests
├── model_comparasion_sup0.txt # Comparatif des modèles (> 0)
├── model_comparasion_sup0v2.txt # Version 2 du comparatif
├── modelbinairefinal.txt # Résultats finaux modèle binaire
├── result_models_binaire.txt # Résultats détaillés du modèle binaire
├── result_xgboost_binaire.txt # Résultats du modèle XGBoost binaire
├── heatmap.png # Visualisation des corrélations
├── ScreenAnneeRep.PNG #Visualisation
├── spotify-dashboard.pbix # Tableau de bord Power BI
├── test_model.py # Script de test des modèles
├── dico des données.xlsx # Dictionnaire des variables
└── README.md # Documentation du projet (ce fichier)
``` ```
## 💡 Fonctionnalités de l’interface ## 💡 Fonctionnalités de l’interface
...@@ -106,15 +134,11 @@ http://127.0.0.1:5000/ ...@@ -106,15 +134,11 @@ http://127.0.0.1:5000/
3. Cliquer sur **"Prédire"** 3. Cliquer sur **"Prédire"**
4. Le résultat s'affiche instantanément sous le formulaire 4. Le résultat s'affiche instantanément sous le formulaire
## 📸 Aperçu de l’interface
<img src="https://upload.wikimedia.org/wikipedia/commons/2/26/Spotify_logo_with_text.svg" width="200" alt="Spotify Logo">
*Interface en mode sombre, deux formulaires selon le type de modèle*
## 🧑‍💻 Auteurs ## 🧑‍💻 Auteurs
- Mohamed Sebabti – Master SIAD, Université Paris Cité - Imane El Hamzaoui - Klervi Dagorne - Simon Majorczyk - Mohamed Sebabti – Master SIAD
- [Collègues du projet Big Data SIAD] – pour l'intégration Arduino ↔ base de données - [Collègues du projet Big Data SIAD]
## 📄 Licence ## 📄 Licence
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment