readme

e1194758 · Mohamed Sebabti · 45575c2f · e1194758
Commit e1194758 authored 4 months ago by Mohamed Sebabti
--- a/README.md
+++ b/README.md
@@ -4,14 +4,14 @@

 Ce projet vise à prédire la popularité d'une chanson à partir de ses caractéristiques audio. Deux modèles sont intégrés à une interface web :

- **Modèle binaire** : prédit si une chanson est populaire ('1') ou non ('0')
+- **Modèle binaire** : prédit si une chanson est populaire (`1`) ou non (`0`)
 - **Modèle de régression** : prédit une **valeur numérique** de popularité (> 0)

 ## 🧠 Modèles utilisés

 Les modèles sont basés sur des **Random Forest**, entraînés à partir de données Spotify (via Kaggle) :

- 'random_forest_model_binaire.pkl' : classification binaire
+- `random_forest_model_binaire.pkl` : classification binaire
 - `random_forest_model_sup0.pkl` : régression (>0)

 Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque modèle.
@@ -19,15 +19,43 @@ Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque m
 ## 🛠️ Structure du projet

 ```bash
-📁 bigdata/
+spotify-popularity-prediction-v2/
 │
-├── app_glob.py              # Script principal Flask
-├── index-glob.html          # Page HTML avec double formulaire
-├── scaler_binaire.pkl       # Scaler du modèle binaire
-├── scaler_sup0.pkl          # Scaler du modèle de régression
-├── random_forest_model_binaire.pkl  # Modèle Random Forest binaire
-├── random_forest_model_sup0.pkl     # Modèle Random Forest régression
-├── README.md                # Ce fichier
+├── templates/                        # Contient les fichiers HTML pour l'interface Flask
+│   └── index-glob.html              # Interface principale avec onglets pour les 2 modèles
+│
+├── app_glob.py                      # Application Flask combinant les deux modèles
+├── ml_binairefinal.py              # Script de machine learning pour le modèle binaire
+├── mlsup0final.py                  # Script de machine learning pour le modèle > 0
+│
+├── random_forest_model_binaire.pkl  # Modèle binaire entraîné
+├── random_forest_model_sup0.pkl     # Modèle régression entraîné
+├── scaler_binaire.pkl               # Scaler utilisé pour normaliser les données (binaire)
+├── scaler_sup0.pkl                  # Scaler utilisé pour normaliser les données (> 0)
+│
+├── data_binaire.csv                 # Données utilisées pour le modèle binaire
+├── data_sup_0popularity.csv         # Données utilisées pour le modèle > 0
+├── data_clean.csv                   # Données nettoyées
+├── data_clean_test.csv              # Données nettoyées pour la competition KAAGLE
+├── submission.csv                   # Fichier de soumission pour la competition KAAGLE
+│
+├── analytics.ipynb                  # Analyse exploratoire des données
+├── analytics_for_test.ipynb         # Analyses complémentaires ou tests
+│
+├── model_comparasion_sup0.txt       # Comparatif des modèles (> 0)
+├── model_comparasion_sup0v2.txt     # Version 2 du comparatif
+├── modelbinairefinal.txt            # Résultats finaux modèle binaire
+├── result_models_binaire.txt        # Résultats détaillés du modèle binaire
+├── result_xgboost_binaire.txt       # Résultats du modèle XGBoost binaire
+│
+├── heatmap.png                      # Visualisation des corrélations
+├── ScreenAnneeRep.PNG               #Visualisation
+│
+├── spotify-dashboard.pbix           # Tableau de bord Power BI
+├── test_model.py                    # Script de test des modèles
+├── dico des données.xlsx            # Dictionnaire des variables
+└── README.md                        # Documentation du projet (ce fichier)
+
 ```

 ## 💡 Fonctionnalités de l’interface
@@ -106,15 +134,11 @@ http://127.0.0.1:5000/
 3. Cliquer sur **"Prédire"**
 4. Le résultat s'affiche instantanément sous le formulaire

-## 📸 Aperçu de l’interface
-
-<img src="https://upload.wikimedia.org/wikipedia/commons/2/26/Spotify_logo_with_text.svg" width="200" alt="Spotify Logo">
-*Interface en mode sombre, deux formulaires selon le type de modèle*

 ## 🧑‍💻 Auteurs

- Mohamed Sebabti – Master SIAD, Université Paris Cité  
- [Collègues du projet Big Data SIAD] – pour l'intégration Arduino ↔ base de données
+- Imane El Hamzaoui - Klervi Dagorne - Simon Majorczyk - Mohamed Sebabti – Master SIAD
+- [Collègues du projet Big Data SIAD] 

 ## 📄 Licence