From e1194758b4e87f8be427b6b92f062893a5b3730f Mon Sep 17 00:00:00 2001 From: Mohamed Sebabti <momo.rcm59@gmail.com> Date: Mon, 24 Mar 2025 09:10:13 +0100 Subject: [PATCH] readme --- README.md | 56 +++++++++++++++++++++++++++++++++++++++---------------- 1 file changed, 40 insertions(+), 16 deletions(-) diff --git a/README.md b/README.md index 803e308..e5ed25b 100644 --- a/README.md +++ b/README.md @@ -4,14 +4,14 @@ Ce projet vise à prédire la popularité d'une chanson à partir de ses caractéristiques audio. Deux modèles sont intégrés à une interface web : -- **Modèle binaire** : prédit si une chanson est populaire ('1') ou non ('0') +- **Modèle binaire** : prédit si une chanson est populaire (`1`) ou non (`0`) - **Modèle de régression** : prédit une **valeur numérique** de popularité (> 0) ## 🧠 Modèles utilisés Les modèles sont basés sur des **Random Forest**, entraînés à partir de données Spotify (via Kaggle) : -- 'random_forest_model_binaire.pkl' : classification binaire +- `random_forest_model_binaire.pkl` : classification binaire - `random_forest_model_sup0.pkl` : régression (>0) Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque modèle. @@ -19,15 +19,43 @@ Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque m ## 🛠️ Structure du projet ```bash -📁 bigdata/ +spotify-popularity-prediction-v2/ │ -├── app_glob.py # Script principal Flask -├── index-glob.html # Page HTML avec double formulaire -├── scaler_binaire.pkl # Scaler du modèle binaire -├── scaler_sup0.pkl # Scaler du modèle de régression -├── random_forest_model_binaire.pkl # Modèle Random Forest binaire -├── random_forest_model_sup0.pkl # Modèle Random Forest régression -├── README.md # Ce fichier +├── templates/ # Contient les fichiers HTML pour l'interface Flask +│ └── index-glob.html # Interface principale avec onglets pour les 2 modèles +│ +├── app_glob.py # Application Flask combinant les deux modèles +├── ml_binairefinal.py # Script de machine learning pour le modèle binaire +├── mlsup0final.py # Script de machine learning pour le modèle > 0 +│ +├── random_forest_model_binaire.pkl # Modèle binaire entraîné +├── random_forest_model_sup0.pkl # Modèle régression entraîné +├── scaler_binaire.pkl # Scaler utilisé pour normaliser les données (binaire) +├── scaler_sup0.pkl # Scaler utilisé pour normaliser les données (> 0) +│ +├── data_binaire.csv # Données utilisées pour le modèle binaire +├── data_sup_0popularity.csv # Données utilisées pour le modèle > 0 +├── data_clean.csv # Données nettoyées +├── data_clean_test.csv # Données nettoyées pour la competition KAAGLE +├── submission.csv # Fichier de soumission pour la competition KAAGLE +│ +├── analytics.ipynb # Analyse exploratoire des données +├── analytics_for_test.ipynb # Analyses complémentaires ou tests +│ +├── model_comparasion_sup0.txt # Comparatif des modèles (> 0) +├── model_comparasion_sup0v2.txt # Version 2 du comparatif +├── modelbinairefinal.txt # Résultats finaux modèle binaire +├── result_models_binaire.txt # Résultats détaillés du modèle binaire +├── result_xgboost_binaire.txt # Résultats du modèle XGBoost binaire +│ +├── heatmap.png # Visualisation des corrélations +├── ScreenAnneeRep.PNG #Visualisation +│ +├── spotify-dashboard.pbix # Tableau de bord Power BI +├── test_model.py # Script de test des modèles +├── dico des données.xlsx # Dictionnaire des variables +└── README.md # Documentation du projet (ce fichier) + ``` ## 💡 Fonctionnalités de l’interface @@ -106,15 +134,11 @@ http://127.0.0.1:5000/ 3. Cliquer sur **"Prédire"** 4. Le résultat s'affiche instantanément sous le formulaire -## 📸 Aperçu de l’interface - -<img src="https://upload.wikimedia.org/wikipedia/commons/2/26/Spotify_logo_with_text.svg" width="200" alt="Spotify Logo"> -*Interface en mode sombre, deux formulaires selon le type de modèle* ## 🧑💻 Auteurs -- Mohamed Sebabti – Master SIAD, Université Paris Cité -- [Collègues du projet Big Data SIAD] – pour l'intégration Arduino ↔ base de données +- Imane El Hamzaoui - Klervi Dagorne - Simon Majorczyk - Mohamed Sebabti – Master SIAD +- [Collègues du projet Big Data SIAD] ## 📄 Licence -- GitLab