Skip to content
Snippets Groups Projects
Commit e1194758 authored by Mohamed Sebabti's avatar Mohamed Sebabti
Browse files

readme

parent 45575c2f
Branches
No related tags found
No related merge requests found
......@@ -4,14 +4,14 @@
Ce projet vise à prédire la popularité d'une chanson à partir de ses caractéristiques audio. Deux modèles sont intégrés à une interface web :
- **Modèle binaire** : prédit si une chanson est populaire ('1') ou non ('0')
- **Modèle binaire** : prédit si une chanson est populaire (`1`) ou non (`0`)
- **Modèle de régression** : prédit une **valeur numérique** de popularité (> 0)
## 🧠 Modèles utilisés
Les modèles sont basés sur des **Random Forest**, entraînés à partir de données Spotify (via Kaggle) :
- 'random_forest_model_binaire.pkl' : classification binaire
- `random_forest_model_binaire.pkl` : classification binaire
- `random_forest_model_sup0.pkl` : régression (>0)
Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque modèle.
......@@ -19,15 +19,43 @@ Les données sont **normalisées** à l’aide de `StandardScaler` pour chaque m
## 🛠️ Structure du projet
```bash
📁 bigdata/
spotify-popularity-prediction-v2/
├── app_glob.py # Script principal Flask
├── index-glob.html # Page HTML avec double formulaire
├── scaler_binaire.pkl # Scaler du modèle binaire
├── scaler_sup0.pkl # Scaler du modèle de régression
├── random_forest_model_binaire.pkl # Modèle Random Forest binaire
├── random_forest_model_sup0.pkl # Modèle Random Forest régression
├── README.md # Ce fichier
├── templates/ # Contient les fichiers HTML pour l'interface Flask
│ └── index-glob.html # Interface principale avec onglets pour les 2 modèles
├── app_glob.py # Application Flask combinant les deux modèles
├── ml_binairefinal.py # Script de machine learning pour le modèle binaire
├── mlsup0final.py # Script de machine learning pour le modèle > 0
├── random_forest_model_binaire.pkl # Modèle binaire entraîné
├── random_forest_model_sup0.pkl # Modèle régression entraîné
├── scaler_binaire.pkl # Scaler utilisé pour normaliser les données (binaire)
├── scaler_sup0.pkl # Scaler utilisé pour normaliser les données (> 0)
├── data_binaire.csv # Données utilisées pour le modèle binaire
├── data_sup_0popularity.csv # Données utilisées pour le modèle > 0
├── data_clean.csv # Données nettoyées
├── data_clean_test.csv # Données nettoyées pour la competition KAAGLE
├── submission.csv # Fichier de soumission pour la competition KAAGLE
├── analytics.ipynb # Analyse exploratoire des données
├── analytics_for_test.ipynb # Analyses complémentaires ou tests
├── model_comparasion_sup0.txt # Comparatif des modèles (> 0)
├── model_comparasion_sup0v2.txt # Version 2 du comparatif
├── modelbinairefinal.txt # Résultats finaux modèle binaire
├── result_models_binaire.txt # Résultats détaillés du modèle binaire
├── result_xgboost_binaire.txt # Résultats du modèle XGBoost binaire
├── heatmap.png # Visualisation des corrélations
├── ScreenAnneeRep.PNG #Visualisation
├── spotify-dashboard.pbix # Tableau de bord Power BI
├── test_model.py # Script de test des modèles
├── dico des données.xlsx # Dictionnaire des variables
└── README.md # Documentation du projet (ce fichier)
```
## 💡 Fonctionnalités de l’interface
......@@ -106,15 +134,11 @@ http://127.0.0.1:5000/
3. Cliquer sur **"Prédire"**
4. Le résultat s'affiche instantanément sous le formulaire
## 📸 Aperçu de l’interface
<img src="https://upload.wikimedia.org/wikipedia/commons/2/26/Spotify_logo_with_text.svg" width="200" alt="Spotify Logo">
*Interface en mode sombre, deux formulaires selon le type de modèle*
## 🧑‍💻 Auteurs
- Mohamed Sebabti – Master SIAD, Université Paris Cité
- [Collègues du projet Big Data SIAD] – pour l'intégration Arduino ↔ base de données
- Imane El Hamzaoui - Klervi Dagorne - Simon Majorczyk - Mohamed Sebabti – Master SIAD
- [Collègues du projet Big Data SIAD]
## 📄 Licence
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment