À propos
Je suis étudiant en première année de BUT Science des Données à l’IUT Sophia Antipolis. À travers mes projets, je me suis surtout intéressé à l’analyse statistique et au machine learning, en particulier aux méthodes exploratoires comme l’ACP et le clustering.
Ce que j’aime dans les projets data, ce sont les situations où les données ne donnent pas de réponse évidente. Sur plusieurs jeux de données, j’ai constaté que de bons scores ne signifient pas toujours une bonne compréhension, et que l’échec d’un algorithme est souvent plus instructif qu’un résultat artificiellement optimisé.
Aujourd’hui, je cherche un stage qui me permette de continuer à apprendre dans ce sens : explorer les données sérieusement, choisir les méthodes de façon raisonnée, analyser leurs limites et relier les résultats à des problématiques concrètes.
Formation
- BUT Science des Données — IUT Sophia Antipolis (2024 - Aujourd'hui)
- Année de césure — 2023-2024
- CPGE PCSI/PC — CIV Valbonne (2021-2023)
- Baccalauréat Scientifique — Lycée Saint Joseph, Nice (Mention Bien)
Compétences
Analyse de données & Statistiques
- Exploration de données, interprétation, visualisation
- ACP, corrélations, réduction de dimension
- Analyse de séries temporelles, décomposition additive/multiplicative
- Modélisation statistique et évaluation de résidus
Machine Learning
- Apprentissage supervisé et non supervisé
- Clustering : K-means, DBSCAN, Gaussian Mixture Models
- Classification : SVM, régression logistique
- Évaluation critique : ARI, silhouette, cross-validation
Data Visualisation & Business Intelligence
- Power BI : conception de dashboards décisionnels, filtres dynamiques
- Visualisation : Matplotlib, Seaborn, Excel
- KPI et indicateurs de performance
Programmation & Bases de données
- Langages : Python, R, SQL, Java, VBA
- Bases de données : conception, requêtes SQL, modélisation relationnelle
- Outils : Git, VS Code, RStudio, Excel
Langues
- Français : Natif
- Anglais : Courant
- Italien : Intermédiaire
- Arabe dialectal : Courant
Approche analytique
Mon travail suit une progression logique et rigoureuse :
- Analyse exploratoire et compréhension des variables
- Choix raisonné des méthodes en fonction du contexte
- Évaluation critique et honnête des résultats
- Interprétation et mise en perspective métier
Cette démarche est illustrée dans mes projets, notamment en ACP, clustering non supervisé et data visualisation.
Projets
Mes principaux travaux couvrent des domaines variés de l'analyse de données :
- Analyse en composantes principales (ACP) : Dataset Decathlon (R)
- Clustering non supervisé : Identification de types de mines
- Analyse de séries temporelles : Excel & modélisation statistique
- Data visualisation & décisionnel : Tableaux de bord Power BI (SNCF)