Une des principales fonctionnalités des algorithmes d’intelligence artificielle est de chercher et classifier. Nous allons présenter ici les briques techniques fondamentales qui permettent ces opérations.
Briques de recherche
- Recherche lexicale : BM25, TF-IDF pour la recherche par mots-clés
- Recherche sémantique :
- Bi-encoders (recherche vectorielle, similarité cosinus, FAISS)
- Cross-encoders (scoring direct de paires query-document, re-ranking)
- Indexation : index inversés, arbres de recherche, hachage sensible à la localité
- Filtrage et tri : algorithmes de ranking, filtrage collaboratif
Briques de classification
- Algorithmes supervisés : SVM, arbres de décision, réseaux de neurones
- Méthodes d’ensemble : Random Forest, Gradient Boosting, bagging
- Classification non supervisée : clustering (k-means, DBSCAN), classification hiérarchique
- Évaluation : métriques de performance, validation croisée, matrices de confusion
Briques transversales
- Préparation des données : normalisation, feature scaling, encodage catégoriel
- Réduction de dimensionnalité : PCA, t-SNE, UMAP
- Gestion des déséquilibres : SMOTE, sous-échantillonnage, pondération de classes
- Optimisation : grid search, recherche bayésienne, early stopping
