Recherche et classification

Une des principales fonctionnalités des algorithmes d’intelligence artificielle est de chercher et classifier. Nous allons présenter ici les briques techniques fondamentales qui permettent ces opérations.

Briques de recherche

  • Recherche lexicale : BM25, TF-IDF pour la recherche par mots-clés
  • Recherche sémantique :
    • Bi-encoders (recherche vectorielle, similarité cosinus, FAISS)
    • Cross-encoders (scoring direct de paires query-document, re-ranking)
  • Indexation : index inversés, arbres de recherche, hachage sensible à la localité
  • Filtrage et tri : algorithmes de ranking, filtrage collaboratif

Briques de classification

  • Algorithmes supervisés : SVM, arbres de décision, réseaux de neurones
  • Méthodes d’ensemble : Random Forest, Gradient Boosting, bagging
  • Classification non supervisée : clustering (k-means, DBSCAN), classification hiérarchique
  • Évaluation : métriques de performance, validation croisée, matrices de confusion

Briques transversales

  • Préparation des données : normalisation, feature scaling, encodage catégoriel
  • Réduction de dimensionnalité : PCA, t-SNE, UMAP
  • Gestion des déséquilibres : SMOTE, sous-échantillonnage, pondération de classes
  • Optimisation : grid search, recherche bayésienne, early stopping