Application d'entraînement de modèle MagicInput

📈 Aperçu

L'application d'entraînement de modèles MagicInput est un moteur de machine learning conçu pour entraîner des modèles prédictifs pour les stratégies de trading crypto. Elle exploite des ensembles de données structurées au format .parquet, générés par l'outil de création de jeux de données MagicInput. Ces ensembles de données capturent divers scénarios de trading selon les catégories (par exemple tokens mèmes), les directions (Long, Short) et les stratégies (scalp, long_term, etc.).

Une fois entraîné, le modèle peut être intégré directement à votre robot de trading pour fournir des recommandations stratégiques en temps réel et une aide à la décision.

🧠 Configuration du modèle – `mlconfig.yaml`

Le comportement de l'entraînement est entièrement défini via un fichier de configuration flexible :

# mlconfig.yaml

datasetDir: ./datasets/parquite_latest
modelOutputPath: ./ai/models/trade_predictor.zip
taskType: classification
labelColumn: WinRateAboveThreshold

featureColumns:
  - Leverage
  - Strategy
  - VirtualBalance
  - RiskPercent
  - SL
  - TP
  - Breakeven_Trigger
  - Breakeven_Buffer
  - TrailingSL_Offset
  - TrailingTP_Trigger
  - LongCond_0_Change
  - LongCond_0_Interval
  - ShortCond_0_Change
  - ShortCond_0_Interval

filter:
  symbols:
    - DOGE
    - PEPE
    - WIF
    - SHIB
    - FLOKI
    - BONK
  minWinRate: 60

trainer: FastForest

training:
  maxIterations: 100
  trainTestSplit: 0.8
  stratified: true

evaluation:
  metrics:
    - Accuracy
    - AUC
    - F1Score

exportTrainingStats: true

📂 Entrée des données

Le moteur de formation explore datasetDir pour trouver des fichiers .parquet, généralement organisés selon :

Catégorie – ex : meme, layer1, AI
Direction – Long, Short, Both
Stratégie – scalp, long_term, balance_midterm

Grâce au bloc filter, vous pouvez limiter l'entraînement à certains symboles ou appliquer un seuil minimal de taux de réussite, permettant de créer des modèles personnalisés selon les types d'actifs ou le comportement du marché.

🧪 Sélection des variables

Seules les colonnes listées dans featureColumns sont incluses durant l'entraînement du modèle. Elles représentent des variables clés telles que l'effet de levier, le pourcentage de risque, les SL/TP intelligents, et les conditions de signal.

La colonne labelColumn est la cible binaire utilisée pour l’apprentissage supervisé, par exemple WinRateAboveThreshold pour classifier les configurations les plus performantes historiquement.

⚙️ Paramètres d'entraînement

Les paramètres suivants sont définis dans la configuration :

Algorithme : FastForest (classification binaire robuste via arbres de décision)
Itérations max : arrêt de l'entraînement après un certain nombre ou convergence
Division entraînement/test : proportion entre données d’apprentissage et de test (ex. 80 % / 20 %)
Stratification : garantit une répartition équilibrée des classes

📊 Évaluation du modèle

Une fois entraîné, le modèle est évalué à l'aide de métriques standards de classification :

Accuracy – taux de prédictions correctes
AUC – aire sous la courbe ROC
F1 Score – moyenne harmonique entre précision et rappel

Si exportTrainingStats est activé, ces métriques et courbes de perte sont enregistrées au format CSV pour analyse ultérieure.

📦 Sortie du modèle

Une fois le modèle entraîné, il est sauvegardé au chemin modelOutputPath au format .zip. Ce fichier peut être chargé à l’exécution pour :

⚡ Recommandations de trade en temps réel
📉 Filtres d’entrée basés sur le risque
🧠 Amélioration de la prise de décision du bot

🚀 Cas d’usage : Modèles IA par catégorie

Vous pouvez entraîner plusieurs modèles, chacun ciblant une catégorie spécifique (ex. meme), une direction (ex. uniquement Long), ou un type de stratégie (ex. scalp). Ces modèles peuvent être chargés dynamiquement pour améliorer la précision et la personnalisation de vos stratégies automatisées.