Pattern anti-hallucination — injection de faits déterministes
Pendant l'audit visuel nocturne du 19-20 mai, la slide Bilan & Liquidité affichait six chiffres incorrects pour Apple : trésorerie « 166 Md$ » alors que les données yfinance disaient 35,9 Md$, current ratio « 1,5x » au lieu de 0,65x, Altman Z « >8 » au lieu de 1,69. Le LLM lisait les ratios fournis (ND/EBITDA, Altman Z) mais inventait les valeurs absolues à partir de sa mémoire d'entraînement.
Le fix : injection systématique d'un bloc FAITS CHIFFRES DETERMINISTES dans chaque prompt LLM avec les valeurs USD/EUR absolues (cash, dette long terme, dette court terme, dette nette) et les ratios avec seuils d'interprétation. Une directive REGLE ABSOLUE ANTI-HALLUCINATION interdit explicitement au modèle d'inventer un chiffre ou de contredire un signal rouge/vert.
Validation post-fix sur la même slide Apple : « Apple affiche une structure bilancielle déséquilibrée avec 35,9 Md$ de cash contre 78,3 Md$ de dette long terme. La liquidité est fragile (current ratio à 0,65x). Altman Z à 1,69 indique une zone de distress. » — 100% aligné sur les données réelles.
- Pattern transposable à tout prompt LLM consommant des données chiffrées
- Étendu à AgentSynthese, AgentDevil, slide_bilan PPTX
- max_tokens passé de 4 000 à 8 000 (évite les JSON tronqués sur tickers complexes type SMCI, HOOD)
- Garde-fou défensif PPTX : check `isinstance(str)` avant `.strip()` (fix crash dict)
Régime de marché détecté à la date d'analyse
Un nouveau bloc en haut de la Synthèse Exécutive PDF affiche le régime de marché actuel : MAG7_DOMINATED (concentration tech élevée), BROAD (rotation équilibrée), STRESS (VIX > 30) ou RATES_UP (taux longs > 4%). La détection croise trois variables : ratio XLK/SPY (concentration tech), niveau VIX et yield Treasury 10 ans.
Référence académique : Ang-Bekaert 2002 « International Asset Allocation with Regime Shifts » (RFS) et Frazzini-Pedersen 2014 sur l'inversion BAB en régime growth/MAG7. Le LLM de synthèse reçoit le label de régime pour calibrer son ton (prudent en STRESS, plus optimiste en BROAD).
Trois sections data sources US ajoutées (skip silencieux pour EU)
Pour les tickers US uniquement, le PDF s'enrichit de trois sections après la section Risques :
- Activité insider EDGAR Form 4 sur 90 jours — table 5 colonnes (insider, poste, date, action, valeur), net achats/ventes en haut. Source : SEC EDGAR officiel, dépôt obligatoire J+2 maximum.
- Short interest FINRA bi-mensuel — % du flottant, days-to-cover, variation période, flag automatique « risque squeeze élevé » si >10% short OU >5j to cover. Référence : Boehmer-Jones-Zhang 2008 (RFS).
- Top 5 détenteurs institutionnels 13F-HR — concentration ownership, nombre de fonds déclarés, exposition totale. Source : SEC EDGAR filings T+45 jours. Référence : Edmans-Goldstein-Jiang 2012 (JF).
- Skip silencieux pour les tickers EU (MC.PA, DSY.PA), UK (.L) et Asie — pas de Form 4 / FINRA hors US.
Score FinSight expliqué dans le Glossaire
Nouvelle entrée dans le Glossaire post-analyse pour expliquer simplement le score FinSight v4.2 : 0–100 combinant horizon long-terme 24m (momentum 12m, ROIC, marge nette, ratio FCF/RN, win-rate) et court-terme 3m (volatilité, drawdown, reversal). Tiers A+/A/B/C correspondant à STRONG_BUY/BUY/HOLD/SELL.
Calibration cross-marché validée par backtest 25 ans : SP500 hit rate 75% (t-stat 5,77), CAC40 25y (t=3,70), Russell 1000 10y (t=4,19). Méthodologie statistique : walk-forward purged CV + Bonferroni-global + DSR Bailey-Lopez de Prado.