Machine Learning en production : budget, équipes et ROI réel
Situation réelle Faire du ML en production, c’est 10% de data science et 90% d’infrastructure. Après avoir déployé plusieurs projets ML en prod, voici les vraies métriques qui comptent : combien ça coûte, quelles équipes tu as besoin, et comment justifier le ROI auprès du board. Ce que j’ai observé : le budget ML qui tue. Sur projet recommendation engine 100M users 50K RPS, vrais coûts mensuels Infrastructure Serving AWS Model serving 12x c5.2xlarge $3,600/mois Feature store Redis Cluster $2,400/mois Data pipeline Airflow + workers $1,800/mois Monitoring stack Prometheus Grafana $600/mois Total serving $8,400/mois Training Infrastructure GPU training p3.8xlarge 40h/mois $4,200/mois Data storage S3 500TB $1,200/mois Compute feature engineering $2,100/mois Total training $7,500/mois Équipes nécessaires coûts annuels 2x Data Scientists seniors 140k€ chacun 280k€ 1x ML Engineer 120k€ 120k€ 0.5x Platform Engineer 130k€ 65k€ 0.3x DevOps spécialisé 140k€ 42k€ Total équipes 507k€/an ROI réel +18% click-through rate → +2.3M€ revenus annuels Payback period 8 mois Pas mal mais jamais linéaire. Le ML production c’est 10% data science 90% ingénierie. Si tu veux recherche reste lab. Si tu veux impact business investis infrastructure. ...