Microsoft Fabric est en GA (disponibilité générale) depuis novembre 2023 et la plateforme a considérablement mûri depuis. Mais pour beaucoup d’équipes BI habituées à SQL Server, SSIS et Power BI on-premise, Fabric reste un concept flou. Cet article fait le tri entre le marketing Microsoft et la réalité opérationnelle.

Fabric en une phrase

Fabric est la plateforme analytique unifiée de Microsoft qui regroupe dans un seul environnement : un Lakehouse (stockage de données brutes et structurées), un Data Warehouse (requêtes SQL analytiques), des pipelines d’intégration (Dataflow Gen2, qui remplace SSIS dans le cloud), des notebooks Spark (Python, Scala, R), et Power BI intégré nativement. Le tout sur une couche de stockage unique : OneLake, au format Delta Lake.

La promesse clé de Fabric est l’unification. Plus besoin de jongler entre Azure Data Factory pour les pipelines, Azure Synapse pour le DWH, Azure Databricks pour le Spark, et Power BI Service pour le reporting. Tout est dans un seul portail, avec une seule licence (capacity-based, les fameux F SKU), et un seul modèle de sécurité.

Ce que Fabric change concrètement

Pour les équipes ETL/SSIS

Dataflow Gen2 est le remplaçant cloud de SSIS dans l’écosystème Microsoft. C’est un outil d’intégration de données low-code qui fonctionne dans le navigateur — pas besoin de Visual Studio. L’interface est celle de Power Query, que la plupart des analystes Power BI connaissent déjà. Pour les cas plus complexes, les Data Pipelines de Fabric offrent une orchestration comparable à Azure Data Factory.

La transition SSIS → Dataflow Gen2 n’est pas automatique. Les Data Flow Tasks d’SSIS n’ont pas d’équivalent direct dans Dataflow Gen2 — il faut repenser les flux. Mais pour les cas simples (extraction → transformation → chargement), Dataflow Gen2 est plus rapide à développer et ne nécessite aucune infrastructure à gérer.

Pour les équipes Power BI

Le changement le plus significatif est le mode Direct Lake. Jusqu’à présent, Power BI fonctionnait en mode Import (les données sont copiées dans le modèle) ou DirectQuery (les requêtes sont envoyées à la source à chaque interaction). Direct Lake est un troisième mode qui lit les données directement depuis le Lakehouse en format Delta, sans copie et sans requête en temps réel. Le résultat : des rafraîchissements quasi instantanés et des performances proches de l’Import, sans le coût de stockage en double.

Pour les équipes data engineering

Le Lakehouse Fabric remplace la combinaison Azure Data Lake + Azure Synapse. Il stocke les données au format Delta Lake (Parquet + transaction log) dans OneLake. Les notebooks Spark sont intégrés nativement, ce qui permet de combiner SQL et Python/Scala dans le même environnement. Et surtout : le Data Warehouse Fabric supporte le T-SQL standard, ce qui facilite la transition pour les équipes habituées à SQL Server.

Ce que Fabric ne règle pas

Fabric n’est pas un bouton magique. Migrer vers Fabric ne résout pas automatiquement la dette technique accumulée dans vos packages SSIS ou vos modèles Power BI. Si vos rapports sont lents parce que le modèle de données est mal conçu, ils seront lents dans Fabric aussi.

Fabric ne règle pas non plus le problème du vendor lock-in — au contraire. Choisir Fabric, c’est s’ancrer profondément dans l’écosystème Microsoft. Si votre stratégie cloud est multi-cloud ou cloud-agnostic, Snowflake est une meilleure option pour la couche data warehouse.

Enfin, le modèle de coût capacity-based de Fabric est simple à comprendre mais peut être coûteux si mal dimensionné. Un F64 (la plus petite capacité Fabric pour la production) coûte environ 5 000 €/mois. Il faut s’assurer que l’utilisation justifie le coût — notamment si vous n’utilisez que Power BI et quelques pipelines.

Fabric vs Snowflake : tableau de synthèse

Fabric convient aux organisations déjà dans l’écosystème Microsoft, avec une préférence pour un guichet unique et une licence unifiée. Snowflake convient aux organisations qui veulent l’indépendance cloud, une facturation à l’usage granulaire, et qui préfèrent combiner Snowflake (compute + storage) avec DBT (transformation) et un outil BI au choix (Power BI, Tableau, Looker). Les deux peuvent coexister — Fabric peut même mirrorer des données Snowflake via le Mirroring natif, ce qui permet de consommer les données Snowflake dans Power BI Direct Lake sans duplication manuelle.

Notre recommandation

Ne choisissez pas Fabric parce que Microsoft le pousse. Ne le rejetez pas parce que c’est nouveau. Partez de votre patrimoine existant, de vos compétences internes, et de vos objectifs à 3 ans. L’audit de votre environnement actuel vous donnera les éléments pour une décision informée — pas une conviction de conférence.

À lire aussi : notre page dédiée Microsoft Fabric & Power BI pour une vue technique plus détaillée.