Robert Kneschke - stock.adobe.co

MariaDB esquisse l’avenir de son offre cloud

MariaDB étend les capacités de SkySQL, son DbaaS. Outre la volonté de simplifier les déploiements et les opérations de MariaDB Enterprise Server et de Xpand, son système de base de données distribuée, l’éditeur se met à l’analytique serverless et aux traitements de données géospatiales dans l’espoir de rattraper l’IPO manquée.

MariaDB a récemment dévoilé sa feuille de route pour ses services en cloud. Le porteur d’un projet open source dérivé de MySQL met l’accent sur l’automatisation des déploiements de ses distributions propriétaires au sein de son DBaaS, SkySQL.

Au début de l’année, il a d’abord revu son « Portal » pour s’aligner sur les éditeurs tels que MongoDB, mais également les trois grands fournisseurs cloud. Cette interface Web doit permettre de configurer une instance MariaDB Enterprise, Xpand ou Serverless Analytics, d’effectuer des requêtes et de superviser les bases de données en cloud. Les usagers peuvent ainsi choisir des tailles d’instances, la sécurité, la topologie de réplication et obtenir une estimation des coûts avant le déploiement. Pour les développeurs ne souhaitant pas sortir de leurs environnements, la société new-yorkaise propose un prodiver Terraform et un API REST.

SkySQL est disponible sur AWS et GCP dans un peu plus de 30 régions cloud. « Nous préparons la disponibilité de SkySQL sur Microsoft Azure dans les prochains mois », indique Jags Ramnarayan, Senior Vice President & directeur général SkySQL chez MariaDB, auprès du MagIT.

Un service DBaaS plus proche d’Aiven que d’Aurora

Depuis ce portail, MariaDB fournit un ensemble d’indicateurs dédiés au monitoring dont la charge CPU, le nombre de requêtes par seconde, la santé d’un cluster ou encore le coût d’une instance. L’outil permet d’obtenir des données agrégées, mais aussi de vérifier le fonctionnement d’un nœud ainsi que des passerelles MaxScale (le répartiteur de charge de MariaDB). Cette fonction d’observabilité est également compatible avec les instances de MariaDB Enterprise Server déployé sur site. « Il suffit d’installer un agent sécurisé au niveau de votre base de données distante », affirme un porte-parole.

Tout comme Oracle, le spécialiste new-yorkais entend se différencier des autres fournisseurs en infusant de l’IA dans son système de monitoring. MariaDB travaille sur un ensemble d’algorithmes capables de détecter des anomalies, comme des pics de consommation CPU ou RAM. D’autres algorithmes sont utilisés pour corréler ces détections afin de constater si oui ou non, elles révèlent un dysfonctionnement plus important. L’éditeur ajoute à cela des capacités d’analytique prédictive dans le but d’estimer quand une instance atteindra un pic de charge susceptible de causer des erreurs ou des pannes. C’est là qu’entrent en scène les API d’OpenAI. MariaDB teste l’utilisation des modèles de génération de textes du créateur de ChatGPT pour expliquer ces métriques, puis suggérer des modifications en couplant les métriques observées avec la documentation rédigée par ses ingénieurs.

En ce sens, MariaDB espère que ses clients enclencheront les fonctions d’autoscaling horizontal et vertical du DBaaS. En effet, il a récemment ajouté un lot de règles pour déclencher, à la hausse ou à la baisse, le nombre de nœuds et la taille des instances suivant la charge.

De même, l’éditeur a lancé en préversion technique son produit Cloud Backup, qui permet de définir des politiques de rétention, de disponibilité ou encore définir des formats de stockage. Le service est déjà disponible pour les déploiements de MariaDB Enterprise self managed et on premise.

L’entreprise met également en avant les capacités de Xpand, son back-end de base de données SQL distribuée, bientôt capable de prendre en charge PostgreSQL, en sus de MariaDB et MySQL. Pour ce faire, elle s’inspire des projets comme ceux de CockroadDB ou de YugabyteDB, mais contrairement à ces derniers ou à Aurora d’AWS, MariaDB entend proposer une extension entièrement compatible avec la licence open source de PostgreSQL.

« Surtout, Xpand ne s’appuie pas sur une architecture primaire – réplicas comme celle d’Aurora », déclare Jags Ramnarayan. L’architecture shared-nothing adoptée par l’éditeur assurerait un meilleur niveau de performance en matière de lecture et d’écriture puisque chaque nœud qui stocke et traite un sous-ensemble de données ne partage pas ses ressources.

« Cela permet de prendre en charge des centaines de milliers d’utilisateurs concurrents », vante le responsable.

PostgreSQL with Xpand est aussi différent de CockroachDB dans le sens où ce dernier s’appuie sur le niveau d’isolation Serializable des transactions SQL. « L’isolation SERIALIZABLE garantit que même si les transactions s’exécutent en parallèle, le résultat est le même que si elles s’étaient exécutées une par une, sans aucune concurrence », décrit CockroachDB dans sa documentation. À l’inverse, MariaDB préfère s’appuyer sur les niveaux Read Commited (lecture uniquement des données validées), ou Repeatable Read (toutes les lectures effectuées pendant une transaction retournent les mêmes résultats). Si le niveau utilisé par Cockroach assure une meilleure cohérence des transactions, il affecte davantage les performances du SGBDR.

MariaDB prend les trains de l’analytique serverless et du géospatial

Pour Serverless Analytics, reposant sur Apache Spark SQL, MariaDB ne prend pas les mêmes précautions en matière d’interopérabilité avec les projets open source. « Avec ce service, vous n’avez plus besoin d’extraire les données de MariaDB et de les envoyer vers RedShift ou Snowflake, nous utilisons un moteur Spark optimisé par nos soins pour effectuer les traitements analytiques opérationnels », avance Jags Ramnarayan.

Ce service compatible avec Enterprise Server, Xpand et le moteur MariaDB ColumnStore, mais aussi S3 permet d’écrire des jobs SQL compatibles avec les formats de données JSON, CSV, Parquet et AVRO depuis des notebooks Apache Zeppelin.

Selon l’éditeur, Serverless Analytics permettrait d’éviter de déployer et maintenir des pipelines ETL. « Ce sont deux moteurs séparés qui effectuent les traitements OLAP (Spark) et OLTP (MariaDB) », explique le responsable. Pour ce faire, l’éditeur s’appuie sur la nature translytique (HTAP) de sa technologie, mais confère à Serverless Analytics ses propres capacités de calcul, facturées à la consommation. L’éditeur n’a toutefois pas détaillé les fondations de l’architecture sous-jacente.

Enfin, MariaDB a annoncé la préversion d’une PaaS géospatiale s’appuyant sur la technologie de CubeWerx, une société que l’éditeur a acquise l’année dernière. Dans son idée, MariaDB s’appuie sur les standards OGC (Open Geospatial Consortium) et stocke les vecteurs (points, lignes, polygones) dans son SGBDR, tandis que les rasters (les images satellites et de drones) résident dans un service de stockage objet.

Ce n’est pas le fonctionnement de l’extension PostGIS qui permet de stocker et de traiter les différents types de données géospatiales à même PostgreSQL. En revanche, l’éditeur se rapproche de la démarche d’Esri qui, lui aussi, a lancé une PaaS en 2021.

« Le traitement des données géospatiales est un problème Big Data », considère Jags Ramnarayan. « Cela devient très coûteux de stocker toutes les données dans un SGBDR et de les traiter à l’échelle ».  

L’éditeur permet ensuite aux développeurs d’appeler et de combiner les deux types de données via API pour les afficher à travers une interface Web.

MariaDB doit rebondir après une IPO ratée

Même s’il maintient Enterprise Server et entend prendre en charge les architectures hybrides, MariaDB « place clairement son avenir dans le cloud », note le SVP.

Au deuxième trimestre fiscal achevé le 31 mars 2023, MariaDB affichait un chiffre d’affaires de 13,5 millions de dollars, en hausse de 20 % par rapport à l’année dernière et un taux de croissance de 101 % de ses revenus liés aux souscriptions cloud. Son ARR atteignait 52,9 millions de dollars.

Pour rappel, l’entreprise est cotée au New York Stock Exchange depuis décembre 2022 et revendique plus de 650 clients payants.

Or, si la structure choisie pour son IPO (SPAC) lui a permis de lever 120 millions de dollars, son action a fortement chuté depuis le début de l’opération (de 6,7 dollars le 19 décembre 2022 à 0,95 dollar le 2 juin 2023), rapprochant l’entreprise d’une sortie de cotation. Ses pertes nettes atteignaient 11,5 millions de dollars à la fin du Q2 2023.

Le tout a entraîné le licenciement de 26 personnes, et le changement de direction annoncé le 30 mai dernier. Paul O’Brien, arrivé en mars dernier chez MariaDB, ex-vice-président Business Operation chez NetApp et Symantec, succède à Michael Howard à la tête de l’entreprise. Le fondateur demeure au conseil d’administration.

Le nouveau dirigeant a pour mission d’atteindre un revenu récurrent annuel de 100 millions de dollars d’ici à 2025. Il sera accompagné par Tom Siegel, nommé Chief Revenue Officer et par Jonah Harris, CTO. Dans un premier temps, il faudra rassurer le marché pour espérer rester dans la course boursière.

Pour approfondir sur Base de données

Close