Services gratuits coupés : le cloud Azure en pénurie de capacités

Microsoft limite lourdement l’accès aux services gratuits sur son cloud public, afin que les clients payants et les services d’urgence aient l’assurance d’être servis. Une précaution dont AWS et GCP n’ont pas besoin.

Capacité maximale atteinte ! Microsoft limite jusqu’à nouvel ordre en Europe l’accès aux services en ligne d’Azure. Depuis une semaine, un système de priorisation empêche les utilisateurs d’accéder aux services gratuits dès les ressources pour servir les clients réguliers – ou les services d’urgence – ne sont plus suffisantes. A priori la majorité du temps.

« À cause de circonstances inédites liées au Covid-19 et la nécessité d’équilibrer la charge entre nos datacenters répartis dans le monde, les comptes d’utilisateurs non payants – y compris ceux en période d’essai sur un service, y compris les étudiants qui bénéficient d’offres gratuites, y compris tous les utilisateurs qui profitent de remises gracieuses – sont susceptibles de ne pas pouvoir utiliser nos ressources en ligne pour le moment », a indiqué à nos confrères de ComputerWeekly un porte-parole de Microsoft.

« Merci de comprendre que nous prenons là des mesures de prudence dans le but de maintenir la disponibilité de nos offres en ligne pour les services d’urgences, les infrastructures publiques critiques et les clients historiques », a-t-il ajouté.

Cette déclaration officielle n’a pas été spontanée. Il aura fallu attendre que des utilisateurs partagent sur les réseaux sociaux des messages de refus de service capturés sur le portail d’Azure.

Dans un billet de blog paru un peu plus tôt, Microsoft prenait acte du succès sans précédent de son outil de communication en ligne Teams, massivement utilisé par les télétravailleurs pour collaborer, et expliquait devoir réfléchir rapidement aux moyens possibles pour déployer de nouvelles capacités, afin de muscler les ressources d’Azure. Teams, comme tous les autres outils SaaS de Microsoft, y est hébergé.

AWS et Google revendiquent avoir mieux anticipé

Mais qu’en est-il des concurrents de Microsoft sur le marché du cloud public ? Pour toute réponse, un porte-parole d’AWS invita à se rendre sur l’une de ses pages où il est expliqué qu’AWS « intègre la gestion de la pandémie à ses procédures de continuité d’activité en cas d’incident ». En clair, la surcharge des services ne serait que routine.

« Nous avons bien évidemment pris les mesures nécessaires en amont. Et nous constatons que nous savons aujourd’hui répondre à la demande des utilisateurs, malgré le Covid-19 », commente ce porte-parole, au micro de ComputerWeekly.

Du côté de Google, les services de GCP montrent tous les signes d’une parfaite disponibilité. Le fournisseur se félicite, à coups de billets de blogs paraissant régulièrement, que ses infrastructures et ses services de communication soient autant utilisés par des administrations, des hôpitaux, des organismes scolaires et des services de livraison.

« Et pour garantir la haute disponibilité dans toutes ces situations, nos datacenters sont équipés de matériels que nous concevons nous-mêmes. De fait, nous sommes capables de construire très rapidement de nouvelles ressources pour répondre à la demande », précise l’un de ces billets.

« C’est a priori le seul vrai problème dont peut souffrir un hyperscaler : ne plus pouvoir se faire livrer de serveurs à installer dans les racks pour répondre à la demande, par exemple parce qu’on achète des machines à des fournisseurs qui ne parviennent pas à récupérer leurs productions depuis la Chine », commente, au micro de nos confrères américains de SearchCloudComputing, Carl Brooks, analyste chez 451 Research.

Les utilisateurs américains d’Azure ont aussi expérimenté des coupures de services, avec des messages sur les portails les invitant à déployer leurs machines virtuelles dans une autre région. Outre-Atlantique, Microsoft ne parle pas encore de pénurie de capacité ; les coupures seraient dues à des incidents techniques.

« On ne peut que spéculer sur l’incapacité de Microsoft à déployer des serveurs en plus. Mais il est probable qu’AWS et Google, qui revendiquent les fabriquer eux-mêmes, n’aient pas non plus des moyens de production illimités. De toute façon, on l’ignore : leur capacité de production est l’un des secrets les mieux gardés », ajoute Carl Brooks, en suggérant que, peut-être, les concurrents d’Azure avaient juste mieux anticipé leurs stocks.

Par ailleurs, plusieurs indices, comme des serveurs physiques de 60 To de RAM conçus sur mesure pour SAP Hana, des machines ARM faites maison pour héberger les services web, ou encore des partenariats noués très tôt avec AMD pour développer des machines à base d’Epyc, suggèrent que Microsoft fabrique tout autant que ses concurrents les machines qui motorisent son cloud.

Un problème de places disponibles dans les datacenters en colocation ?

Microsoft serait donc le seul avec un problème de capacité à résoudre ? Mitul Patel en charge des datacenters au cabinet de conseil CBRE, en doute. Selon lui, tous les hyperscalers – les géants du cloud public – ont été contraints d’appeler à l’aide les compagnies de colocation de datacenters – Equinix, Telehouse, DATA4, Interxion et consort – pour leur demander d’héberger en urgence des capacités supplémentaires. 

Une hypothèse qu’avait également défendue Telehouse et France-IX dans les colonnes du MagIT au début du confinement. Selon eux, le pic d’activité observé sur les réseaux deux semaines avant que toute l’Europe ne bascule dans le télétravail, n’avait d’autre explication que la copie tous azimuts des services des géants d’Internet sur les serveurs de cache d’un peu tous les datacenters européens.

« Il faut arrêter avec le mythe des hyperscalers qui opèrent leurs propres datacenters. Toutes ces applications en ligne qui nous permettent aujourd’hui de rester connectés fonctionnent depuis un mix de bâtiments qui leur appartiennent, de salles informatiques qu’ils gèrent chez quelqu’un d’autre et de serveurs qu’ils louent à des prestataires locaux », dit Mitul Patel.

« En fait, selon nos enquêtes, je peux même vous dire que 80 % de la surface occupée dans les datacenters européens est dédiée à une copie locale des grands clouds publics. »
Mitul PatelCBRE

« En fait, selon nos enquêtes, je peux même vous dire que 80 % de la surface occupée dans les datacenters européens est dédiée à une copie locale des grands clouds publics », ajoute-t-il.

Microsoft aurait-il été pris de vitesse par ses concurrents au point de ne plus trouver de place disponible dans les datacenters tiers pour répliquer ses services localement ? On ne le saura pas. Le secret est de mise.

« De toute manière, c’est un faux problème. Jamais une interruption de service, même d’ampleur, n’a impacté la carrière économique d’un fournisseur de cloud public. Azure a beau limiter ses services, il continuera comme si de rien n’était une fois la crise passée », conclut Carl Brooks.

Pour approfondir sur IaaS

Close