Les utilisateurs de dropbox ont eu des difficultés à accéder au service de stockage de fichiers le week-end dernier. Le site web Dropbox a été mis hors ligne vendredi soir (10) et est resté instable pendant plus de 24 heures. Le dimanche (12), la société a déclaré que le problème était dû à un entretien de routine, mais n’a pas donné plus de détails. Maintenant Dropbox expliqué comment tout cela s’est passé.
La Dropbox a démenti les spéculations selon lesquelles le service aurait subi une invasion ou une attaque DDoS. Le problème aurait été causé lors d’une maintenance prévue pour le vendredi après-midi (10), qui visait à mettre à jour le système d’exploitation de certains serveurs Dropbox. Un bogue dans le script de mise à jour a provoqué la réinstallation du système d’exploitation sur “un petit nombre de machines”.
La société a déclaré qu’elle “utilise des milliers de bases de données” pour faire fonctionner le service et a précisé que chacune de ces banques dispose d’une machine primaire et de deux machines secondaires pour la redondance. Si la primaire échoue, il y en a deux autres pour maintenir le service. Avant la mise à jour, le script vérifie si les données sont utilisées, mais un bogue a permis de réinstaller le système d’exploitation pour les machines actives qui maintenaient le service, ce qui a provoqué le plantage du site.
Pour que le site soit opérationnel le plus rapidement possible, Dropbox affirme avoir restauré les sauvegardes des bases de données et avoir pu revenir avec la plupart des fonctionnalités dans les trois heures, mais certaines bases de données plus importantes ont pris plus de temps à importer, ce qui a causé des problèmes dans certaines fonctions. Les personnes qui ont accédé à la boîte de dépôt ce week-end se sont rendues compte que l’onglet “Photos”, qui affiche les dernières images envoyées par le téléphone portable ou l’ordinateur, était inaccessible.
Malgré la nécessité de restaurer les sauvegardes, qui sont stockées dans un environnement distinct des serveurs de production, Dropbox affirme que les données des utilisateurs “n’ont jamais été en danger pendant une panne. En effet, ces bases de données ne contiennent aucune information sur les fichiers : elles ne servent qu’à fournir des capacités de partage d’albums, de téléchargement automatique de photos et des fonctions API.
Dropbox s’est excusé auprès des utilisateurs. La société déclare qu’elle a ajouté une étape de vérification pour éviter qu’un bogue comme celui-ci n’affecte les serveurs à l’avenir. En outre, Dropbox affirme avoir développé un outil pour accélérer la restauration des bases de données MySQL, permettant au site d’être moins indisponible si un problème similaire se produit, puisque l’outil par défaut est lent à restaurer de grandes quantités de données. Il est prévu, selon Dropbox, d’ouvrir le code source de l’outil.
