Bonjour à tous,

Vous l'avez peut être remarqué, nous avons subis quelques perturbations au niveau du serveur survie aujourd'hui.
Tout a commencé aux environs de 1h du matin heure locale...

En réalité tout a dégénéré officiellement à 00h38:
[00:38:15] [Thread-20/WARN]: org.sqlite.SQLiteException: [SQLITE_FULL] Insertion failed because database is full (database or disk is full)
D'après les premières informations que nous avons reçu de la part de MTX, il semblerait que un autre serveur hébergé sur la même machine que la notre ai saturé l'espace disque... C'est ce que nous pouvons voir sur le message d'erreur des logs ci-dessus.
Etant donné que le disque dur est plein, impossible de sauvegarder les changements sur le serveur. Cette sauvegarde impossible a fortement endommagé (comme vous pouvez vous en douter) les différents fichiers du serveur. En effet, les changements sur les chunks ne pouvaient plus se sauver, la base de donnée coreprotect ne comprenais plus rien etc. Résultat des comptes les joueurs ne pouvaient même plus se connecter car les logs eux même ont saturé pour de bon la machine empêchant toute nouvelle inscription d'information sur les fichiers serveurs...

Suite au constat du crash (nous n'avions pas encore ces informations) Thomson et Marmotte se sont évertués à tenter de relancer la machine tout en contactant le support de MTX.

Le support a alors finalement trouvé la source du problème qui était liée à un autre serveur (qui ne nous appartient pas) qui saturais (vous le savez maintenant) l'espace disque.

Le problème n'étant pour autant pas réglé de notre côté nous avons du trouver une solution pour remettre le serveur en état de marche.
J'ai avant tout tenté de mettre à jour paperspigot (j'y reviendrais un peu plus loin), sans effet.
Il semblait alors nécessaire de devoir rollback le serveur au dernier point de sauvegarde.

Il faut savoir que le serveur est totalement et automatiquement sauvegardé toutes les 6h par MTX. J'ai donc choisi la sauvegarde du 15 février à 20h.
Après la restauration de celle-ci, j'ai pu m’apercevoir avec stupeur que elle aussi était corrompue. J'imagine que il ne restait déjà plus assez de place sur le disque à ce moment là, ce qui a empêché le déroulement correct de la sauvegarde.

J'ai donc du lancer une restauration de la sauvegarde de hier 14h.
Après mise en place de celle-ci j'ai profité de l'occasion pour mettre à jour paper (la distribution minecraft que nous utilisons). Cette mise à jour était absolument vitale.
En effet, il semblerait que un bug de duplication pouvait être utilisé en 1.13.2, créant des fichiers de chunk extrêmement volumineux.
Ci-joint le message posté par le responsable de Paper dans la nuit sur discord:

J'aurais dans tout les cas poussé cette mise à jour qui est arrivée à 4h du matin dès que possible en voyant ce message ce matin.

Je n'ai pour le moment aucune information supplémentaire du côté de MTX (et je ne sais pas trop si j'en aurais). Qui sait, le serveur concerné a peut être subis l'utilisation de ce bug de duplication, ce qui aurait fais exploser la taille dudit serveur.
Dans tout les cas, nos serveurs sont désormais à jour pour luter contre ce problème et toute tentative d'une telle duplication sera évidemment suivit d'un ban permanent.

Je suis absolument désolé pour les personnes ayant perdu plusieurs heures de jeu dans cette malheureuse histoire. Je vous tiendrais informé si j'ai des retours de la part de MTX en espérant ne pas avoir à revivre ce problème.

NON aux crashs (et aux dramas) les week-ends et bon jeu sur nos serveurs !

Merci pour ce support réactif en temps de crise et surtout le WE.

Donc vu que le problème vient d'espace disque dur saturé, cela veut dire que mtx n'a pas mis de quota d'espace disque en place sur le serveur mutualisé (ou alors le quota en lui même avait un bug). (d'ailleurs notre serveur est partagé avec combien d'autre serveurs minecraft du coup ?)

    Je pensais qu'on était sur une machine dédiée, sans autre serveur.

      Exostum mtx n'impose effectivement pas de quota, ils demandent juste que les fichiers correspondent bien à du minecraft et à rien d'autre.

      [supprimé] Je pensais qu'on était sur une machine dédiée, sans autre serveur.

      Il semblerait que ce ne soit plus le cas.

      J'ai l'impression qu'ils font un peu ce qu'ils veulent

        [supprimé] on peut être heureux cependant d'avoir pu garder un partenariat excellent malgré que nous ne soyons plus lié à minecraft.fr

        (et il me semble que en réalité nous n'avons jamais réellement eu de machine dédiée, mais ils ont le droit et tant que ça marche on ne va pas se plaindre non ?)

          sirlinium on peut aussi exiger l'honnêteté, j'ai souvenir que tu nous disais qu'on avait une machine rien qu'à nous

            [supprimé] Le partenariat, ça veut dire qu'ils nous offrent un service qui est normalement payant. Il est un peu difficile d'être exigeant dans ces conditions, surtout que le partenariat vient juste d'être conclut. Le jour où on aura prouvé que notre serveur a des impacts très positifs sur leur business, on sera alors en position de force pour demander des avantages. En attendant, malgré ce couac, on a un serveur gratuit qui fonctionne très bien et une équipe très réactive quand ce genre de couacs surviennent 😉

              • [supprimé]

              • Modifié

              MrJee85 Ce que tu décris là c'est pas un partenariat mais un cadeau. Or on fait quand même une grosse pub pour mtx, je suis sûr que la plupart d'entre nous, à commencer par moi, ne connaissait même pas mtx avant d'aller sur play-mc (des hébergeurs comme omgserv ou nitroserv sont bien plus célèbres). On leur fait une pub énorme, sur la dynmap, sur le discord, sur le forum, sur le site, et c'est une centaine de joueurs en moyenne par jour sur un an.

              Donc pour dire les choses de façon plus directe, on n'est pas obligé de leur lécher les bottes, un partenariat ca implique un apport des deux côtés, et on ne doit pas sous-estimer ce qu'on leur apporte. Ils doivent mériter la pub qu'on leur fait, et ca commence par le minimum qu'on est en droit d'exiger : l'honnêteté.

                [supprimé] on n'est pas obligé de leur lécher les bottes

                Personne n'a dit ça.

                Et puis ils doivent eux-même rassembler les éléments pour mettre le doigt précisément sur ce qu'il s'est passé, car ça n'a peut-être pas uniquement touché notre machine, il faut au moins leur laissé le temps de décortiquer la situation. Et puis, comme l'a dit sirli, c'est le week-end, les choses vont malheureusement moins vite le week-end 😛
                Concernant la machine, il n'y a aucune certitude sur le fait qu'on en ai pas une dédiée, c'est peut être juste le disque de stockage qui est partagé, vu que le problème était en relation avec l'espace de stockage. Ca ne sert à rien de disserter sur des choses qui ne sont pas avérées 😉
                Attendons juste les retours d'MTX.

                [supprimé] sirlinium on peut aussi exiger l'honnêteté, j'ai souvenir que tu nous disais qu'on avait une machine rien qu'à nous

                Je n'ai pas le temps de répondre, en détail comme il est tard. Effectivement du temps de mc.fr il nous était dit que nous avions une machine dédiée (sauf pour le crea), cependant je n'étais pas directement en charge du partenariat comme vous pouvez vous en douter.
                Lors de la création du nouveau partenariat direct entre pmc et mtx, l'on m'a bien précisé que il ne s'agissait pas de serveurs sur une machine dédiée. Je ne l'ai juste pas précisé dans mon annonce (il me semble).
                Quoi qu'il arrive, dédié ou pas, l'essentiel est d'avoir des serveurs de qualité à disposition. Tant que nous ne rencontrons pas de soucis de rollback ou de lag cela ne me dérange pas et je peux comprendre leur optimisation des ressources.
                De là à dire que les méchants mtx nous mentent, cela serait aller un peu vite en besogne.

                  sirlinium De là à dire que les méchants mtx nous mentent, cela serait aller un peu vite en besogne.

                  Parce que ca a bien été le cas, avant le nouveau partenariat ils nous faisaient croire qu'on était sur une machine dédiée, or de nombreux signes indiquaient le contraire, et je ne suis pas le seul à le dire.

                  [supprimé] Or on fait quand même une grosse pub

                  Vu qu'on fait plus rien avec minecraft.fr, moi je serai d'avis de pas trop en demander

                  Nous ne sommes clairement pas en position pour faire une quelquonque revendication - pour le moment- 😉

                  2 mois plus tard

                  Bonjour à tous,

                  En me baladant sur le site/forum je suis tombé sur ce topic et n'en ayant pas été averti il était difficile d'apporter directement des précisions 😉

                  Présentation

                  Pour ceux qui ne me connaissent pas je suis Snk, co-fondateur de mTxServ depuis son origine (il y a 10 ans déjà !) et je suis plus particulièrement celui qui s'occupe de nos belles machines et donc de la répartition des serveurs sur l'ensemble du parc, avec tout ce que ça peut comporter comme problématiques.

                  Historique partenariat

                  Pour refaire l'historique les serveurs mis à disposition dans le cadre du partenariat le sont depuis plus de 3 ans et demi (pour les actuels), sur la base de 4 gros serveurs regroupés sur une même machine.
                  Initialement, celle-ci était dédiée à ces serveurs mais + pour accueillir potentiellement un nombre extrême de joueurs, avec toute la difficulté que cela peut comporter au regard de ce que consomme Minecraft (c'est peu de le dire ^^). Ceci étant, l'utilisation de ces serveurs a évolué dans le temps et la machine se retrouvait très sous-utilisée (très très genre 10% de sa capacité). Dans le temps nous avons pu considérer que c'était raisonnable mais passant sur des machines toujours plus haut de gamme et in fine plus coûteuses, ce gaspillage n'était pas forcément une bonne chose.
                  Aussi notre vision du partenariat est de montrer ce que nous faisons, avoir des partenaires sur des machines à part ne représente à notre sens pas une démarche honnête dans la mesure où ce n'est pas représentatif du service produit pour tous les clients. L'idée derrière n'est pas de dire "ok on va entasser des tonnes de serveurs comme partout #yolo" mais plus de dire que ces serveurs partenaires doivent correspondre à des gros serveurs comme ceux que nous proposons à nos clients, dans les mêmes conditions et doivent justement être un bon moyen de jauger du niveau de service très élevé qu'on essaie d'atteindre. D'ailleurs, nous sommes particulièrement à l'écoute de nos partenaires car ils nous permettent de sans arrêt nous améliorer en nous faisant des retours constructifs !

                  Bref dans le temps on a aligné sur ce qu'on propose globalement en mettant quelques serveurs clients en voisins mais de manière raisonnable et raisonnée, en essayant de suivre un peu l'évolution du projet pour être sûr que ça matche 🙂

                  Nouvelles offres

                  En octobre 2018 nous avons revu intégralement notre panel et nos offres pour améliorer grandement la qualité de service et surtout les rendre plus abordables à tous, mettant de côté les nombreux paliers de slots et axant davantage sur les ressources comme le font la plupart des acteurs sur le marché.
                  Ceci a trouvé un public très vaste, les commandes ont réellement explosé et le nombre de machines avec, nous obligeant à rationaliser l'utilisation de celles-ci. Pendant pas mal de semaines/mois nous avons fait de celle de play-mc.fr une exception sous-utilisée mais il devenait compliqué de maintenir cela, notamment pour les raisons d'équité évoquées au-dessus.
                  La machine est donc devenue une machine comme une autre, avec les dizaines de ses petites soeurs (dont pas mal de nouvelles).

                  Retour sur le crash du 15/02/2019

                  Pour en venir plus précisément au crash dont il est question ici, c'est un cas rare mais qui peut survenir. Notre philosophie a toujours été de faire confiance à nos clients dans l'utilisation qu'ils font de nos services, tout en assurant la sécurité, fiabilité et stabilité de la plateforme. Aussi nous avons développé un monitoring individuel de chaque serveur qui peut prendre certaines décisions, notamment si un serveur a une utilisation à vide démesurée ou si au contraire il est complètement inactif depuis de nombreuses semaines, de sorte de pouvoir mobiliser les ressources pour les vrais besoins et le faire très bien 🙂
                  Pour l'espace de stockage c'est pareil, on fait confiance aux clients en n'imposant pas de quota (qui plus est payant comme le font certains concurrents et ce... au prix fort) mais en surveillant de près ce qu'il se passe. Nous avons excessivement optimisé tout un tas de systèmes, à commencer par les sauvegardes qui sont externalisées depuis 2-3 ans sur des serveurs au passage bien coûteux mais nous permettent de le faire sur de longues périodes, l'arrivée des SSD type NVMe de bonnes capacités nous a également bien aidé pour continuer à aller dans ce sens.

                  Le seul défaut de ces nouveaux NVMe, c'est qu'ils sont très très très performants. Pourquoi un défaut ? Dans le cas d'un dysfonctionnement d'un serveur qui veut se mettre à écrire comme un fou des données (ex : logs de debug, nombreux fichiers dump, etc) et bien ça le fait sans broncher...
                  Malgré un monitoring très actif et une équipe réactive, ça peut aller très vite et dans le cas de ces événements c'est près de 250 Go écrits en quelques minutes qui sont responsables de tout ce qui a été décrit sur le topic et qui correspond bien à ce qu'il s'est produit.
                  Petite précision, pour la sauvegarde de 20h, elle ne pouvait pas être valide car précisément avant de pousser une sauvegarde sur les serveurs externalisées, la sauvegarde est faite en local le plus vite possible pour avoir des données les plus intègres possible. Forcément si l'espace de stockage ne le permet pas, la sauvegarde n'est pas bonne.

                  Autre problème, cela s'est produit en début de soirée un vendredi soir où de toute évidence nous n'étions pas sur le qui-vive pour souffler d'une nouvelle grosse semaine, d'autant que les sondes monitoring n'ont pas remonté correctement les informations.
                  Tout a été résolu le lendemain et nous avons corrigé la partie monitoring mise à défaut pour avoir une remontée plus efficace pour être prévenus et pouvoir intervenir plus rapidement même si nous ne sommes pas connectés.

                  Conclusion

                  J'espère que ce post vous aura un peu éclairé sur tout ce qu'il s'est passé. Il faut aussi comprendre que derrière un hébergeur comme nous il n'y a pas une équipe de X dizaines de personnes ou autre, être hébergeur de serveurs de jeux c'est faire beaucoup avec peu, la réalité étant que nous n'avons pas les moyens d'être de nombreuses personnes pour être dans la minute à toute heure du jour ou de la nuit pour se dépanner, idem pour le support.
                  Je sais que les idées de grosses sociétés multi-nationales qui ramassent des camions d'argent persistent mais la réalité est vraiment à l'opposé de tout cela.

                  Nous avons d'ailleurs amélioré la communication avec nos clients en inaugurant le 1er janvier dernier notre Discord, permettant d'avoir un lien plus direct avec nos clients mais pas que. Nos partenaires y sont davantage mis à l'honneur également 🙂

                  J'arrête là mon pâté, si vous avez des questions n'hésitez pas !

                  Serveurs Minecraft non officiels, non approuvés ou associés à Mojang ou Microsoft.


                  Copyright © 2024 - Play-MC.fr