Il y a des bruits qu’on reconnaît tout de suite. Le bip continu du contrôleur RAID, c’en est un. Pas le petit bip sympathique de démarrage — non, le bip insistant, répétitif, celui qui dit « Alerte ceci n’est pas un exercice ».

Mon hyperviseur principal n’héberge pas que des VM. Il fait aussi office de serveur de données central et écoute les requêtes DLNA sur un réseau dédié pour alimenter les nombreux périphériques multimédia de la maison — le tout via Serviio, un excellent serveur média Java qui sait parler à n’importe quel appareil DLNA certifié. Quand cette machine tousse, c’est toute la maison qui le ressent.

La découverte

Le contrôleur — un ServeRAID M5015 géré via StorageManager/MSM (Avago) — s’est mis à biper. Première réaction : ouvrir la console StorageManager et regarder l’état des disques.

Le constat est sans appel : un disque manquant sur le RAID 5 data.

StorageManager - disque Slot 1 offline, log événements rebuild

StorageManager : le Slot 1 est passé Offline, le contrôleur a enclenché un Rebuild automatique. La photo date d’après l’ajout du ventilateur de test.

Dans les logs en bas de l’écran, la séquence est limpide : au reboot, le contrôleur a détecté que le PD du port 0-3:0:1 était passé de l’état Rebuild à Offline. Il a ensuite immédiatement réinséré les autres disques et tenté un rebuild. Classique.

Ce qui est moins classique, c’est la température intérieure du boîtier. Le remplacement de la carte mere + cpu 18core/36 thread associé a la meteo

Le coupable : l’airflow

Le contrôleur RAID — un ServeRAID M5015 — n’a pas de ventilateur d’origine. Mais si vous avez lu l’article de février sur le remplacement du M5015, vous savez que ce contrôleur etait déjà equipé d’un ventilateur custom. Ce ventilateur semblait faire le job mais avec les fortes chaleur de ces derniers jours il s’est avéré insuffisant.

Vue PCIe - flèche rouge pointant vers le radiateur du contrôleur ServeRAID M5015

La flèche rouge désigne le radiateur du ServeRAID M5015. Les plus observateurs verront que j’ai déjà démonté le ventilateur 50mm — la flèche rouge pointe le rad du contrôleur, tellement chaud qu’on ne laisse pas le doigt dessus.

Solution de fortune, version terrain

Intérieur du boîtier, Z10PA-U8, vue d’ensemble depuis l’arrière

Vue d’ensemble de l’intérieur. La carte Z10PA-U8, ventirad be quiet! Dark Rock. Sans évacuation correcte à l’arrière, tout ça mijote tranquillement.

Pas question d’attendre : un ventilateur 120mm posé en vrac sur le dessus du boîtier ouvert, branché directement. Moche. Fonctionnel. Assumé.

Pendant ce temps, les logs confirment que le rebuild est bien parti.

La solution pérenne : impression 3D

Un ventilateur posé en vrac sur une machine de prod, ça ne peut pas durer. La vraie solution : trouver un support PCIe imprimable qui permette de fixer un 120mm standard directement dans un slot d’extension libre.

C’est sur Printables que j’ai trouvé mon bonheur : le modèle PCI bracket for 120mm FAN de Gustavo. Ce qui est amusant, c’est la raison pour laquelle Gustavo a conçu cette pièce : refroidir une carte réseau dual-port 10 GbE, des SSD NVMe et une carte SAS. Autrement dit, quasiment exactement ma config — contrôleur ServeRAID M5015, carte réseau 4x1G et un SSD NVMe dans la même machine. Visiblement le problème d’airflow sur ce type de configuration est universel. Le fichier .3mf est propre, les dimensions tombent juste, et c’est gratuit. Merci Gustavo.

AnycubicSlicer, quelques réglages de remplissage, et c’est parti à l’impression.

AnycubicSlicer - modèle 3D du bracket PCIe ventilateur

Le modèle dans AnycubicSlicer. Structure en brim vert pour l’adhérence, remplissage rouge, parois jaunes. L’anneau circulaire accueille le 120mm, la patte basse s’engage dans le slot PCIe.

Le modèle intègre l’anneau de maintien pour le 120mm, la patte d’encastrement dans le slot PCIe et un déflecteur qui oriente le flux vers la zone disques.

Bracket imprimé monté dans le boîtier

Le bracket imprimé dans son logement.

Ventilateur 120mm et bracket côte à côte sur tapis de découpe

Le 120mm et son bracket, côte à côte avant montage. Les trous de fixation tombent pile. Ça rentre au millimètre.

Le fichier .3mf original est sur Printables. Il est également disponible en téléchargement direct ici : PCI FAN bracket v4 — fichier 3MF (Gustavo / Printables)

Vue complète du boîtier ouvert avec PSU LC6550

Vue d’ensemble du boîtier ouvert.

Le rebuild

Pendant que la partie mécanique se règle, le contrôleur fait son travail. Le Check Consistency lancé en parallèle du rebuild permet de valider l’intégrité des données une fois le volume reconstruit.

StorageManager - Check Consistency en cours à 34%

Group Show Progress : Check Consistency à 34% sur le Virtual Drive 1, RAID 10.914 TB. 2h16 d’écoulées, environ 4h23 restantes selon l’estimation. Le VD est déjà en statut Optimal — le rebuild est terminé, le check valide.

Le VD est déjà Optimal au moment du check — le rebuild s’est bien passé, aucune donnée perdue. Le Check Consistency ne détecte rien d’anormal. Serviio reprend ses activités, les TV de la maison aussi.