La fiabilité d'un système, telle que son temps moyen entre défaillances (MTBF), est souvent calculée en agrégeant la fiabilité de ses composants. Cependant, s'appuyer sur des éléments intermittents ou peu fiables n'est peut-être pas la meilleure idée pour créer un service fiable. Des systèmes critiques qui ne peuvent pas se permettre de tomber en panne, comme les avions ou les engins spatiaux, sont construits en tenant compte de la redondance—en dupliquant des composants critiques pour améliorer la fiabilité.
Les systèmes peer-to-peer (P2P) sont composés de milliers ou de millions de pairs similaires, qui peuvent ne pas être fiables mais facilement dupliqués. La duplication simple peut être coûteuse, car elle nécessite la duplication d'un fichier sur plusieurs homologues pour une disponibilité accrue. Heureusement, il existe d'autres stratégies optimales pour garantir la fiabilité des réseaux P2P :
Codes de correction d'erreur, tels que Codage Reed Solomon, ont été conçus dans les années 1950 pour contrôler et réparer les erreurs dans les canaux de communication bruyants. La redondance est ajoutée aux informations transmises par le biais de données supplémentaires. Le RAID 6 pour unités de disque utilise des stratégies de redondance similaires.
Dans le système de stockage de fichiers P2P de Hive, Disque Hive, les fichiers sont divisés en fragments de données répartis sur le réseau P2P. Des fragments supplémentaires sont créés pour tenir compte de la disparition de pairs ou du contenu détruit par des pannes matérielles. Par exemple, 100 partitions chiffrées générées à partir de votre fichier et envoyées à 100 homologues peuvent n'en nécessiter que 70 pour reconstruire le fichier d'origine. Les fragments manquants sont régénérés lorsque les pairs partent. Avec seulement 30 % de frais généraux, la probabilité de ne pas pouvoir accéder au contenu est nettement inférieure à celle d'une simple réplication.
Les pairs du réseau P2P de Hive jouent le même rôle mais présentent des comportements différents. Les modèles d'utilisation et la disponibilité varient tout au long de la journée, entre pairs et selon les zones géographiques. Hive apprend le comportement de chaque pair et place chaque fragment de manière optimale pour garantir que les données puissent toujours être reconstruites en cas de besoin.
Bien que la correction d'erreur directe puisse atténuer l'indisponibilité des homologues, certains homologues peuvent rencontrer des pannes matérielles permanentes. Les pairs qui ne se sont pas connectés depuis longtemps ou qui ne prouvent pas qu'ils disposent de données valides sont marqués comme homologues défaillants. Le réseau P2P de Hive va commencer à reconstruire ses données ailleurs.
En conclusion, les réseaux P2P peuvent garantir la disponibilité des données dans un groupe hétérogène de pairs en évolution rapide en tirant parti de diverses stratégies. Utilisant l'avantage des chiffres, ces réseaux fournissent un stockage statistique dans le cloud, garantissant la fiabilité et la disponibilité des données.
Pour gérer les problèmes de sécurité, en particulier en ce qui concerne la distribution des données entre de nombreux pairs, HiveNet adopte une approche globale pour garantir la confidentialité et la sécurité des données. Avant que les données ne soient téléchargées sur le réseau, elles sont soumises à un processus de division en morceaux, de compression et de cryptage à l'aide d'algorithmes sécurisés. Ce processus garantit la confidentialité et la sécurité des données, seul le propriétaire des données étant en mesure de les déchiffrer et d'accéder aux informations d'origine. De plus, la conception du système permet de récupérer les données à l'aide d'un protocole à connaissance nulle, garantissant ainsi que la sécurité des données est maintenue même pendant la phase de déchiffrement et de reconstruction.
Pour régénérer les partitions manquantes dans un réseau P2P, HiveNet utilise un processus dans lequel les fichiers sont initialement divisés en plusieurs partitions, des partitions supplémentaires étant créées pour tenir compte des défaillances ou des départs potentiels de nœuds. Cette méthode garantit que même si certains nœuds deviennent indisponibles, le réseau peut toujours reconstruire le fichier d'origine à l'aide des fragments restants. Ce système est conçu pour fonctionner avec une marge de redondance, de sorte qu'une reconstruction complète des fichiers est possible avec seulement un sous-ensemble du total des partitions.
La correction des erreurs directes dans les réseaux P2P tels que HiveNet est confrontée à des défis tels que la gestion du stockage et de la bande passante supplémentaires requis pour les données de redondance. Ces frais généraux sont un facteur critique car ils ont un impact direct sur l'efficacité et la rentabilité du réseau. La mise en œuvre de HiveNet répond spécifiquement à ces défis en optimisant le stockage et la transmission des données afin de minimiser les ressources supplémentaires nécessaires pour maintenir la fiabilité et garantir la disponibilité des données.