Napster, Gnutella, Kazaa, BitTorrent, llevamos un tiempo compartiendo archivos con herramientas en Internet... ¿Sabías que se basan en la tecnología informática peer-to-peer (p2p)?
En un red punto a punto, todos los ordenadores se crean de la misma manera, están dotados de los mismos derechos y cooperan directamente entre sí para prestar un servicio. Sin jerarquía, sin intermediarios, sin director de orquesta.
En una infraestructura de igual a igual, los usuarios comparten recursos mediante intercambios directos entre ordenadores, que se denominan «nodos». Los datos se distribuyen entre los nodos en lugar de enviarse a los servidores para su procesamiento. A diferencia de la tecnología informática cliente-servidor, cada nodo desempeña una función simétrica y autónoma para proporcionar al usuario final la solución esperada.
La complejidad del diseño y el uso de los sistemas peer-to-peer les permiten tener sus propias características:
Todos los nodos desempeñan una función similar, ya que actúan como cliente y servidor. Obtienen, distribuyen y procesan el contenido.
Los sistemas punto a punto deben ser resistentes a la entrada y salida de los nodos, mientras que un sistema centralizado espera que sus servidores permanezcan activos en todo momento.
Uno de los desafíos clave en una red p2p es encontrar al par que aloja los datos solicitados. Una técnica muy conocida es utilizar una tabla hash distribuida (DHT), que es un sistema distribuido y descentralizado que proporciona un servicio de búsqueda similar al de una tabla hash. Uno de los artículos más citados sobre este tema es «Kademlia: un sistema de información punto a punto basado en la métrica XOR» de Petar Maymounkov y David Mazieres. Este artículo presenta el DHT de Kademlia, que se ha convertido en un DHT ampliamente utilizado en varias aplicaciones de igual a igual. Estos algoritmos son muy eficientes y escalables incluso con una gran cantidad de nodos y recursos.
A medida que los nodos se sobrecarguen o abandonen la red, el sistema punto a punto debe garantizar que los servicios permanezcan accesibles, disponibles y eficientes y que los datos permanezcan persistentes.
En una red punto a punto podría haber millones de nodos. Skype en su apogeo tenía más de 300 millones de usuarios. Estas redes deben tener herramientas de seguridad irreprochables que no se deterioren a medida que crece el tamaño de la red.
El almacenamiento punto a punto de Hive se basa en estos principios fundamentales. Se basa en el protocolo IPFS de código abierto para la capa central del sistema de archivos. Pero es más que eso, y además de eso, hemos creado servicios y funciones adicionales para ofrecer:
Ningún dato privado deja el dispositivo del usuario final en forma clara. El modelo de cifrado permite compartir datos entre varios participantes sin replicar el contenido ni compartir las claves.
A medida que los participantes de la red Hive almacenan los datos de otros, se les incentiva a hacerlo siempre que sigan proporcionando pruebas de la integridad del contenido.
Los algoritmos de ubicación punto a punto de Hive tienen en cuenta los requisitos de privacidad del usuario y las ubicaciones preferidas tanto para el almacenamiento como para el procesamiento de datos.
Cuando los nodos se desconectan repentinamente, los datos que contienen ya no están disponibles. Cuando se produzca un evento de este tipo, Hive recreará los datos perdidos y los distribuirá a otros nodos para garantizar la durabilidad de los archivos almacenados.
Uno puede preguntarse por qué las tecnologías peer-to-peer que están maduras desde mediados de la década de 2000 no se utilizan más. Bueno, ya están omnipresentes en los juegos, el mundo de las criptomonedas y la distribución de contenido. Las actualizaciones de Windows 10 se distribuyen mediante tecnologías punto a punto.
Pero solo recientemente la evolución del entorno tecnológico ha alineado todas las estrellas para que el peer-to-peer alcance todo su potencial:
En los próximos años, es inevitable que la computación y el almacenamiento pasen lógicamente de servidores distantes y centralizados a sistemas distribuidos más cercanos a los usuarios finales. La cantidad de datos que se producen y almacenan en Internet es enorme y crece aproximadamente un 20% cada año. La capacidad mundial de almacenamiento de datos es se espera que alcance los 13 ZB en 2024, frente a los 6,8 ZB actuales. Como alternativa a los enormes centros de datos para almacenar todos estos datos, el sistema de almacenamiento punto a punto de Hive se basará en las importantes capacidades libres de nuestros dispositivos personales en el borde de la red.