¿Cómo se almacena Google?

Empresas


Ahora que uno está acostumbrado a usar Google para todo, a veces te preguntas dónde demonios almacenarán toda la información de indexado de la red y de sus servicios. Las respuestas a estas incógnitas a continuación.

Los centros de datos de Google, al igual que los de otras grandes compañías, usan métodos ingeniosos y de su propia cosecha para lidiar con el problema de las ingentes cantidades de datos.

En el caso de Google, nos encontramos con MapReduce, sistema que le permite manejar datos de todo tipo en un complejo proceso dividido en otros más pequeños distribuidos entre una ingente cantidad de ordenadores.

MapReduce se basa en 2 pasos fundamentales:
-Mapeado: en éste una computadora principal evalúa una petición y la divide en subproblemas que asigna a otros ordenadores, y así sucesivamente. Luego se graba la información y se mantiene en los discos duros de los ordenadores finales en vez de centralizarlos.
-Reducción: aquí, otros ordenadores “operarios” cogen la información de los anteriores y la ordenan en un formato que permita resolver la petición.

Al final obtenemos un “conjunto de datos sobre tus datos” que se ha generado específicamente para responder a una petición.

Pero ésta es la manera en la que maneja los datos de sus servicios. Para indexar internet, Google está desarrollando y refinando continuamente nuevas tecnologías de búsqueda. Tenéis más información sobre los algoritmos que utilizan aquí.

Supongo que tratar con una cantidad tan inmensa de datos debe ser complicado y Google lo hace de maravilla, pero la verdad es que a veces creo que mi primo de 3 años podría darme resultados mejores o por lo menos con mucho más sentido. Si no, probad a poner algo y darle a “Voy a tener suerte”, la necesitarás.— :Dani Burón [Wired]

Leer la biografía del autor  Ocultar la biografía del autor