Software | Software de gestión en centros de datos

Torben Karup Nielsen y Dennis Bouley

Este documento demuestra cómo las herramientas de software para la gestión de infraestructuras en centros de datos pueden simplificar los procesos operativos, reducir los costos y agilizar el envío de información

Figura 1. Las herramientas de software que se describen en este documento pertenecen al subconjunto de planificación e implementación OT

Introducción

Los directivos de TI y de las empresas se han dado cuenta de que es posible ahorrar muchísimo dinero en costos energéticos y operativos si se mejora la planificación de la infraestructura física, se reconfigura el sistema con pequeños cambios y se cambian mínimamente los procesos.
Los sistemas que permiten a la dirección aprovechar este ahorro son herramientas de software para la gestión de las infraestructuras físicas (es decir, alimentación y refrigeración) de los centros de datos.
Las nuevas herramientas de planificación e implementación de software de gestión (ver figura 1) mejoran la asignación de alimentación y refrigeración en las salas informáticas (planificación), ofrecen análisis rápidos del impacto cuando falla una parte de la sala informática (operaciones) y aprovechan los datos históricos para mejorar el rendimiento futuro de la sala informática (análisis). Estos tres tipos de herramientas para la planificación y la implementación (planificación, operaciones y análisis) se explican en las siguientes secciones de este documento.

Planificación: efecto de las decisiones

Las herramientas modernas de software de planificación reflejan, mediante una interfaz gráfica de usuario, el estado físico actual del centro de datos, y simulan el efecto de los futuros añadidos, movimientos y cambios en los equipos físicos. Esta función responde a algunas cuestiones habituales de planificación:
+ ¿Dónde coloco el próximo servidor?
+ ¿Tendré energía o capacidad de enfriamiento ante una falla o durante las tareas del mantenimiento?
Figura 2. Recopilación de datos para la simulación en tiempo real (pantalla de muestra extraída del APC por la aplicación InfraStruxure Capacity de Schneider Electric)

+ ¿Necesito extender mis servidores blade para tener operaciones confiables?
+ ¿Cómo impactará un servidor nuevo en el circuito existente?
+ ¿Cuál será el impacto del nuevo equipamiento sobre mis márgenes de seguridad y redundancia?
+ El equipamiento existente de energía y enfriamiento, ¿tiene la capacidad de amoldarse a las nuevas tecnologías?

Síntomas de una mala planificación

Los siguientes ejemplos ilustran los tipos de problemas que aparecen como consecuencia de una mala planificación:
+ La existencia de numerosos puntos calientes en zonas del suelo que deberían estar frías, y viceversa. ¿Por qué? Aunque el centro de datos tenga suficientes kilowatts de capacidad, puede fallar la distribución de aire.
+ Sobrecarga de una regleta de alimentación que ya había superado su máximo.
+ Modificar el destino de unidades y memoria adquiridas para un proyecto de instalación específico, lo cual puede llevar a la falta de equipamiento el día de la instalación.
+ Virtualizar un centro de datos y consolidar las aplicaciones más importantes en un grupo de servidores, pero haciendo depender todo de un mismo UPS.

Figura 3. Las herramientas de planificación se pueden usar para analizar el impacto de los movimientos y los cambios sobre la refrigeración y la alimentación del centro de datos (pantalla de muestra extraída de la aplicación APC de Schneider Electric)

Comprender el efecto de los fallos y los cambios

Conocer el impacto de los fallos ayuda a confiar en la disponibilidad de los procesos. Para esto, las herramientas de planificación mejoran la eficiencia operativa de los centros de datos, y crean un entorno para mejorar los procesos. En sí, realizan las siguientes funciones:
+ Ofrecen representaciones gráficas de los equipos informáticos y su ubicación en el rack (esto evita al operador la tarea de buscar información en hojas de cálculo o tener que estar presente físicamente en el centro de datos).
+ Muestran de forma visual el efecto de los cambios y movimientos pendientes sobre la capacidad de alimentación y la distribución de la refrigeración (ver figura 3). (Esto evita que el operador tenga que realizar complejos cálculos matemáticos y que pueda cometer errores graves que provoquen interrupciones inesperadas).
+ Simulan las consecuencias de los fallos en los dispositivos de alimentación y refrigeración de los equipos informáticos, para identificar los efectos sobre las aplicaciones empresariales más importantes (esto permite evaluar directamente el riesgo, según cálculos científicos, en lugar de tomar decisiones “a ojo”).
+ Tienen en cuenta los límites de peso de las baldosas del suelo y los racks (esto evita poner en riesgo la integridad de los racks, y las interrupciones que provocaría, o que se desplome un rack por el hundimiento de un suelo elevado).
+ Simulan escenarios de refrigeración en el centro de datos con aproximación de CFD (así se genera un análisis del flujo de aire en segundos, en lugar de los análisis CFD reales, que llevarían días y requerirían la introducción de grandes cantidades de datos).
+ Generan las ubicaciones de instalación recomendadas para montar en racks los equipos informáticos. La selección de las ubicaciones se basa en los puertos de red, la capacidad del espacio, la refrigeración y la alimentación disponibles. (Esto ayuda a evitar el problema de que se sobrecarguen los circuitos ramales o los puntos calientes.)

Estas ventajas abarcan también los nuevos entornos de nube privada. La selección y la implementación de huéspedes son fundamentales para aprovechar los beneficios de tal infraestructura. Asimismo, las nuevas interfaces gráficas permiten ver los racks en tres dimensiones.

Figura 4. Vista frontal de una fila de racks informáticos de la sala informática (pantalla de muestra extraída del APC por la aplicación InfraStruxure Operations de Schneider Electric)

Operaciones: completar más tareas en menos tiempo

Los tipos de cuestiones operativas a las que responden las herramientas modernas de gestión de la infraestructura física son, entre otras:
+ ¿Cuál es mi flujo de trabajo actual?
+ El centro de datos, ¿tiene puntos calientes?, ¿cómo puedo saberlo?
+ ¿Cuál es el estado general de mi centro de datos?
+ Perdí un ventilador, ¿qué hago ahora?
+ Excedí la capacidad de potencia en un rack, ¿qué hago?
+ ¿Cuál es mi PUE?

Síntomas de malas operaciones

Los siguientes ejemplos ilustran los tipos de problemas que provoca la falta de herramientas de software de operaciones utilizables en infraestructuras físicas:
+ Que la instalación sea tan compleja, que solo pocos profesionales puedan realizar las tareas.
+ Depender de post-its para la instalación correcta de los equipos.
+ Refrigeración excesiva de los equipos, tanto, que se refrigeren servidores que no se utilizan.
+ Instalación de servidores en un solo rack, todos dependientes del mismo UPS.
+ Instalar un servidor de baja densidad en un rack de alta densidad.

Figura 5. Método tradicional y método moderno: pérdida de un ventilador de CRAC

Herramientas para operar

Las herramientas modernas de software de operaciones realizan las siguientes funciones relacionadas con las operaciones:
+ Distribuyen y registran el consumo de potencia de los equipos de una y tres fases, para garantizar que las tres fases del sistema de alimentación lleven una carga equilibrada (esto implica que los operadores dependen menos del proveedor o del electricista para averiguar los equilibrios de carga del sistema de alimentación).
+ Ilustran la ruta de alimentación del rack (del UPS al rack y a cada uno de los dispositivos), la carga medida y la capacidad de los racks, en lugar de descubrirlo por ensayo y error (esto ayuda al operador a identificar inmediatamente los servidores que quedarían afectados si un rack o un UPS determinado fallara).
+ Ilustran el consumo energético medio y máximo por rack (esto ayuda a justificar las decisiones al decidir dónde colocar un nuevo servidor).
+ Generan una traza de auditoría con todos los cambios de activos y órdenes de trabajo durante un intervalo de tiempo especificado, incluido un registro de las alarmas activadas y retiradas (al intentar averiguar por qué falló un sistema, en lugar de confiar en la opinión de diferentes personas sobre qué equipos se movieron y cuándo, el operador puede utilizar el sistema para obtener las pruebas reales).
+ Identifican el exceso de capacidad e indican qué dispositivos se pueden retirar o utilizar en otro lugar (esto puede ayudar a ahorrar los costos de energía, reubicando activos de la sala informática que se están aprovechando poco).
+ Generan un valor de PUE cada día y registran la PUE histórica (esto permite al operador analizar si las estrategias de ahorro energético y reducción de costes de la dirección funcionan realmente).

La figura 5 compara el flujo de trabajo tradicional y el mejorado, en el caso de pérdida de un ventilador en una unidad CRAC.
A medida que crecen las salas informáticas, la situación es cada vez más difícil de controlar. Cuando los operadores se fían de su memoria más reciente o de una serie de suposiciones tradicionalmente aceptadas, empiezan a surgir los problemas. En los niveles más altos de complejidad, las herramientas de gestión realizan la tarea con mucha más eficiencia y precisión que el cerebro humano.

Figura 6. Método tradicional y método moderno: cambio de cargas

Problema: gestión de la eficiencia energética

Hasta ahora, el diseño y las operaciones de los centros de datos se han centrado en la fiabilidad y la capacidad. Esto tiene una consecuencia no deseada: los centros de datos no se han optimizado para ser eficientes.
El consumo energético constituye un costo importante de las operaciones informáticas y, en ocasiones, supera el costo del propio hardware. Esto ha motivado a muchos operadores de centros de datos a reducir el consumo energético, y las herramientas de gestión colaboran en las tareas de medición para esto.
Las figuras 6 y 7 ilustran dos ejemplos de diferentes métodos para controlar los problemas de consumo energético en los centros de datos.
Estas nuevas herramientas permiten a los operadores de las salas informáticas admitir el cambio de cargas (ver figura 6). Cuando las máquinas virtuales migran de una zona a otra, las herramientas de gestión permiten mover también la alimentación y la refrigeración, de forma dinámica.

Análisis: identificar puntos fuertes y débiles de las operaciones

El objetivo del análisis es llegar a una decisión realista u óptima según los datos. Combinar los análisis y la simulación predictiva es otra manera en la que el centro de datos puede ayudar a generar valor empresarial. Las siguientes cuestiones destacan los tipos de problemas que se pueden solucionar utilizando las herramientas modernas para la gestión de la infraestructura física de centros de datos:
+ ¿Qué tengo en mi centro de datos?
+ ¿Quién y cuándo tocó los equipos?
Figura 7. Método tradicional y método moderno: configuración de temperatura inteligente

+ ¿Perdí capacidad de potencia y enfriamiento?
+ ¿Cuándo se debe actualizar el firmware?
+ ¿Hacia qué fecha se quedará sin capacidad de potencia y enfriamiento?, ¿qué ocurrirá antes?
+ ¿Cuándo se deben cargar baterías en el UPS?
+ ¿Cuándo será necesaria la próxima inversión en infraestructura del centro de datos?
+ ¿Cómo puedo predecir la necesidad de infraestructura?

Las herramientas modernas de software de análisis realizan las siguientes funciones:
+ Identifican las discrepancias entre el consumo energético planeado, según la información de la placa de características, y el consumo real, según los datos de alimentación reales (esto ayuda a los operadores a preparar previsiones de capacidad más precisas, que ayudan a influir en las decisiones de presupuestos y adquisiciones).
+ Generan informes de inventario organizados por tipo de dispositivo, año, fabricante y propiedades del dispositivo (esto permite al operador identificar rápidamente los activos poco aprovechados, los que están fuera de garantía o los que se necesita actualizar).
+ Generan informes del consumo energético (ver figura 8) por subsistema (esto permite a los operadores definir qué racks o subsistemas generan más costo energético, y averiguar si el consumo energético está aumentando debido a los últimos cambios de la sala informática).
+ Ofrecen detalles para permitir el contracargo de los costos operativos a cada grupo de usuarios de la unidad empresarial (esto permite al operador modificar el comportamiento del consumo energético de las diversas unidades empresariales, y ofrece a las empresas la posibilidad de tomar mejores decisiones sobre las tecnologías que implementan).
Figura 8. Análisis de consumo energético (pantalla de muestra extraída del APC por la aplicación InfraStruxure Energy Efficiency, de Schneider Electric)

Cuando las especificaciones del espacio de racks y el suelo del centro de datos no se coordinan con la alimentación, la refrigeración, la distribución energética y las capacidades de distribución de la refrigeración, surgen problemas de capacidad. Algunos ejemplos de problemas de capacidad en el centro de datos:
+ Un acondicionador de aire tiene capacidad suficiente, pero la distribución de aire a la carga de TI no es la adecuada.
+ Una PDU tiene capacidad suficiente, pero no tiene posiciones de diferencial disponibles
+ Hay espacio disponible en el suelo, pero no queda potencia
+ Los sistemas de aire acondicionado están mal situados
+ Algunas PDU están sobrecargadas, mientras que otras tienen poca carga
+ Algunas áreas están sobrecalentadas, mientras que otras están frías

Conclusión

Una herramienta de gestión de la capacidad eficaz no solo identifica y destaca la existencia de problemas de capacidad, sino que también ayuda a evitar que el personal del centro de datos cree estas situaciones desde el principio.
Con las dificultades de la informática de mayor densidad, las cargas de trabajo dinámicas y la necesidad de un consumo energético más eficiente, las organizaciones necesitan software que les permita realizar planificaciones, operar con costos reducidos y llevar a cabo análisis para mejorar el flujo de trabajo. Solo el aumento de la visibilidad, un mayor control y una mejora de la automatización pueden ayudar a cumplir el compromiso de generar valor empresarial.

Fuente: White Paper 107 de Schneider Electric, “Cómo el software de gestión de la infraestructura física de centros de datos mejora la planificación y reduce los costes operativos”

Todas las publicaciones de: 
Número: 
Mes: 
Año: 
Palabra clave: