Sep 07, 2023
Los SSD QLC ofrecen 175 GB/s en un servidor de almacenamiento de 2U
Hace casi dos años, completamos una revisión de un servidor de almacenamiento Viking Enterprise Solutions (VES) con 24 bahías NVMe y nodos de computación gemelos en un chasis de 2U. VES es un importante OEM y crea algunos de los
Hace casi dos años, completamos una revisión de un servidor de almacenamiento Viking Enterprise Solutions (VES) con 24 bahías NVMe y nodos de computación gemelos en un chasis de 2U. VES es un importante OEM que crea algunos de los sistemas de servidores de almacenamiento más innovadores del mercado. Recientemente tuvimos la oportunidad de probar una versión de su servidor de almacenamiento optimizada para unidades NVMe de un solo puerto. Naturalmente, tomamos 24 SSD QLC Solidigm P5316 de 30,72 TB, los colocamos en el servidor y retrocedimos para ver qué pueden hacer casi 750 TB de flash RAW.
Hace casi dos años, completamos una revisión de un servidor de almacenamiento Viking Enterprise Solutions (VES) con 24 bahías NVMe y nodos de computación gemelos en un chasis de 2U. VES es un importante OEM que crea algunos de los sistemas de servidores de almacenamiento más innovadores del mercado. Recientemente tuvimos la oportunidad de probar una versión de su servidor de almacenamiento optimizada para unidades NVMe de un solo puerto. Naturalmente, tomamos 24 SSD QLC Solidigm P5316 de 30,72 TB, los colocamos en el servidor y retrocedimos para ver qué pueden hacer casi 750 TB de flash RAW.
Más allá de su trabajo OEM, VES también vende a una variedad de clientes de HPC e Hiperescala. Esta es una consideración importante porque, al considerar el rendimiento del servidor de almacenamiento fuera del ámbito empresarial tradicional, la forma en que las organizaciones con huellas de datos masivas configuran el almacenamiento es diferente.
Muchas de las cargas de trabajo a las que se dirigen estos servidores son lo que consideramos aplicaciones modernas de análisis e inteligencia artificial, donde el rendimiento es crítico y la disponibilidad de datos un poco menos. Como tal, estas configuraciones no se parecen a una SAN tradicional, donde los servicios de datos y la resiliencia son el foco principal. En este ejemplo, estamos configurando para un rendimiento óptimo dentro del servidor de almacenamiento VES en lugar de agregar tarjetas de E/S y aprovechar el servidor como almacenamiento compartido.
Este matiz de configuración es importante. Entregaremos 12 de los SSD P5316 a cada nodo de cómputo AMD EPYC en la parte posterior del sistema. Estos nodos abordan el almacenamiento en JBOD, asumiendo resiliencia a nivel de aplicación para la disponibilidad de datos. Si bien no utilizamos las GPU para este informe, es bastante razonable configurar esos nodos con algo como NVIDIA A2 para análisis o cargas de trabajo de inferencia.
Sin embargo, antes de profundizar demasiado en la configuración del servidor y el almacenamiento, analicemos los componentes de hardware clave que forman parte de este trabajo.
Para este trabajo, acudimos a VES para encontrar un servidor potente que pudiera aprovechar al máximo los 24 SSD Solidigm P5316 de 30,72 TB del frente. Este no es un tema trivial; Las unidades de un solo puerto funcionarán mejor en una solución que pueda ofrecer cuatro carriles PCIe v4 desde uno de los nodos del servidor AMD a cada unidad. El acceso directo ofrece el mayor rendimiento de cada SSD, en lugar de fluir a través de un expansor interno que puede limitar el ancho de banda. Además, este sistema está diseñado para SSD de un solo puerto, como Solidigm P5316, en comparación con la revisión del Viking Enterprise Server anterior que fue diseñado para SSD de dos puertos.
Viking Enterprise Solutions VSS2249P es un servidor de almacenamiento de nodo dual 2U con 24 bahías para unidades PCIe v4 U.2 de un solo puerto. Más específicamente, cada nodo (o módulo) de servidor admite 12 SSD NVMe U.2 (SFF-8639) de 2,5 pulgadas conectables en caliente y de un solo puerto a través de carriles x4 PCIe Gen4, lo que lo convierte en un servidor impulsado por el rendimiento. Esto lo hace ideal para casos de uso donde los cuellos de botella de E/S pueden ser un problema, como almacenamiento de computación de borde, análisis, aprendizaje automático, inteligencia artificial, bases de datos OLTP, comercio de alta frecuencia, así como modelado, simulación, investigación científica y otros casos de uso de alto rendimiento.
VES es una empresa líder en desarrollo de servidores y almacenamiento que se especializa en el desarrollo de soluciones a gran escala para clientes OEM empresariales de computación en la nube y de alto rendimiento. Debido a su amplia cartera de clientes, tienen una amplia experiencia en el aprovechamiento de tecnologías emergentes al desarrollar sus soluciones, lo que puede ayudar a brindar a sus clientes una ventaja competitiva. Esperamos mucho de lo mismo con el VSS2249P.
Hemos tenido este servidor en nuestro laboratorio antes, pero esta vez los hemos poblado con SSD NVMe PCIe Gen4 Solidigm D5-P5316 de 30,72 TB, lo que equivale a casi tres cuartos de petabyte para almacenamiento a través del formato U.2 de 15 mm. factor. Esto permitirá a los clientes (específicamente en el espacio de hiperescala) realizar implementaciones a gran escala. Las unidades D5-P5316 también cuentan con QLC NAND de 144 capas, lo que reducirá los costos manteniendo modelos de alta capacidad y un rendimiento sólido.
Se dice que el D5-P5316 ofrece hasta 7 GB/s en lecturas secuenciales, mientras que los modelos de 30,72 TB ofrecen un poco más de velocidad en escrituras con 3,6 GB/s. En lecturas aleatorias de 4K, Solidigm cotiza su nueva unidad en 800.000 IOPS para todos los modelos. La unidad también cuenta con una clasificación de 0,41 escrituras por día (DWPD), una garantía de 5 años y una gama de seguridad mejorada, que incluye cifrado de hardware AES-256, desinfección NVMe y medición de firmware.
Estas unidades son ideales para entornos que necesitan optimizar y acelerar el almacenamiento dentro de cargas de trabajo de centros de datos, como redes de entrega de contenido (CDN), infraestructura hiperconvergente (HCI) y Big Data.
En general, descubrimos que Solidigm ha creado una unidad que encuentra un excelente equilibrio entre capacidad, rendimiento y costo, lo cual es perfecto para el VSS2249P.
Los dos módulos de servidor dentro del gabinete VSS2249P son intercambiables en caliente y están equipados con una CPU AMD EPYC Rome, dos ranuras PCIe Gen4 x16 y una OCPNIC v3.0 que admite tarjetas complementarias PCIe Gen 4 y hasta 8 DIMM. Con 3,43 pulgadas (alto) x 17,2 pulgadas (ancho) x 27,44 pulgadas (profundidad), el VSS2249P también está diseñado para encajar perfectamente en un bastidor estándar de 1,0 metros y 19 pulgadas, lo que permite implementarlo en un variedad de aplicaciones.
Cada nodo de nuestra configuración incluye una CPU AMD EPYC 7402P, que cuenta con 24 núcleos, un reloj base de 2,8 GHz (aumento máximo de 3,35 GHz), 48 subprocesos y 128 MB en caché L3. También está equipado con 64 GB de RAM DDR4 (8 x 8 GB) y un SSD de arranque M.2 de 250 GB.
El VSS2249P está diseñado como un sistema sin cables. Por ejemplo, el plano de transmisión proporciona conectividad para alimentación, datos y administración, así como para las fuentes de alimentación. Los ventiladores del sistema también forman parte del conjunto del sled del servidor (conectados al plano de la unidad a través de la placa del ventilador) y son alimentados y controlados por el plano de la unidad. Para facilitar el acceso, los ventiladores se retiran a través de la cubierta superior. Todos los SSD se conectan directamente al plano medio. Esto hace que el mantenimiento del VSS2249P sea perfecto, mientras que la falta de cables mejora el flujo de aire y, por lo tanto, los nodos del servidor son más fríos.
Si bien la mayoría de nosotros consideramos la memoria flash QLC como una alternativa de menor rendimiento a las SSD TLC, eso es solo mirar un lado de la ecuación. El rendimiento de escritura aleatoria de bloques más pequeños puede ser menor debido a decisiones arquitectónicas, como la dirección indirecta aproximada, pero el rendimiento de escritura secuencial y de escritura aleatoria de bloques grandes es muy competitivo y muy cercano al de los SSD TLC DC de nivel básico.
Con el flash basado en TLC en el mercado, las velocidades de escritura son más bajas, pero el rendimiento de lectura sigue siendo altamente capaz, si no completamente competitivo. Nuestro enfoque en esta revisión fue aprovechar 24 SSD Solidigm P5316 de 30,72 TB dentro de un servidor de 2 nodos, mostrando hasta dónde podemos llevarlos con mucha computación detrás de ellos.
La última vez que analizamos un sistema similar de Viking Enterprise Solutions, se construyó para compartir 24 SSD en dos nodos, y cada nodo tenía acceso de múltiples rutas a cada SSD. El VSS2249P utiliza nodos similares en el backend, aunque 12 SSD están conectados directamente a un nodo y los 12 restantes al otro. Esto le da a cada SSD 4 canales completos de carriles PCIe Gen4 de regreso al nodo al que está conectado.
Instalamos Ubuntu 20.04 en cada servidor y aprovechamos FIO para saturar simultáneamente los 24 SSD Solidigm P5316. Cada SSD se llenó por completo con un llenado secuencial y luego se dividió para centrar la huella de la carga de trabajo en el 5 % de la superficie de la unidad. Nos centramos en tamaños de bloques optimizados para QLC, que se superponen con los medios flash tradicionales. La principal diferencia se reduce a minimizar la actividad de escritura inferior a 64K, lo que provoca un problema de dirección de escritura en la memoria flash QLC. Dicho esto, las cargas de trabajo que medimos fueron las siguientes:
En nuestra primera prueba con un tamaño de transferencia secuencial de 1 MB, medimos un increíble ancho de banda de 175,5 GB/s en 24 de los SSD P5316. Esto resultó en poco más de 7,3 GB/s por SSD en la parte frontal. Con una carga de trabajo de escritura secuencial de 1 M, esa cantidad se midió a 56,1 GB/s o 2,34 GB/s por SSD.
Al reducir el tamaño del bloque a una carga de trabajo de 64K, los SSD Solidigm P5316 ofrecieron 159 GB/s de ancho de banda o más de 6,62 GB/s por SSD. La carga de trabajo de escritura midió 57,7 GB/s o 2,40 GB/s por SSD.
Como no todas las cargas de trabajo eran secuenciales, pasamos a un conjunto de trabajo aleatorio de 64K más exigente, lo que puso a los SSD QLC en una de sus situaciones más estresantes. El tráfico de lectura registró su mayor ancho de banda, con una increíble cifra de 176,3 GB/s de tráfico. Sin embargo, al cambiar de lectura a escritura, aquí es donde los SSD P5316 experimentaron el mayor estrés, midiendo 13,2 GB/s o 550 MB/s por unidad. Esto concuerda con las cifras de la hoja de especificaciones para esta carga de trabajo, pero muestra dónde estos SSD alcanzan su límite.
Sabiendo que la lectura aleatoria de 64K ofrecía el mayor rendimiento de la unidad y la escritura el más bajo, analizamos una combinación de carga de trabajo mixta para ver cómo varían estas unidades a medida que cambia el equilibrio de lectura/escritura. Con una carga de trabajo aleatoria de 64K de lectura del 70 %, el grupo de unidades midió 44 GB/s. Sin embargo, cuando ajustamos eso aún más al 90% de lectura, el ancho de banda se disparó a 130,7 GB/s. Esto impulsa aún más el punto en el que los SSD QLC implementados en las situaciones adecuadas pueden ser unidades potentes, aunque no están diseñados para reemplazar los SSD TLC en todas las situaciones.
Para concluir las pruebas, analizamos una prueba de rendimiento máximo centrada en el rendimiento de lectura aleatoria de 4K. Se omitió la escritura en 4K ya que estas unidades utilizan una unidad de dirección indirecta aproximada de 64K y no proporcionarán el mayor rendimiento en 4K. En lectura aleatoria 4K, medimos casi 87 GB/s de tráfico 4K o 21,2 millones de IOPS. Esta es una estadística impresionante, que se alinea estrechamente con las ofertas de SSD de TLC en el mercado.
Hemos realizado un trabajo extenso con los SSD QLC de Solidigm en el pasado, pero este es, con diferencia, el trabajo más importante que hemos realizado con ellos hasta la fecha, integrando casi 750 TB de almacenamiento en un servidor de 2U. Queríamos observar cómo funcionan las unidades en una configuración en la que aplicaciones como análisis e inferencia puedan aprovechar el diseño de plataforma moderno. Si bien el sentimiento general hacia QLC es que solo sirven para proyectos de valor o de archivo, eso no podría estar más lejos de la verdad.
En cuanto al rendimiento, podemos ver que los SSD P5316 en el servidor de almacenamiento VES VSS2249P pudieron publicar resultados sorprendentes. El rendimiento secuencial de bloques grandes satura el servidor, y cada SSD casi maximiza su bahía Gen4 U.2 en rendimiento de lectura. Medimos 175,5 GB/s en lectura de 1 M, lo que resultó en 7,3 GB/s por SSD.
El rendimiento de lectura aleatoria también fue excelente, alcanzando un máximo de 176,3 GB/s en un tamaño de bloque de 64K. Pero no se duerma con el rendimiento de escritura; las unidades funcionaron muy bien en grandes cargas de trabajo bloqueadas. La escritura secuencial de 64K midió 57,7 GB/s, mientras que la escritura aleatoria de 64K se redujo a 13,2 GB/s. Las cargas de trabajo mixtas centradas en la actividad de lectura tuvieron un rendimiento bastante bueno, donde medimos 44 GB/s en 64K 70/30 y poco menos de 131 GB/s en 64K 90/10. Finalmente, para lectura aleatoria de bloques pequeños medimos unos sorprendentes 86,9 GB/s o 21,2 M IOPS en nuestra carga de trabajo 4K.
En el pasado, hemos trabajado con la versión HA de doble nodo de este Viking Enterprise Server aprovechando los SSD TLC de doble puerto. Si bien no son exactamente manzanas con manzanas, hay algunas líneas de tendencia interesantes que muestran que estos SSD QLC resisten muy bien frente a las soluciones TLC.
Ambos conjuntos de unidades pudieron generar una inmensa cantidad de ancho de banda, con los SSD TLC midiendo 125 GB/s y los SSD Solidigm P5316 QLC midiendo 159 GB/s en lectura secuencial de 64K. El rendimiento de escritura también estuvo cerca, con los SSD TLC midiendo 63,2 GB/s en escritura secuencial de 64K en comparación con los P5316 con 57,7 GB/s.
Estos datos no pretenden sugerir que QLC sea un reemplazo completo de TLC en todas las aplicaciones, TLC todavía tiene una gran ventaja a medida que aumenta el porcentaje de escritura y la necesidad de resistencia. Sin embargo, para muchos casos de uso, los SSD QLC están listos para su implementación y, a menudo, pueden ser más rápidos que los competidores de TLC, especialmente cuando la carga de trabajo no requiere mucha escritura.
Además, si necesita una combinación de capacidad y rendimiento, los SSD QLC DC ganarán sin lugar a dudas; esta es una combinación única para la que QLC, y en el futuro, los SSD PLC, están bien posicionados. Dado que publicamos más de 175 GB/s en este servidor de almacenamiento VES en casi 3/4 de PB de almacenamiento en 2U, la eficiencia del rack parece bastante convincente.
Servidor de almacenamiento VES
Productos Solidigm
Solidigm patrocina este informe. Todos los puntos de vista y opiniones expresados en este informe se basan en nuestra visión imparcial de los productos bajo consideración.
Interactúe con StorageReview
Boletín | Youtube | Podcast iTunes/Spotify | Instagram | Gorjeo | Facebook | RSS Feed
Brian está ubicado en Cincinnati, Ohio y es el analista jefe y presidente de StorageReview.com.
Interactúe con StorageReview