Soporte de códecs Zstandard en Amazon Serverless OpenSearch - OpenSearch Servicio Amazon

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Soporte de códecs Zstandard en Amazon Serverless OpenSearch

Los códecs de índice determinan cómo se comprimen y almacenan los campos almacenados de un índice en el disco y en S3. El códec de índice se controla mediante la index.codec configuración estática que especifica el algoritmo de compresión. Esta configuración afecta tanto al tamaño del fragmento del índice como al rendimiento de la operación del índice.

De forma predeterminada, los índices de OpenSearch Serverless utilizan el códec predeterminado con el algoritmo de compresión. LZ4 OpenSearch Serverless también admite zstd zstd_no_dict códecs con niveles de compresión configurables del 1 al 6.

importante

Como index.codec es una configuración estática, no se puede cambiar después de la creación del índice.

Para obtener más información, consulte la documentación de los códecs OpenSearch indexados.

Creación de un índice con el códec ZSTD

Puede especificar el códec ZSTD durante la creación del índice mediante la configuración: index.codec

PUT /your_index { "settings": { "index.codec": "zstd" } }

Niveles de compresión

Los códecs ZSTD admiten niveles de compresión opcionales mediante la index.codec.compression_level configuración y aceptan números enteros en el rango [1, 6]. Los niveles de compresión más altos dan como resultado mejores relaciones de compresión (almacenamiento más pequeño) pero velocidades de compresión y descompresión más lentas. El nivel de compresión predeterminado es 3.

PUT /your_index { "settings": { "index.codec": "zstd", "index.codec.compression_level": 2 } }

Análisis comparativo de rendimiento

Según las pruebas comparativas realizadas con el conjunto de datos nyc_taxi, la compresión ZSTD logró una compresión entre un 26 y un 32% mejor en comparación con la línea base en diferentes combinaciones de niveles de compresión zstd y, zstd_no_dict

Métrica ZSTD L1 ZSTD L6 ZSTD_NO_DICT L1 ZSTD_NO_DICT L6
Reducción del tamaño del índice 28,10% 32% 26,90% 28,70%
Cambio en el rendimiento de indexación -0,50% -23,80% -0,50% -5,30%
Mejora de la latencia de Match-all Query p90 -16,40% 29,50% -16,40% 23,40%
Mejora de la latencia de Range Query p90 90,90% 92,40% -282,90% 92,50%
Mejora de la latencia Agg de la cantidad de distancia p90 2% 24,70% 2% 13,80%

Para obtener más información, consulte el AWS OpenSearch blog.