Kubernetes (down)scaling: combinación de autoescaladores para una asignación mínima de recursos
Puede reducir costes desactivando las cargas de trabajo cuando no las necesite. Por ejemplo, es posible que desee evitar la ejecución de cualquier carga de trabajo en un clúster de desarrollo durante la noche y reducir el número de nodos de trabajo. O podría ejecutar un servicio web sólo cuando haya solicitudes reales. En todos estos casos, es necesario equilibrar la necesidad de escalar el número de réplicas y nodos de trabajo.
En este laboratorio, aprenderás:
- Cómo puede escalar sus cargas de trabajo con el autoescalador horizontal.
- Cómo funciona el autoescalador del clúster (por ejemplo, el autoescalador no mira la memoria ni la CPU).
- Cómo combinar el autoescalador horizontal y de clúster para ampliar y reducir los nodos de clúster de forma eficaz.