Kubernetes (down)scaling: combinazione di autoscaler per un'allocazione minima delle risorse
È possibile ridurre i costi disattivando i carichi di lavoro quando non sono necessari. Ad esempio, si potrebbe evitare di eseguire qualsiasi carico di lavoro in un cluster dev durante la sera e ridurre il numero di nodi worker. Oppure si potrebbe eseguire un servizio web solo quando ci sono richieste effettive. In tutti questi casi, è necessario bilanciare la necessità di scalare il numero di repliche e di nodi worker.
In questo laboratorio imparerete:
- Come scalare i carichi di lavoro con l'autoscaler orizzontale.
- Come funziona l'autoscaler del cluster (ad esempio, l'autoscaler non guarda alla memoria e alla CPU).
- Come combinare l'autoscaler orizzontale e quello del cluster per espandere e ridurre i nodi del cluster in modo efficiente.