Kubernetesにおけるリクエストベースのオートスケール:ゼロへのスケーリングとその復帰
TL;DR: このセッションでは、KubernetesでアプリへのHTTPリクエストを監視する方法と、ワークロードのレプリカを増減するためのオートスケーリングルールを定義する方法を学びます。
インフラ コストを削減するには、使わないアプリをオフにすることに尽きます。しかし、課題は、必要なときにアプリを自動的にオンにする方法を見つけ出すことです。Kubernetesの開発クラスターを例にとると、週末はどのサービスも稼働させたくないかもしれない。このウェビナーでSalman氏は、KEDAとHTTPスケーラーを使用して、サービスへのリクエストをインターセプトして監視し、それに応じてポッドをスケールする方法をライブでデモします。その過程で、スケールをゼロにし、必要なときだけポッドを作成する方法を発見できるでしょう。