O Cloud8 possui diversas ferramentas para estender a gestão e otimização de seus containers.
Do ponto de vista de FINOPS, cobrimos todos os aspectos:
- custos individuais por IDs de containers Fargate e ECS
- detalhes de utilização e alocação
- anomalias
- relatórios e alertas
- tags com chargeback, monitoramento de untagged e outros
- correções de tags em massa
- markups para MSPs
Monitoramos melhores práticas de conformidade, segurança e recomendações de redução de custos:
- repositórios ECR que são possuem scan habilitados
- alertas de vulnerabilidades destes repositórios
- agentes desatualizados
- portas de rede abertas desnecessariamente
- acompanhamento das tags criadas e se está seguindo apropriamente os padrões definidos
- oportunidades de migração de tipos e compatibilidade com Graviton
Automações e Workflows para redução de custos:
- mudanças de número de servidores nos Auto Scaling Groups. Ao se considerar ‘zero’ é o equivalente a parar um ASG
- suportamos ASGs mapeados em ECS puro, EKS e quaisquer outros serviços equivalentes
- suporte a AKS (Azure Kubernetes Services) com desligamento/desalocação dos nodes ou escalabilidade do número de instâncias (para mais ou menos)
- suporte a Instance Group do Google com aumento e diminuição de instâncias
- suporte a escalar serviços Fargate
- suporte a upgrade/downgrade de Fargate por meio de troca de Task Definitions
Vale destacar o extenso suporte que possuímos ao Fargate. Conseguimos identificar o custo de cada container com suas tarefas e realizar rateio de negócios. Uma vez identificado containers que gastem muito, é possível utilizar o agendador de workflows para desligar determinados serviços e/ou atualizar um task definition para que rode com menos CPU e memória em fins de semana e feriados. É muito comum, encontrarmos Fargate de testes que ficam ligados o tempo inteiro ou ambiente com menor utilização em fins de semanas – estes são candidatos ideais a ter um Task Definition trocado e reduzir custos. A principal vantagem é que o AWS faz o deploy de forma transparente sem implicar em downtime (ao contrário de fazer um upgrade/downgrade uma instância EC2 onde um ligar/desligar tira o servidor do ar por alguns segundos).