O Cloud8 possui diversas ferramentas para estender a gestão e otimização de seus containers.
Do ponto de vista de FinOps, cobrimos todos os aspectos:
- Custos individuais por IDs de containers Fargate e ECS
- Detalhes de utilização e alocação
- Anomalias
- Relatórios e alertas
- Tags com chargeback, monitoramento de untagged e outros
- Correções de tags em massa
- Markups para MSPs
Monitoramos melhores práticas de conformidade, segurança e recomendações de redução de custos:
- Repositórios ECR que são possuem scan habilitados
- Alertas de vulnerabilidades destes repositórios
- Agentes desatualizados
- Portas de rede abertas desnecessariamente
- Acompanhamento das tags criadas e se está seguindo apropriamente os padrões definidos
- Oportunidades de migração de tipos e compatibilidade com Graviton
Automações e Workflows para redução de custos:
- Mudanças de número de servidores nos Auto Scaling Groups. Ao se considerar ‘zero’ é o equivalente a parar um ASG
- Suportamos ASGs mapeados em ECS puro, EKS e quaisquer outros serviços equivalentes
- Suporte a AKS (Azure Kubernetes Services) com desligamento/desalocação dos nodes ou escalabilidade do número de instâncias (para mais ou menos)
- Suporte a Instance Group do Google com aumento e diminuição de instâncias
- Suporte a escalar serviços Fargate
- Suporte a upgrade/downgrade de Fargate por meio de troca de Task Definitions
Vale destacar o extenso suporte que possuímos ao Fargate. Conseguimos identificar o custo de cada container com suas tarefas e realizar rateio de negócios. Uma vez identificado containers que gastem muito, é possível utilizar a Automação de tarefas para desligar determinados serviços e/ou atualizar um task definition para que rode com menos CPU e memória em fins de semana e feriados.
É muito comum, encontrarmos Fargate de testes que ficam ligados o tempo inteiro ou ambiente com menor utilização em fins de semanas – estes são candidatos ideais a ter um Task Definition trocado e reduzir custos. A principal vantagem é que o AWS faz o deploy de forma transparente sem implicar em downtime (ao contrário de fazer um upgrade/downgrade uma instância EC2 onde um ligar/desligar tira o servidor do ar por alguns segundos).