Оптимизация стоимости инфраструктуры
Провели анализ облачной инфраструктуры (AWS, Hetzner), нашли неиспользуемые или недейственные элементы системы и отказались от них. Провели оптимизацию в инфраструктуре - проверили конфигурационные файлы, перераспределили вычислительные мощности и получили различные скидки у инфраструктурных провайдеров. Это снизило затраты на инфраструктуру с ~$40k до $22k в месяц.
Внедрение IaC с использованием AWS CloudFormation
Внедрили подход Iac для клиентской инфарстурктуы - описали кодом(Terraform), внедрили, написали документацию по сервисам: VPC, S3, CloudFront, ECS, LB, ACM, RDS, ECR, WAF, IAM, OpenSearch, Сloudwatch, Cognito. Итоговая инфраструктура хранится как код, прозрачна, задокументирована и пригодна для автоматизации и переиспользования.
Миграция инфраструктуры между дата центрами
Разработали стратегию переноса инфраструктуры с учетом требований к простоям не более 3-4 часов. Перенесли инфраструктуру, постороенную на базе системы виртуализации Proxmox VE (10 VM суммарно 10Tb, в т.ч. 1С база данных размером 2Tb), из дата центра Heztner в netrack. Перенесли чувствительные данные из хранилища Heztner 5Tb на отдельный сервер и настроили backup для баз данных и чувствительных данных. При переносе инфраструктуры время простоя системы не превысило 2-х часов.
Доставка логов
Построили систему гарантированной доставки логов путем внедрения kafka в систему сбора логов, кластеризовали и оптимизировали ELK (стандартная нагрузка ~10k log per second). В результате решена проблема с потерей логов из-за периодических проблем с сетью из-за больших нагрузок.
Повышение отказоустойчивости
Кластеризовали критически важные компоненты системы, что сделало инфраструктуру более стабильной и дало возможность ее обслуживания частями, не нарушая работу и не останавливая бизнес процессы.
Сокращение задержки и увеличение перфоманса в криптотрейдинге
Клиенту критически важно было уменьшение задержки в приложении, инфраструктуре и сети. Снизили их за счет тюнинга linux, реализации идей совместно с разработчиками, внедрения новых технологий и инструментов. В результате увеличились торговые объемы и повысилась эффективность.
Прохождение PCI DSS
Заполнили опросник (инфраструктурная часть); разделили среды по Subaccount в AWS organization; составили и реализовали ролевую модель/матрицу для проекта (IAM), внедрили MFA и гранулированные права доступа для групп пользователей, ролевую модель в БД; внедрили Password Policy, AWS WAF, управление секретами (переменные окружения, учетные данные для доступа), провели ротацию ключей и внедрили AWS KMS; настроили SG. Актуализировали и провели рефакторинг VPN каналов с контр-агентами, организовали интеграцию с процессинговыми сервисами через зашифрованные туннели. В результате внесенных в инфраструктуру изменений была порвышена безопасность системы и успешно пройден аудит PCI DSS.
Быстрое развертывание инфраструктуры
Значительно сократили время развертывания инфраструктуры за счет внедрения подхода IaC: ожидание новых инстансов сокращено с 12-24 часов до 15 минут. А так же сняли блокеры для тестирования гипотез со стороны инфраструктуры, что дало возможность горизонтального и вертикального масштабирования системы за пару десятков минут.
Уменьшение Time To Market
Оптимизировали сборку и деплой торгового бота с 4 до 1.5 минут, что позволило более точно реагировать на изменения в рынке и ускорило отладку и разработку.
Нагрузочное тестирование
Проанализировали работу системы под нагрузкой, установили соответствие/несоответствие требованиям и дали рекомендации по оптимизации производительности системы. Собрали показатели производительности и времени отклика системы и дали рекомендации по защите от ddos-атак. В результате внедрения рекомендаций обеспечена стабильная работа системы в период пиковой нагрузки.