Беттингте тұрақтылық - бәрі. Қосылымды жоғалту, API-дің құлдырауы немесе live-ставканы есептеуде кешіктіру қаржылық шығындарға, ойыншылардың сенімін жоғалтуға және беделін жоғалтуға әкелуі мүмкін. Сондықтан сенімді платформалар жекелеген компоненттер істен шыққан кезде де жұмыс істейтін көп деңгейлі істен шығуға төзімділік жүйесін енгізеді.
Істен шығуға төзімділік дегеніміз не?
Істен шығуға төзімділік - бұл жүйенің ішінара іркілістер кезінде жұмысты жалғастыру қабілеті:- Серверлер істен шыққан кезде үзіліссіз, ДҚ, API
- Сақтық тораптарға автоматты түрде ауысу
- Бүкіл платформаның құлауынсыз мәселені оқшаулау
- Қолмен араласпай тез қалпына келтіру
Технологиялар мен тәсілдер
| Әдіс | Мақсаты және әсері |
|---|---|
| Load Balancer | Трафикті бірнеше тораптар арасында бөлу |
| Дерекқорды репликалау | Негізгі қойма істен шыққан кезде ысыраптардан қорғау |
| Микросервистік сәулет | Проблемалық компоненттерді оқшаулау |
| Health-check & Auto-restart | Сервистер мониторингі және автоматты түрде қалпына келтіру |
| Гео-резервтеу (GEO-DR) | Әлемнің түрлі өңірлерінен жұмысты қолдау |
| Active-Active және Active-Passive кластерлері | Орталықтардың бірінің бас тартуы кезінде тұрып қалу |
Істен шығу тұрақтылығына арналған инфрақұрылым
Kubernetes (K8s) - өзін-өзі қалпына келтіретін кластерлер
Redis Sentinel/Cluster - істен шығуға төзімді кештер- PostgreSQL репликасымен - негізгі және ыстық резервтік БД
- Бірнеше брокерлермен Kafka - оқиғаларды сенімді жеткізу
- Cloudflare/CDN - периметрдегі қорғау (DDoS, DNS, геобаланс)
Жағдайлар мысалдары
| Скрипт | Жүйе қалай жұмыс істейді |
|---|---|
| API серверлерінің бірі құлдырауда | Трафик LB арқылы бірден екіншісіне кетеді |
| Аймақтағы интернет жоғалды | GEO-DNS ойыншыларды жақын орналасқан дата орталығына көшіреді |
| Есептеу модулінде қате пайда болды | Қалған платформа жұмысын жалғастыруда |
| ДБ зақымдалуы | Деректерді жоғалтпай репликадан қалпына келтіру |
Платформаның нәтижесі
Сервистің жоғары сенімділігі- Максималды аптайм: 99. 99% және одан жоғары
- Кірісті техникалық іркілістерден қорғау
- Серіктестер мен ойыншылардың сенімділігі
- Қолдауға жүгінулер санын азайту
Істен шығуға төзімділік - бұл жай ғана «құламау» туралы емес, «әрдайым жұмыс істеу» туралы. Жоғары жүктемелі live-беттинг ортасында кез келген істен шығуға дайын болу маңызды: жүктемеден торап істен шыққанға дейін. Жүйе неғұрлым сенімді құрылса, бизнес пен ойыншылар соғұрлым тыныш болады.
Байланысу
Төмендегі форманы толтырыңыз, біз сізге жақын арада жауап береміз.