Қол жетімділігі жоғары кластер - High-availability cluster

Қол жетімділігі жоғары кластерлер (сонымен бірге HA кластері , істен шыққан кластерлер немесе Metroclusters белсенді / белсенді) топтары болып табылады компьютерлер бұл қолдау сервер қосымшалар көмегімен сенімді пайдалануға болады бос уақыттың минималды мөлшері. Олар пайдалану арқылы жұмыс істейді қол жетімділігі жоғары бағдарламалық жасақтама байламға артық топтардағы компьютерлер немесе кластерлер жүйелік компоненттер істен шыққан кезде үздіксіз қызмет көрсететін. Кластеризация болмаса, белгілі бір қосымшаны іске қосатын сервер істен шықса, бүлінген сервер жойылғанша бағдарлама қол жетімді болмайды. HA кластері бұл жағдайды аппараттық / бағдарламалық жасақтама ақауларын анықтап, қолданбаны әкімшілік араласуды қажет етпестен басқа жүйеде дереу қайта қосу арқылы шешеді, бұл процесс белгілі құлату. Осы процестің шеңберінде кластерлік бағдарламалық жасақтама түйінді ондағы қосымшаны бастамас бұрын баптай алады. Мысалы, тиісті файлдық жүйелерді импорттау және монтаждау, желілік жабдықты конфигурациялау және кейбір қосымшаларды іске қосу қажет болуы мүмкін.[1]

HA кластері жиі сыни сипатта қолданылады мәліметтер базасы, желідегі файлдарды бөлісу, іскери қосымшалар және клиенттерге қызмет көрсету сияқты электрондық сауда веб-сайттар.

HA кластерін іске асыру бірнеше ақаулық нүктелерін, соның ішінде бірнеше желілік қосылыстарды және деректерді сақтауды қажет етпейтін жою үшін кластерге қайта құруға тырысады. сақтау аймағы желілері.

HA кластерлерінде әдетте a қолданылады жүрек соғысы кластердегі әрбір түйіннің денсаулығы мен күйін бақылау үшін қолданылатын жеке желілік байланыс. Барлық кластерлік бағдарламалық жасақтама жұмыс істей алуы керек бір нәзік, бірақ ауыр жағдай бөлінген ми, бұл барлық жеке сілтемелер бір уақытта төмендеген кезде пайда болады, бірақ кластер түйіндері әлі де жұмыс істейді. Егер бұл орын алса, кластердегі әрбір түйін кез келген басқа түйін төмендеді деп қателесіп, басқа түйіндер әлі жұмыс істеп тұрған қызметтерді бастауға тырысуы мүмкін. Қызметтердің қайталанған даналарының болуы ортақ сақтауда деректердің бұзылуына әкелуі мүмкін.

HA кластері жиі қолданылады кворум осы сценарийді болдырмау үшін куәгерлерді сақтау (жергілікті немесе бұлтты). Куәгер құрылғысы бөлінген кластердің екі жартысы арасында бөлісе алмайды, сондықтан барлық кластер мүшелері бір-бірімен байланыса алмайтын жағдайда (мысалы, жүректің сәтсіз соғуы), егер мүше куәгерге кіре алмаса, ол белсенді бола алмайды.

Қолданбаны жобалауға қойылатын талаптар

Әрбір қосымшаның қол жетімділігі жоғары кластерлік ортада жұмыс істеуі мүмкін емес, сондықтан қажетті жобалық шешімдерді бағдарламалық жасақтама жасау кезеңінің басында қабылдау қажет. Қол жетімділігі жоғары кластерлік ортада жұмыс істеу үшін қосымша кем дегенде келесі техникалық талаптарды қанағаттандыруы керек, оның соңғы екеуі кластердегі сенімді функциясы үшін өте маңызды және оларды толығымен қанағаттандыру қиын:

  • Қосымшаның күйін бастау, тоқтату, мәжбүрлеп тоқтату және тексерудің салыстырмалы түрде қарапайым әдісі болуы керек. Практикалық тұрғыдан бұл қолданбада бағдарламаны басқаруға арналған командалық жол интерфейсі немесе сценарийлер болуы керек, соның ішінде қосымшаның бірнеше даналарына қолдау көрсетіледі.
  • Қолданба жалпы жадты қолдана алуы керек (ҰҒА /Сан ).
  • Ең бастысы, қосымшаның күйі мүмкіндігінше тұрақсыз ортақ сақтауда болуы керек. Ортақ жадтан сақталған күйді пайдалану сәтсіздікке ұшырағанға дейін басқа түйінді соңғы күйде қайта қосу мүмкіндігі де маңызды.
  • Егер ол бұзылса немесе сақталған күйден басталса, қосымша деректерді бүлдірмеуі керек.
  • Бұл шектеулердің бірнешеуін виртуалды серверлік орталарды қолдану арқылы азайтуға болады, мұнда гипервизордың өзі кластерден хабардар және виртуалды машиналардың (соның ішінде жұмыс істейтін жады күйінің) физикалық хосттар арасында үзіліссіз көшуін қамтамасыз етеді. Microsoft Server 2012 және 2016 Failover кластерлері.
    • Бұл тәсіл мен кластерлік бағдарламаларды іске қосудың негізгі айырмашылығы - бұл сервердің қосымшаларының бұзылуымен жұмыс істей алады және клиентке қызметке (мысалы, мәліметтер базасына) қол жеткізуді сақтай отырып, бағдарламалық жасақтаманың жаңартылуын қолдайды, мысалы екіншісі қызмет көрсетеді, ал екіншісі жаңартылуда немесе жөнделуде. Бұл кластер даналарын байланыстыруды, кэштерді жууды және қолда бар кезде файлға қол жетімділікті үйлестіруді қажет етеді.

Түйін конфигурациясы

2 түйін Жоғары қол жетімділік кластерінің желілік сызбасы

HA кластері үшін ең көп таралған өлшем - бұл екі түйінді кластер, өйткені бұл минималды қажет етеді, бірақ көптеген кластерлер көптеген, кейде ондаған түйіндерден тұрады.

Тіркелген диаграмма классикалық HA кластеріне жақсы шолу болып табылады, мұнда кворум / куәгерлердің функционалдығы туралы ештеңе айтылмайды (жоғарыдан қараңыз).

Мұндай конфигурацияларды кейде келесі модельдердің біріне жатқызуға болады:

  • Белсенді / белсенді - сәтсіз түйінге арналған трафик бар түйінге беріледі немесе қалған түйіндер бойынша тепе-тең жүктеледі. Бұл әдетте түйіндер біртектес бағдарламалық жасақтама конфигурациясын қолданған кезде ғана мүмкін болады.
  • Белсенді / пассивті - әр түйіннің толық резервтік данасын ұсынады, ол тек онымен байланысты бастапқы түйін істен шыққан кезде ғана желіге қосылады.[2] Бұл конфигурацияға ең көп қосымша жабдық қажет.
  • N + 1 - сәтсіздікке ұшыраған түйіннің рөлін қабылдау үшін желіге қосылатын жалғыз қосымша түйінді ұсынады. Әрбір бастапқы түйінде гетерогенді бағдарламалық жасақтама конфигурациясы жағдайында қосымша түйін жалпыға бірдей жауапты бастапқы түйіндердің кез-келген рөлін қабылдауға қабілетті болуы керек. Әдетте бұл бір уақытта бірнеше қызмет көрсететін кластерлерге қатысты; бірыңғай қызмет жағдайында бұл белсенді / пассивті болады.
  • N + M - бір кластер көптеген қызметтерді басқаратын жағдайларда, тек бір ғана арнайы жұмыс істемейтін түйіннің болуы жеткілікті резервтеуді ұсынбауы мүмкін. Мұндай жағдайларда күту режиміндегі бірнеше серверлер қосылады және қол жетімді. Күту серверлерінің саны - бұл шығындар мен сенімділік талаптары арасындағы айырбас.
  • N-to-1 - түпнұсқалық түйінді қалпына келтіруге немесе желіге қайтаруға дейін, күту режиміндегі түйіннің уақытша белсенді болуына мүмкіндік береді, осы кезде жоғары қол жетімділікті қалпына келтіру үшін қызметтер немесе даналар қайтарылмауы керек .
  • N-to-N - белсенді / белсенді және N + M кластерлерінің тіркесімі, N-тен N кластерлер қызметтерді, даналарды немесе істен шыққан түйінді байланыстарды қалған белсенді түйіндер арасында қайта бөледі, осылайша (белсенді / белсенді сияқты) қажеттілікті жояды «күту» түйіні үшін, бірақ барлық белсенді түйіндерде қосымша сыйымдылықты қажет етеді.

Шарттары логикалық хост немесе логикалық хост сипаттау үшін қолданылады желі мекен-жайы кластер ұсынатын қызметтерге қол жеткізу үшін қолданылады. Бұл логикалық хост идентификаторы бір кластер түйініне байланысты емес. Бұл іс жүзінде кластер ұсынатын қызметтермен байланысты желілік адрес / хост атауы. Егер жұмыс істеп тұрған дерекқоры бар кластер түйіні төмендесе, мәліметтер базасы басқа кластер түйінінде қайта іске қосылады.

Түйіннің сенімділігі

HA кластерлері жеке жүйелер мен ортақ инфрақұрылымды мүмкіндігінше сенімді ету үшін барлық қол жетімді әдістерді пайдаланады. Оларға мыналар жатады:

  • Дискіні шағылыстыру (немесе тәуелсіз дискілердің артық массивтері - RAID), сондықтан ішкі дискілердің істен шығуы жүйенің бұзылуына әкелмейді. The Таратылған қайталанатын блоктық құрылғы бір мысалы.
  • Артық желі жалғыз кабель, коммутатор немесе желі интерфейсінің ақаулары желінің үзілуіне әкелмейтіндей етіп қосылады.
  • Артық сақтау аймағы (SAN) қосылымдар, сондықтан жалғыз кабель, коммутатор немесе интерфейс істен шықса, қоймаға қосылу мүмкіндігі жойылмайды (бұл бұзылуы мүмкін) архитектурамен бөлісті ).
  • Артық электр қуаты әр түрлі тізбектердегі кірістер, әдетте екеуі де қорғалған үздіксіз қуат көзі бірлік, және артық нәр беруші жалғыз қуат беру, кабель, UPS немесе қоректендірудің істен шығуы жүйеге қуаттың жоғалуына әкеліп соқтырмайтындай етіп орнатыңыз.

Бұл мүмкіндіктер жүйелер арасындағы кластерлік бұзылуды қажет ету мүмкіндігін азайтуға көмектеседі. Мұндай бұзылу кезінде көрсетілген қызмет кем дегенде біраз уақыт қол жетімді емес, сондықтан бұзылуды болдырмауға бағытталған шараларға басымдық беріледі.

Жөндеу стратегиялары

Таратылған есептеулердегі ақаулықтарды басқаратын жүйелерде ақауларды жоюдың әртүрлі стратегиялары бар. Мысалы, Apache Cassandra API Гектор ақауларды түзетудің үш әдісін анықтайды:

  • Fail Fast, «FAIL_FAST» ретінде сценарий, егер бірінші түйінге жету мүмкін болмаса, сәтсіздікті емдеу әрекеті сәтсіз болады дегенді білдіреді.
  • Сәтсіз болған кезде біреуін көріңіз - келесі қол жетімді, «ON_FAIL_TRY_ONE_NEXT_AVAILABLE» деп сценариймен берілген, бұл жүйе бас тарту алдында ең қол жетімді немесе қол жетімді бір хостты сынап көретіндігін білдіреді.
  • Сәтсіз болса, бәрін байқап көріңіз, «ON_FAIL_TRY_ALL_AVAILABLE» деп сценариймен берілген, жүйенің бас тартуға дейін барлық қол жетімді түйіндерді сынап көретінін білдіреді.

Іске асыру

Бірнеше ақысыз және коммерциялық шешімдер бар, мысалы:

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ ван Вугт, Сандер (2014), Pro Linux жоғары қол жетімділікті кластерлеу, б.3, Апрес, ISBN  978-1484200803
  2. ^ Боршлегл, Сюзанн (2012). Railway Computer 3.0: Инновациялық тақтай дизайны нарықты түбегейлі өзгерте алады (PDF). MEN Mikro Elektronik. Алынған 2015-09-21.
  3. ^ HP Сервис күзетшісі # sgistory-1-ге сілтеме жасайды

Әрі қарай оқу

  • Грег Пфистер: Кластерлерді іздеу, Prentice Hall, ISBN  0-13-899709-8
  • Эван Маркус, Хэл Стерн: Жоғары қол жетімділіктің жоспарлары: серпімді үлестірілген жүйелерді жобалау, Джон Вили және ұлдары, ISBN  0-471-35601-8
  • Чи-Вэй Ан, Чен-Хонг Там: Жүктеуге тәуелді машинаның қол жетімділігі бар HA кластеріндегі қызметтің қол жетімділігін талдау және оңтайландыру, IEEE параллельді және үлестірілген жүйелердегі транзакциялар, 18-том, 9-басылым (қыркүйек 2007 ж.), 1307-1319 беттер, ISSN  1045-9219 [2]