Наша совместная команда Banwar.org

Связаться с нами

  • (097) ?601-88-87
    (067) ?493-44-27
    (096) ?830-00-01

Статьи

База знань: Metrocluster для АКБ Алефбанк. Інтерв'ю з Валерієм Бородіним

Ми продовжуємо нашу серію інтерв'ю з провідними IT фахівцями, і сьогодні ми розмовляємо з Валерієм Бородіним, заступником начальника інформаційно-технічного управління ЗАТ АКБ Алефбанк. Валерій відповідає за IT інфраструктуру банку та розповість нам про вибір та встановлення найбільш оптимальної системи зберігання ..

Ми продовжуємо нашу серію інтерв'ю з провідними IT фахівцями, і сьогодні ми розмовляємо з Валерієм Бородіним, заступником начальника інформаційно-технічного управління ЗАТ АКБ Алефбанк. Валерій відповідає за IT інфраструктуру банку та розповість нам про вибір та встановлення найбільш оптимальної системи зберігання даних для задач, які стоять перед IT службою банку.

Валерій, розкажіть, яке завдання стояла перед банком?

Перед нами стояло завдання по плановому оновленню NAS сховища. Основним завданням було досягнення одночасно надійності і продуктивності. Переслідувалася мета, щоб сховище працювало при відмові обладнання - будь то вихід з ладу контролера, дискової полки, аварійне відключення електроживлення в повному обсязі. При цьому щоб користувачі могли отримувати повноцінний доступ до даних при будь-якому із зазначених варіантів. Тому ми і почали розглядати різноманітні варіанти отказоустойчивого сховища.

Які варіанти обладнання ви розглядали?

Розглядалися різні варіанти. Це були EMC, IBM Storwize 8000, NetApp і ще кілька більш-менш відомих залозок.

Зазначу, що самі звичайні тривіальні варіанти, такі як застосування Windows-сервера, не розглядалися. У разі кластерної середовища при використанні Windows-сервера виникає багато додаткових обмежень. З цієї причини Windows не розглядалося. Та й взагалі хотілося б бачити рішення, що складається не з комбінації сервер + система зберігання, а самостійне рішення.

В кінцевому підсумку по ряду факторів вибір припав на NetApp, тому що він більшою мірою задовольняє нашим вимогам в частині надійності і продуктивності. NetApp володіє функціональної можливістю переходу на аварійні контролери без участі користувача.

Крім того, NetApp дозволяє робити снапшоти в автоматичному режимі, що дозволяє відновлювати дані на будь-який момент часу. Також NetApp має високу продуктивність і масштабованість.

Валерій, дані яких додатків Ви планували захистити?

Основне завдання - це CIFS сховище.

Чому для Вас важлива відмовостійкість сховища файлів? І яким чином вона була досягнута?

Дані всіх додатків, в тому числі чисто банківських, є файлами. Звітність перед ЦБ, написана в Кліко, банківська програма, інші службові дані - це все набір файлів, що зберігаються на загальному файловому сервері. Взагалі без загального файлового сервера складно уявити роботу сучасного підприємства. Тиражування файлів для кожного комп'ютера - це минуле століття. Використання загального файлового сервера - зручна альтернатива. А загальний файловий сервер повинен бути надійним.

Для вирішення поставленого завдання ми встановили дві системи зберігання даних в різних ЦОДах. Краще, якщо надійність досягається за рахунок дублювання, наявності другої аналогічної залізяки, здатної підхопити роботу і віддати користувачам необхідні дані. При розміщенні враховували відстань, на яке можна рознести системи зберігання без шкоди для копіювання в синхронному режимі.

Валерій, у вас вже були два майданчики на момент початку вирішення даного завдання?

Ні. Відкриття другого майданчика було моєю особистою ініціативою. Використання тільки одного майданчика - невиправданий ризик для банківської сфери. Тому що навіть від банального «залили водою» складно підстрахуватися, якщо в вашому єдиному дата-центрі пожежники гасять пожежу. Також ніколи не можна виключати небажані дії третіх осіб, коли з якої-небудь причини до вас приходять і фізично починають щось знищувати. Такого класу простої неприпустимі для бізнесу!

Ваші дата-центри відокремлені від робочих місць користувачів?

Ні. ЦОДи знаходяться в межах офісів, в двох сусідніх будинках. Імовірність краху двох будівель все ж менше J.

Варто відзначити, що NetApp Metrocluster підтримує відстань до 300 км. Так що це рішення підходити для глобальних компаній.

Який максимальний простий допустимо в роботі програм, які підтримуються?

У нас існує окремий SLA на виконувані завдання. Перш за все, це видача банківських карт і відправка звітності в ЦБ. За видачу карт допустима затримка становить приблизно 30 хвилин, по звітності в ЦБ - 2 години.

Але навіть ці тимчасові простої критичні для банківської справи. Наприклад, коли вам до відправки звітності залишається всього 20 хвилин, то 2 годині за SLA вам вже ніхто не дасть. Порушення допустимих термінів надання звітності може спричинити за собою штрафні санкції, виставлені банку. Про репутацію говорити не беруся, бо в нашій країні цей параметр складно оцінити. Але штрафи, які накладають наші держоргани по відношенню до установи, аж до позбавлення ліцензії, дуже істотні.

Валерій, скажіть, скільки користувачів зараз працює з додатками і файлами?

Трохи менше 200 користувачів. І дана кількість для обраної моделі сміховинне.

Яку конфігурацію обладнання ви вибрали в кінцевому підсумку?

Нами було вибрано рішення NetApp FAS 3220. Це мінімальний рівень обладнання, яке підтримує Metrocluster.

Виходячи з існуючих завдань і навантаження, створюваної користувачами, продуктивності даної моделі точно вистачить року на 4. Хочу зазначити, що ми відразу встановили 10-гігабітні адаптери, благо машина це дозволяє.

А яка система зберігання даних у Вас була раніше?

У самому-самому початку це був звичайний Windows-сервер. Потім ми перейшли на NetApp, так як була потрібна достовірна синхронізація даних для географічно рознесених майданчиків. На мій жаль, Майкрософт достовірних синхронізацій даних не дає.

А можете детальніше розповісти, які критерії для вас мали найбільшу вагу при виборі системи зберігання даних?

По-перше, це архітектура рішення, пропонована виробником. У IBM і EMC - це блочне сховище, поверх якого прикручений файловий сервер і на це блочне сховище дивиться.

В такому рішенні є свої плюси і мінуси. Говорити про ідентичність даних на двох майданчиках тут не можна. Так, дані будуть синхронізовані, але говорити, що дані будуть однакові не можна. Файловий сервер при прийомі ваших даних записує їх на блочну частину. Ця блокова частина буде повністю синхронна, але існує часовий розрив між моментом, коли сервер отримав дані, і коли ці дані дійсно прийняті до запису.

Такі системи досить надійні! Нічого поганого про них сказати не можу, але ось цей розрив є.

Ви говорили про те, що ви почали використовувати SnapShot-и. Чи розглядали Ви функціональність снапшотов, як один з критеріїв вибору систем зберігання?

Ні. Це додаткова зручна фіча, яка знімає навантаження з адміністратора. Нема звертається до системного адміністратора, а може самостійно відновити дані.

Ця функція корисна у випадках, коли відбуваються помилки користувачів. Наприклад, хтось каталог помилково видалив або перемістив його до себе і потім видалив. Різні варіанти помилок бувають. І ця проста річ їх покриває. Зручна безкоштовна функція NetApp.

А як налаштований графік снапшотов, як часто ви їх робите?

Графік снапшотов озвучити можливо. Робляться вони в робочий час, з 10:00 до 19:00. Відповідно, 4 знімка: в 10, в 12, в 16 і в 18. Крім того, знімок робиться опівночі. Денні снапшоти зберігаються за три останні дні. Нічні знімки зберігаються за два останні тижні. Недільні опівнічні знімки зберігаються за вісім тижнів. Тобто користувач може знайти дані восьмитижневої давності.

Чи використовуєте ви ще якесь програмне забезпечення NetApp?

При виборі системи зберігання я уважно вивчав політику ціноутворення. У NetApp єдина ліцензія, яку можна отримати безкоштовно, це ліцензія. Але тільки одна! Відповідно, так як у мене основна ліцензія CIFS, вибір припав на неї. А з недавнього часу, починаючи з восьмої версії Metroclusterа, ліцензія Metroclusterа безкоштовна.

Я використовував єдину ліцензію CIFS, до якої додаються безкоштовні снепшот, безкоштовна ліцензія Metrocluster, NFS і інші хороші функції.

Ще раз зазначу, що безкоштовно можна отримати одну ліцензію, кожна наступна ліцензія NetApp вже буде платною і досить дорогий. Але функціональність коштує цих грошей.

Чи є у Вас зарезервовані сервера на даних майданчиках? Можете докладніше розповісти про архітектуру вашого отказоустойчивого рішення?

Файлове сховище являє собою NetApp. Один контролер NetApp на одному майданчику. Другий контролер NetApp на другому майданчику. Набори полиць в ЦОДах ідентичні.

Якщо ми говоримо в цілому про банківську систему, то на кожному з майданчиків є свої сервера, є свої блокові сховища, які їх забезпечують. І між цими блочними сховищами є синхронна реплікація критично важливих даних.

А користувачі безпосередньо за файлами звертаються?

Піднімається DFS у Майкрософта, і на це дерево прив'язуються ресурси на файловому сховищі. DFS у Майкрософта - це домен контролерну середу, вона резервується другим домен-контролером, який нічого не варто. DFS досить отказоустойчів, і файлове сховище також відмовостійке.

Валерій, ви сказали, що у вас впроваджена двухконтроллерная конфігурація, по контролеру на кожному майданчику. NetApp 3220, 10 гігабітні порти, адаптери. А скільки полиць ви вибрали?

Класично кількість вінчестерів на одній стороні майданчика повинно відповідати їх кількості на іншій стороні майданчика. І можна було обійтися однією полицею на кожній стороні: одна полиця з одного боку, одна полиця з іншого боку. Половина дисків першої полки в першому ЦОДі була б продубльована половиною дисків на інший, і, відповідно, дзеркально в протилежну сторону. Але є в даному випадку одна уразливість - відмова полки.

Тому ми вибрали варіант, при якому в кожній голові встановлено по 2 дискові полки, по 16 дисків з одного і з іншого боку. Відповідно, перша і друга полки в першому ЦОДі дублюються першої і другої полками в другому ЦОДі.

Присутня якась параноїдальність, проте, збереження даних гарантована більшою мірою.

А які полки використовуються?

SAS 10000 RPM. Вкрай висока продуктивність не потрібно, а використовуваний варіант надає високу надійність.

Валерій, чи використовуєте ви дедублікация і компресію. Які результати дає ця функціональність?

Дедублікация слід використовувати завжди. Технологія, запропонована NetApp, дозволяє дедубліціровать дані в обсязі 4 кілобайтний блоку. Виглядає незначним числом. Але коли таких блоків набирається багато, виходить помітний приріст. Тобто 20% економії в найгіршому випадку ви однозначно отримаєте!

Який у Вас на поточний момент відсоток дедублікация?

По одному сховища дедублікация 11%, компресія 9%, разом збережено 18%. Інакше сховища дедублікация 32%, компресія 69%, збережено 73%. І по ще одному 24% дедублікация, 14% компресії, разом 32%! Що і відображено на малюнках нижче.
По одному сховища дедублікация 11%, компресія 9%, разом збережено 18%


А ось використовувати компресію слід не завжди. Є зручні таблиці від NetApp, які показують, коли її краще використовувати. Наприклад, якщо ви зберігаєте потокове відео, компресувати його абсолютно безглуздо.
Величини компресії для різних видів даних,% Файлові сервіси і інфраструктура

50%

Віртуальні сервера та десктопи

55%

Бази даних Oracle OLTP

65%

Oracle DW

70%

MS Exchange 2003/2007

35%

MS Exchange 2010

35%

інженерні дані

55%

Геосейсміческіе дані

40%

архівні дані

різна

Дані резервних копій

різна


Величини дедублікация для різних видів даних,%

Файлові сервіси і інфраструктура

35%


Віртуальні сервера та десктопи

70%


Бази даних Oracle OLTP

0%

Oracle DW

15%

SQL Server

20%

MS Exchange 2003/2007

3%


MS Exchange 2010

15%

інженерні дані

30%

Геосейсміческіе дані

3%

архівні дані

25%

Дані резервних копій

95%

Валерій, як відбувалася інсталяція рішення, як планувався і як реалізовувався цей процес? Цікаві моменти завжди з'являються, якщо не почитаєш документацію! Якщо почитаєш, все пройде гладко J Був один нюанс. Недолік в документації самого NetApp. NetApp припустився помилки в документації по налаштуванню Metrocluster при відмові плечей на різних VLAN в різних мережах. Але фахівець з налаштування NetApp допоміг нам усунути цей недолік.

Скільки за часом зайняла настройка? Десь 3 дня.

Після установки ви смігріровалі дані з поточної системи даних? Так звісно. Процедуру перенесення даних можна здійснити за допомогою скриптів. Хочу відзначити, що якби у нас раніше використовувався NetApp не молодше серії, а старшій, міграція пройшла б ще простіше. Можна було б просто поставити сучасну голову, NetApp побачив би дані.

Чи задоволені Ви зробленим вибором? Після установки FAS 3220 пройшов уже рік. Нарікань немає. Рішення повністю справляється з нашими завданнями.

Могли б Ви рекомендувати рішення або NetApp або Metrocluster вашим колегам, що працюють в інших банках? Рекомендувати я його можу! Більш того, якщо ви використовуєте VMware, то VMware і NetApp відмінно дружать. При використанні протоколу NFS при роботі віртуальних машин досягаються певні плюси.

Чи проводили Ви тестування сховища? Тестування - це чисто маркетинговий хід. Чому? Тестувати потрібно на справді бойовому навантаженні, яку досить складно емулювати. Це під силу тільки дуже великим організаціям. У відносно невеликих установах пікове навантаження створити не так просто. Якщо у вас тисяча чоловік персоналу, і все досить компактно організовано, то придумати навантаження і щось на ній протестувати, це просто себе обдурити! Тестування - річ потрібна! Але тільки на нього спиратися не варто.

На закінчення чи є у вас що додати з приводу критеріїв вибору системи зберігання даних? Критерій вибору один - це чітке розуміння того, чого ви дійсно хочете! І на перше потрібно ставити не обсяг збережених даних, а архітектуру і принцип роботи рішення. Ємність завжди можна зробити більше! А до аналізу затримок і швидкості обробки даних потрібно підходити більш обдумано. Потрібно подивитися, проаналізувати поточну навантаження. Які черги вона породжує, які черги попереду на запис, на читання? Як це все виглядає?

Назад до списку статей

Валерій, розкажіть, яке завдання стояла перед банком?
Які варіанти обладнання ви розглядали?
Валерій, дані яких додатків Ви планували захистити?
Чому для Вас важлива відмовостійкість сховища файлів?
І яким чином вона була досягнута?
Валерій, у вас вже були два майданчики на момент початку вирішення даного завдання?
Ваші дата-центри відокремлені від робочих місць користувачів?
Який максимальний простий допустимо в роботі програм, які підтримуються?
Валерій, скажіть, скільки користувачів зараз працює з додатками і файлами?
Яку конфігурацію обладнання ви вибрали в кінцевому підсумку?

Новости

Banwar.org
Наша совместная команда Banwar.org. Сайт казино "Пари Матч" теперь доступен для всех желающих, жаждущих волнения и азартных приключений.