Обзор подготовлен
CNewsAnalytics

Системы хранения данных: концепция меняется

Система хранения данных — важная составляющая информационной системы предприятия.  Динамика сектора систем хранения данных обусловлена бурным развитием рынка информационных систем,  который предъявляет новые требования к организации хранения корпоративных данных. Глобальные изменения претерпевают сами концепции хранения, которые, в конечном итоге, и определяют выбор  программно-аппаратного комплекса.

По прогнозам аналитиков, архивы корпоративной информации удваиваются каждые два года. При существующей тенденции можно смело прогнозировать дальнейшее ускорение темпов роста, что ставит перед менеджментом компаний задачи управления массивами корпоративных данных, организации их долговременного хранения, своевременной актуализации и защиты. Ежедневное наращивание объемов корпоративной информации делает поставленные задачи весьма нетривиальными. 

В попытке их решения общество предлагает различные концепции. Одной из таких попыток стало создание теории управления жизненным циклом информации — Information Lifecycle Management (ILM), смысл которой заключается в постоянном контроле за возникновением, использованием, хранением и утилизацией данных. ILM стала основой построения комплексных иерархических систем хранения информации (Hierarchical Storage Management, HSM).

Владимир Колганов: При выборе систем хранения данных необходимо идти «от задачи»

Владимир Колганов

Особенности и перспективы развития российского рынка систем хранения данных комментирует CNews Владимир Колганов, руководитель направления систем хранения данных компании "КРОК".

CNews: Как изменялся, по вашим наблюдениям, рынок систем хранения данных за последние годы?

Владимир Колганов: Сегодня можно говорить уже не о рынке продуктов, а о рынке решений. Сравнивать продукты различных производителей можно только в контексте задач, которые стоят перед каждым отдельным заказчиком. В зависимости от бизнеса компании кардинально меняются требования к системам хранения данных и тем задачам, которые они решают, например, хранение и быстрый доступ к большим объемам неструктурированных данных или, наоборот, хранение реляционных баз данных. Российские CIO пришли к пониманию того, что не стоит искать универсальных решений — при выборе систем хранения данных необходимо идти "от задачи". Что касается масштаба проектов, то в 2005 году "КРОК" в большинстве случаев выполнял построение систем хранения данных в рамках комплексных, интеграционных проектов, где было необходимо учитывать множество дополнительных факторов.

CNews: Какие технологии построения систем хранения данных видятся вам на сегодня наиболее перспективными и актуальными?

Владимир Колганов: Одно из наиболее перспективных направлений — это технологии виртуализации систем хранения. Компаниям необходим высокий уровень гибкости ИТ-ресурсов, который позволит отвечать изменяющимся потребностям бизнеса при минимальных затратах и минимальных же изменениях в ИТ-инфраструктуре.

Технологии виртуализации направлены, в первую очередь, на более рациональное использование аппаратных ресурсов и гибкое управление. Потребность в технологиях виртуализации в системах хранения растет из-за постоянного повышения объемов накопленной информации и высокой стоимости устройств хранения данных. Итоговый результат, которого позволяют достичь технологии виртуализации — повышение эффективности использования систем хранения при одновременном упрощении доступа к данным со стороны приложений. Для решения подобных задач используются продукты таких производителей, как ЕМС, HDS и IBM, а также НР и SUN в качестве OEM-партнеров (Original Equipment Manufacturer) HDS.

Аналитическое агентство Gartner утверждает, что в течение следующего десятилетия виртуализация будет оставаться одной из самых важных и перспективных технологий на рынке ПК. На ежегодном Форуме "IT-ЛИДЕР", прошедшем в ноябре, технологии виртуализации активно обсуждались участниками мероприятия. Форум показал, что эта технология интересна российским CIO, и уже нашла применение на практике.

Базисом HSM является ранжирование и жесткая кластеризация массивов корпоративной информации с целью минимизации издержек хранения. Естественно, не вся информация одинаково значима для предприятия, соответственно, нет смысла нести высокие затраты на хранение неактуальной информации, размещая ее на дорогостоящих накопителях. Используя концепцию HSM, массивы корпоративных данных подлежат ранжированию по ряду факторов: важности, актуальности, частоте использования, рисков при потере и т.д. Данные с высоким приоритетом размещаются на более быстрых и производительных носителях, к примеру, RAID-массивах. Менее важная информация размещается на емких, но медленных носителях: DVD-дисках, магнитных лентах.  Использование концепции HSM позволяет не только снизить затраты на хранения информации, но и эффективно управлять динамикой корпоративных данных.

Однако, говорить о HSM как об основополагающей теории еще очень рано. Различные системы хранения корпоративной информации реализуют принципы HSM в той или иной степени. Сейчас рынок систем хранения состоит из нескольких взаимосвязанных сегментов: рынок программного обеспечения, аппаратных комплексов, рынок различных концепций хранения данных. Для качественного анализа необходимо рассмотреть устройство корпоративных систем хранения. В данном обзоре мы постараемся рассмотреть наиболее распространенные технологии хранения данных, организацию сетей хранения и аппаратное обеспечение, представленное на мировом рынке. Проанализируем также основные тенденции рынка систем хранения в контексте HSM.

Хранение данных

Организация системы хранения корпоративных данных начинается с выбора концепции хранения, которая определяет выбор программно-аппаратного комплекса. Инфраструктура системы хранения данных включает различные аппаратные средства хранения данных, которые могут объединяться в сети хранения данных,  организацию доступа серверов к массивам данных, а также программное обеспечение управления хранением данных.

На мировом рынке наибольшее распространение получили три основных концепции хранения, каждая из которых имеет особенности организации, преимущества и недостатки, что, в конечном итоге, определяет оптимальные области их использования.

SAN (Storage Area Network)

Концепция SAN ориентирована на гетерогенные информационные системы со сложной инфраструктурой. Особенностью решений SAN является организация выделенной сети, которая обеспечивает взаимодействие различных аппаратных устройств хранения данных, систем и подсистем хранения, серверов. Устройства централизованно управляются с центральной консоли администратора сети, что позволяет значительно снизить издержки на администрирование и контроль, а также более эффективно проводить обновление программного комплекса и отслеживать состояние лицензий.  Концепция SAN базируется на протоколе Fibre Channel, оптимизированном для быстрой передачи больших объемов данных. Между сервером и хранилищем применяется блочный механизм обмена, что уменьшает накладные расходы при обмене информацией и увеличивает производительность системы.

Важным моментом концепции SAN является консолидация хранимых данных, благодаря чему каждый сервер, подключенный к системе, получает доступ к массивам данных независимо от их физического местоположения, что делает системы SAN оптимальными для использования в крупных международных организациях с развитой филиальной структурой. Кроме того, консолидация данных позволяет перераспределять ресурсы аппаратного комплекса между серверами. Благодаря глобальной файловой системе SAN предусматривает также возможность одновременного доступа  нескольких серверов к одному файлу, при этом права доступа серверов разграничиваются с помощью программного деления сети на зоны.

Осуществление передачи данных в сетях SAN проводится по параллельным каналам, что позволяет разгрузить основную локальную сеть предприятия от множества задач, включая репликацию, резервное копирование, восстановление данных. Кроме того, использование сетей SAN позволяет освободить также  серверные ресурсы локальной сети, так как работа с данными осуществляется посредством выделенных серверов или серверных устройств сети хранения.
Большим достоинством сетей SAN является простота масштабирования, управляемость и высокая производительность. Существенным недостатком, ограничивающим распространение концепции SAN в среде малого и среднего бизнеса, является высокая цена и необходимость расходов на покупку дополнительного оборудования, специализированного программного обеспечения, а также обучение персонала. Средний размер бюджета проекта по установки сети SAN составляет несколько сотен тысяч долларов.

NAS (Network Attached Storage)

Концепция NAS является основным конкурентом SAN и представляет собой сетевую архитектуру, оптимизированную для обеспечения сетевого файлового сервиса. Как и SAN, решения NAS также предназначены для работы в гетерогенных средах и не зависят от платформ, используемых в архитектуре информационной системы.

Особенностью  NAS как концепции хранения данных является то, что хранилища данных не выделяются в специальную сеть хранения, а с помощью сетевого интерфейса интегрируются непосредственно в локальную сеть предприятия. Хранилища данных NAS полностью интеллектуализированы посредством встроенного процессора, операционной системы и управляющего программного обеспечения, что позволяет локализовать управление хранением данных и упрощает его администрирование.

Взаимодействие хранилищ NAS с локальной сетью реализовано через протоколы CIFS, NFS, HTTP, FTP, однако доступ осуществляется только на уровне файлов. Решения NAS нетребовательны к типам операционных систем и оборудования, единственным требованием концепции является использование транспортных протоколов TCP/IP. Использование трафика локальной сети для передачи больших массивов данных существенно затрудняет работу последней.

Кроме того, серьезным недостатком NAS являются трудности масштабирования. Суть проблемы состоит в том, что наращивание числа NAS-серверов в корпоративной информационной системе не приводит к пропорциональному расширению дискового пространства. Кроме того, рост числа серверов влечет за собой трудности с их администрированием, так как  каждый сервер имеет свой список пользователей, и использование ресурсов различных NAS-серверов требует знания множества паролей. Причем, сокращение числа паролей приводит к снижению уровня безопасности системы. 

SAS (Server Attached Storage) или DAS (Direct Attached Storage)

Концепция хранения данных SAS не может рассматриваться в качестве альтернативы NAS или SAN, так как является простым классическим способом хранения небольших массивов данных. В решениях SAS устройства хранения подключаются непосредственно к рабочему серверу через высокоскоростной канальный интерфейс, обычно посредством использования SCSI-интерфейса. SAS допускает также совместное использование хранилищ данных несколькими серверами, что оправданно в малых локальных сетях предприятий, однако затрудняет работу масштабных информационных систем. Кроме того, в решениях SAS существуют ограничения на объемы данных одного устройства хранения. Однако преодолеть данный недостаток SAS позволяет использование роботизированных  DVD/CD библиотек, подключенных через сервер, особенно с помощью программного обеспечения, где предусмотрена миграция наиболее часто запрашиваемых файлов из библиотеки в сервер.
SAS-решения оптимизированы для использования в небольших локальных сетях, когда существует необходимость высокоскоростной обработки небольших объемов данных. В числе достоинств технологии можно назвать также низкую стоимость решений, что оправдывает ее применение в небольших локальных сетях предприятий малого и среднего бизнеса. 

Возможности построения аппаратной составляющей системы хранения данных весьма обширны. На мировом рынке сегодня представлены самые разные типы накопителей данных: дисковые и RAID-массивы, JBOD, стримеры и ленточные библиотеки, оптические носители, роботизированные DVD-библиотеки. Кроме того, многообразны также возможности скоростных сетевых соединений между системами хранения данных и локальной сетью предприятия. Если система хранения данных основана на включении хранилищ в локальную сеть предприятия, то в этом случае используются различные протоколы соединений поверх Ethernet: CIFS, NFS, HTTP, FTP, которые весьма стандартны, а для транспортировки массивов данных — транспортные протоколы TCP/IP.


Вернуться на главную страницу обзора

Версия для печати

Техноблог | Форумы | ТВ | Архив
Toolbar | КПК-версия | Подписка на новости  | RSS