SAP HANA — что это за база данных и почему она быстрее обычных

 

Мало кто задумывается, почему SAP-системы нового поколения работают в реальном времени. Ответ в SAP HANA — базе данных, которая лежит в их основе.

SAP HANA работает с данными в оперативной памяти и использует колоночный формат хранения вместо строчного. Запросы, которые на обычных системах выполнялись часами, теперь дают результат за секунды.

На базе SAP HANA работают большинство современных решений вендора, например, SAP S/4HANA, SAP BW/4HANA и SAP Analytics Cloud.

В статье разберем, как устроена эта база данных (БД), почему она быстрее обычных БД и для каких компаний подходит.

Что такое SAP HANA простыми словами

Название HANA расшифровывается как High-Performance ANalytic Appliance — высокопроизводительная аналитическая платформа. Изначально это был программно-аппаратный комплекс, но сегодня SAP HANA доступна как локальное (on-premise) решение, так и в облаке.

Система объединяет в одном месте то, что раньше требовало отдельных инструментов:

  • база данных in-memory с поддержкой транзакций и аналитики,
  • механизмы машинного обучения,
  • инструменты интеграции и виртуализации данных,
  • среда разработки приложений.

Для бизнеса это означает одну платформу вместо набора разрозненных систем для транзакций, отчетности и аналитики. Для ИТ-архитектора — возможность существенно упростить ИТ-ландшафт и сократить количество точек интеграции между системами.

Что такое база данных in-memory и чем она отличается от обычной

В классических СУБД данные хранятся на диске. Когда система получает запрос, она сначала находит нужные данные, загружает их в память и только потом обрабатывает. При больших объемах это занимает достаточно много времени.

SAP HANA же хранит данные прямо в оперативной памяти и обрабатывает их там же. Это значит, что не нужно каждый раз обращаться к диску, поэтому запросы, которые раньше выполнялись часами, теперь занимают секунды.

Такой подход востребован в отраслях, где данных много и они постоянно меняются: финансы, телеком, розничная торговля, промышленные предприятия с IoT-инфраструктурой.

Почему SAP HANA быстрее обычных баз данных

Скорость SAP HANA объясняется не одним, а сразу несколькими архитектурными решениями, которые работают вместе. Разберем каждое из них.

Хранение данных в памяти и колоночный формат

Классические базы данных хранят данные строками. Это значит, что вся информация о записи, например о клиенте, находится рядом. Для транзакций это удобно, но когда нужно посчитать выручку по всем клиентам за квартал, система вынуждена пройтись по каждой строке и извлечь нужное поле. При больших объемах это дорого по времени и ресурсам.

Вместо хранения полной строки целиком SAP HANA хранит отдельно каждый столбец таблицы. Если системе нужно посчитать продажи, она читает только колонку с суммами, а не всю запись полностью. Это резко уменьшает объем операций чтения и ускоряет аналитические расчеты.

Дополнительный эффект — сжатие. Похожие значения в столбце сжимаются эффективнее разнородных строк, поэтому SAP HANA автоматически снижает и объем хранения, и нагрузку при обработке.

SAP-консультант IBA Group

Массово-параллельная обработка (MPP) и масштабирование

Современные серверы имеют десятки и сотни процессорных ядер, но классические СУБД не всегда умеют эффективно их использовать для одного запроса. SAP HANA проектировалась с расчетом на параллельное выполнение, когда большой запрос автоматически разбивается на части и одновременно обрабатывается на разных ядрах или узлах кластера.

Такой подход называется MPP — Massively Parallel Processing. При росте нагрузки достаточно добавить узлы, и производительность вырастет пропорционально. Для компаний с терабайтами данных и тысячами одновременных пользователей это имеет прямое значение для скорости работы системы.

Единая платформа для транзакций и аналитики (OLTP + OLAP)

Традиционно транзакционные системы (OLTP) и аналитические хранилища (OLAP) существуют раздельно. Данные регулярно выгружаются из операционной базы в хранилище, и между ними всегда есть задержка. Аналитик видит не «сейчас», а «несколько часов назад».

SAP HANA обрабатывает и оперативные транзакции, и аналитические запросы в одной системе. Данные не нужно переносить между системами, поэтому отчет строится на актуальных данных прямо в момент запроса. Аналитики Forrester назвали такой подход транслитическим: это не компромисс между OLTP и OLAP, а их полноценное объединение.

Меньше агрегатов и дубликатов данных

В классических аналитических системах отчеты ускоряют за счет заранее рассчитанных агрегатов и материализованных витрин — отдельных таблиц с готовыми результатами запросов, которые система пересчитывает по расписанию. Это усложняет архитектуру, так как десятки таких таблиц нужно постоянно поддерживать в актуальном состоянии.

SAP HANA считает агрегаты в момент запроса из исходных данных. Это упрощает модель, снижает риск расхождений и позволяет быстро менять аналитические модели при изменении бизнес-требований.

Технически это работает через Calculation Views и delta-механизм: новые данные сначала попадают в delta-хранилище (буферную область для быстрых вставок), а затем периодически объединяются с основным колоночным хранилищем в процессе delta-merge (слияния данных). Для пользователя этот процесс незаметен.

Архитектура SAP HANA: что внутри платформы

SAP HANA — это многоуровневая платформа. Понимание ее архитектуры помогает правильно оценить, какие задачи она закрывает.

Сервис базы данных

Ядро системы представляет собой реляционную СУБД in-memory с поддержкой транзакций по стандарту ACID и мультиарендностью. Это значит, что один экземпляр HANA обслуживает несколько изолированных баз одновременно. Хранение данных организовано по уровням:
– горячие данные находятся в памяти,
– теплые хранятся на SSD,
– холодные переносятся в объектное хранилище.
Такая структура позволяет управлять стоимостью хранения в зависимости от того, как часто к данным обращаются.

Управление и интеграция данных

SAP HANA включает инструменты загрузки, очистки и трансформации данных из внешних источников. Отдельно стоит упомянуть и возможность  виртуализации данных, когда система обращается к внешним источникам, например, к другим базам или облачным хранилищам, без физического копирования. Это упрощает создание единого информационного пространства и помогает избежать дублирования данных.

Платформа разработки приложений

SAP HANA поддерживает выполнение бизнес-логики непосредственно на уровне базы данных с помощью SQLScript, а также встроенной поддержки Python, R и других языков. Это означает, что вычисления происходят там, где находятся данные, а не на уровне приложения. Такой подход помогает сократить объем передаваемых данных и увеличить общую производительность системы.

Расширенная аналитика и машинное обучение

В состав платформы входят встроенные библиотеки для машинного обучения, анализа временных рядов, обработки текстов, геоданных и графовой аналитики. Потоковая аналитика (Streaming Analytics) позволяет обрабатывать данные непрерывно, например, с промышленных датчиков или транзакционных потоков. Все это доступно без выгрузки данных во внешние инструменты.

История SAP HANA: зачем SAP создала собственную СУБД

Идея SAP HANA принадлежит Хассо Платтнеру, одному из основателей SAP. В середине 2000-х он поставил простой вопрос: почему бизнес должен ждать ночных выгрузок, чтобы получить отчет, если данные уже есть прямо сейчас?

Ответом стала новая база данных, ориентированная на скорость и объединение транзакций с аналитикой в единой системе. В 2010 году SAP анонсировала SAP HANA 1.0, затем вышла SAP HANA 2.0 с расширенными возможностями аналитики и масштабирования. Позже появились HANA Enterprise Cloud и SAP HANA Cloud как сервис данных нового поколения с облачной моделью потребления.

Сегодня SAP HANA позиционируется как ядро интеллектуального предприятия по концепции SAP и основной слой данных для всех ключевых продуктов вендора: SAP S/4HANA, SAP BW/4HANA, SAP Analytics Cloud и SAP Data Warehouse Cloud. Понимание возможностей этой database помогает оценить, что действительно изменится при переходе на новые SAP-решения.

эксперт IBA Group

Для чего используется SAP HANA: ключевые сценарии и решения

SAP HANA применяется в разных контекстах: от операционных ERP-систем до сложной аналитики и IoT. Рассмотрим основные направления.

ERP нового поколения

SAP S/4HANA работает исключительно на SAP HANA, и именно скорость базы данных меняет возможности системы. Например, финансовое закрытие, которое раньше занимало дни, здесь выполняется за часы. Планирование материальных потребностей (MRP) работает в реальном времени, а не по расписанию.

Хранилища и витрины данных

SAP BW/4HANA — система хранения и управления корпоративными данными, оптимизированная для работы на SAP HANA. По сравнению с классическим SAP BW она требует значительно меньше предвычисленных агрегатов и поддерживает аналитику в реальном времени. Для компаний с разнородными источниками данных это возможность построить единое хранилище без задержек при актуализации.

Аналитика и прогнозирование

SAP Analytics Cloud предоставляет инструменты бизнес-аналитики, планирования и предиктивной аналитики в едином облачном сервисе. Благодаря in-memory обработке система быстро работает даже с большими массивами данных.

Потоковые данные и высоконагруженные приложения

На базе SAP HANA также работают потоковая обработка данных с промышленных датчиков и IoT-устройств, а также высоконагруженные транзакционные приложения: банкинг, биржевая торговля, антифрод-системы.

Помимо стандартных продуктов SAP, платформа служит основой для кастомных приложений клиентов, когда бизнес-логику выгоднее выполнять ближе к данным.

Другие решения на базе SAP HANA

На базе SAP HANA работают SAP S/4HANA, SAP BW/4HANA, SAP Analytics Cloud, SAP Data Warehouse Cloud и SAP Data Intelligence. Фактически SAP HANA является основным слоем данных для всего современного портфеля решений вендора.

Варианты развертывания и внедрения SAP HANA

SAP HANA доступна в нескольких моделях развертывания, и выбор зависит от требований к контролю, масштабу и бюджету.

Локально, или On-premise. Это классический вариант, когда SAP HANA работает на серверах компании или в собственном дата-центре. Такой вариант дает максимальный контроль над данными и инфраструктурой, но требует серьезных инвестиций в оборудование и команду администрирования.

SAP HANA Cloud. Платформа выступает в качестве сервиса (PaaS), где инфраструктура находится под управлением SAP, обновления происходят автоматически, а оплата идет по подписке. Это снижает порог входа и ускоряет старт как для новых проектов, так и для гибридных сценариев.

Гибридные сценарии. В гибридной модели часть нагрузки остается on-premise, часть переносится в облако. Например, транзакционная система работает локально, а аналитика и ML в SAP HANA Cloud.

Переход с традиционной базы данных на SAP HANA включает несколько этапов: определение объектов миграции, разработку стратегии, оценку требований к инфраструктуре, очистку данных, использование инструментов SAP Database Migration Option (DMO) и пилотный проект перед промышленным запуском.

Кому и когда имеет смысл рассматривать внедрение SAP HANA

Не каждой компании нужно переходить на SAP HANA. Наибольший результат получают те, кто работает с терабайтами операционных и аналитических данных и нуждается в онлайн-аналитике: банки и финансовые организации, крупный ритейл и телеком, промышленные предприятия с IoT-инфраструктурой, нефтегазовые и горно-металлургические компании с комплексными ERP-системами.

Стоит задуматься о переходе, если в компании наблюдается хотя бы одно из следующего:

  • отчеты формируются часами или требуют ночных выгрузок;
  • аналитический ландшафт разрастается: появляются новые витрины данных и предвычисленные агрегаты вместо единого источника правды;
  • есть планы по переходу на SAP S/4HANA или развитию аналитики на базе SAP;
  • растут требования к предиктивной аналитике и ML-сценариям в операционных процессах.

Для компаний, которые уже используют SAP ECC, переход на SAP HANA — это скорее вопрос времени, а не целесообразности. Поддержка SAP ECC завершается через несколько лет, и миграция на SAP S/4HANA, работающую на SAP HANA, становится стратегически неизбежной.

Эксперт IBA Group

Чем SAP HANA отличается от обычных баз данных

SAP HANA отличается от традиционных дисковых СУБД сразу по нескольким параметрам: хранение данных в оперативной памяти, колоночный формат, массово-параллельная обработка и транслитическая архитектура, которая объединяет OLTP и OLAP в одной системе. В совокупности эти решения дают качественный скачок производительности, недостижимый для классических систем.

ПараметрТрадиционная СУБДSAP HANA
ХранениеДиск / SSDОперативная память (In-Memory)
Формат храненияСтрочныйКолоночный
Аналитическая обработкаТребуется отдельное хранилище данныхВыполняется в реальном времени
OLTP / OLAPРазделены на разные системыОбъединены в одной системе

При этом SAP HANA — не просто быстрая база данных, а платформа, на которой строятся современные SAP-решения, создаются аналитические приложения и реализуются сценарии машинного обучения. Выбор и внедрение SAP HANA — стратегическое решение, которое стоит согласовывать с общей архитектурой ИТ-ландшафта и планами цифровой трансформации.

Если вы оцениваете переход на SAP HANA или планируете миграцию, специалисты IBA Group готовы помочь. Более 13 лет работы на рынке Казахстана и СНГ и десятки реализованных проектов на базе SAP — от внедрений SAP S/4HANA до аналитических платформ для крупных предприятий.

О чем расскажем в статье:

Содержание