banner

Блог

Oct 21, 2023

Анализ: SAP начинает создавать собственную фабрику данных

ОБНОВЛЕНО 11:00 ПО ВОСТОЧНОМУ ВРЕМЕНИ / 8 МАРТА 2023 ГОДА

АНАЛИЗ Тони Баера

Практически любой бизнес, большой или малый, использующий технологии, обычно имеет стратегического поставщика, который, по сути, является первым среди равных. Он становится платформой, которая определяет выбор сторонних приложений, инструментов или баз данных. В малом бизнесе таким стратегическим поставщиком платформы, скорее всего, будет Microsoft Corp. или Apple Inc., с выбором Android от Google LLC или iOS от Apple на мобильной стороне. На предприятиях среднего и крупного размера платформы, скорее всего, будут многополярными, что отражает тот факт, что лишь немногие из них, скорее всего, будут стандартизироваться на каком-либо одном основном поставщике.

Будучи выдающимся поставщиком корпоративных приложений, SAP SE часто выступает в роли стратегического поставщика. Есть много забавных фактов, подтверждающих это, один из самых распространенных из которых заключается в том, что 77% мировых доходов от транзакций приходится на систему SAP. Использование SAP во многом определяет выбор, который они делают в отношении баз данных, аналитики и вспомогательных приложений.

Но в тех же организациях, вероятно, будут группы, работающие вне среды SAP. Возможно, части организации используют e-Business Suite или Microsoft Dynamics корпорации Oracle, или это группы бизнес-аналитиков, работающих с аналитикой, или ученые, работающие с данными, строят модели на основе озер данных. Чаще всего представление данных может зависеть от того, работаете ли вы внутри огороженного сада корпоративного приложения или за его пределами.

Удерживайте эту мысль.

Что касается управления данными, то наиболее насущные проблемы, которые мы наблюдаем, связаны с тем, что предприятиям лучше справляться с огромными и растущими объемами данных. Данные не просто становятся более разнообразными, но и все более распределенными. Идеальный шторм облачных вычислений, возможностей подключения и возможностей 5G расширил возможности передачи данных. А с повсеместным подключением возникают опасения по поводу конфиденциальности и суверенитета данных, которые в буквальном смысле устанавливают границы того, какие данные кем, в какой форме и где могут использоваться. Для клиентов SAP мир данных вышел за пределы их приложений SAP.

Одним из побочных результатов этого стал интерес к ячейке данных, где владение и управление жизненным циклом четко разграничены между бизнес-подразделениями, экспертами в предметной области или областями, которые обладают наибольшими знаниями и заинтересованностью в данных. На другом конце спектра находится создание логической инфраструктуры для обеспечения обнаружения и доставки нужных данных, и благодаря этому мы наблюдаем растущий интерес к фабрике данных. На наш взгляд, они должны дополнять друг друга, а не отменять друг друга.

Задача состоит в том, чтобы определить, что такое фабрика данных. Как мы видели в отчетах некоторых аналитических фирм, фабрика данных — это то, что мы привыкли называть портфелем интеграции данных, который включает в себя каталог, инструменты преобразования и оркестровки данных, качество данных, происхождение данных и так далее. Это функциональное определение кажется нам слишком расплывчатым.

Для нас фабрика данных должна начинаться с общей объединительной платы метаданных. Как минимум, он сканирует источники данных и собирает метаданные. Более продвинутые фабрики данных используют машинное обучение для обогащения метаданных на основе выводов, обнаруженных на основе шаблонов активности исходной и целевой систем, например того, к каким наборам данных или объектам часто осуществляется совместный доступ. Структура должна скрывать под капотом сложности обнаружения, доступа, преобразования, управления и защиты данных.

Фабрика данных не обязательно выполняет эти задачи, но она обеспечивает логическую надстройку для организации цепочки инструментов, которая предоставляет данные, регулирует доступ, очищает данные, преобразует их, маскирует их во время выполнения и определяет, как осуществляется доступ к данным: передаются ли данные в механизм запросов (через репликацию) или наоборот (через виртуализацию)? Фабрика данных необходима не тогда, когда вы просто получаете данные из одной системы транзакций, а из множества источников.

ДЕЛИТЬСЯ