ETL и ELT — это две популярные стратегии данных, которые помогают извлекать, форматировать. загружать и хранить данные. В 1-ой части нашей статьи мы подробно рассказали вам об этих подходах, а также рассмотрели их ключевые этапы. В этой статье мы рассмотрим недостатки и преимущества этих стратегий, чтобы вы могли сделать осознанный выбор.
Ниже мы рассмотрим преимущества и недостатки этих подходов.
После того как данные структурированы и преобразованы с помощью ETL, запросы к данным становятся более эффективными, чем неструктурированные данные — это помогает анализировать их быстрее.
ETL может быть реализован как в локальной, так и в облачной среде. Компании часто используют ETL для получения данных из локальных систем и загрузки их в облачное хранилище.
ETL преобразует данные до того, как они достигнут места назначения. Если в компании принята политика конфиденциальности данных, ETL позволяет удалить, замаскировать или зашифровать конфиденциальные данные перед их загрузкой в хранилище.
ETL — это один из первых подходов, который используется уже более двух десятилетий. Это означает, что на рынке больше специалистов с опытом реализации ETL, а также больше инструментов для работы с данными.
Поскольку данные должны быть преобразованы в промежуточной области перед загрузкой, они не могут быть оперативно доступны в хранилище данных в отличие от ELT, где данные загружаются сразу после их извлечения.
Если структура данных в хранилище не поддерживает новые запросы или анализы, возможно, потребуется изменить процесс преобразования и схему хранилища данных.
ETL не подходит для обработки больших объемов данных, учитывая время, которое нужно для преобразования.
ELT может принимать данные в любом формате. Вам не нужно учитывать структуру или схему, поскольку облако данных принимает неструктурированные данные.
В модели ELT преобразование обычно происходит только тогда, когда необходим анализ, а не преобразование всех данных до их загрузки.
При использовании ELT все данные загружаются в облако данных, поэтому они всегда доступны. Это позволяет инструментам, которым не нужны структурированные данные, оперативно взаимодействовать с загруженными данными, не дожидаясь их преобразования.
Поскольку преобразование происходит «в состоянии покоя», данные загружаются в облако данных, как только они становятся доступными, что обеспечивает оперативный доступ к информации.
Поскольку преобразование выполняется при необходимости, модель ELT можно применять к новым источникам данных, чтобы быстро собирать информацию в облаке данных.
Политика конфиденциальности может запрещать компаниям хранить конфиденциальные данные, даже если эта информация позже будет удалена. При интеграции ELT с облаком могут возникнуть проблемы, поскольку некоторые правила запрещают хранить информацию на серверах за пределами определенного региона.
ELT — достаточно новая стратегия, которая до конца не изучена. Однако количество инструментов и специалистов, которые используют ELT, увеличивается.
Все преимущества стратегии ELT возможны только в сочетании с облачными возможностями хранения и обработки данных.
Поскольку преобразование происходит только после загрузки данных и анализа, это может замедлить время получения информации при проверке больших объемов неструктурированных данных.
Оба метода помогают улучшить качество и целостность ваших данных. Сильная сторона ETL — это структурирование данных для более глубокого анализа и изучения, а сильная сторона ELT — это скорость и поддержка различных типов данных.
Любой из этих подходов поможет улучшить прозрачность данных, а также устранит надоедливые хранилища. Мы советуем вам поэкспериментировать с каждым из этих подходов и выбрать оптимальный для ваших потребностей.
Источник: hubspot.com
Я даю согласие OOO «ЭсБилдер» (далее «BINN») на обработку моих персональных данных в соответствии со статьями 6, 9, 10, 18 Федерального закона от 27 июля 2006 года № 152-ФЗ «О персональных данных», указанных в онлайн-форме и/или предоставленных мною с целью:
Способы обработки персональных данных могут быть любыми, включая сбор, систематизацию, накопление, хранение, уточнение, обновление, изменение, воспроизведение, обезличивание, блокирование и уничтожение.
Настоящее согласие применяется в отношении обработки следующих данных: имя, номер телефона, адрес электронной почты (E-mail).
Настоящее согласие предоставляется сроком на пять лет. По истечении указанного срока действие согласия считается продленным на каждые следующие пять лет при отсутствии сведений о его отзыве.
Согласие может быть отозвано мною в любой момент путем направления в BINN подписанного мною письменного заявления.