РАСПРЕДЕЛЕННЫЕ БД. ПРИЧИНЫ ВОЗНИКНОВЕНИЯ И ЗАДАЧИ
- Распределенные БД составляют еще одно направление в пространстве исследований и разработок систем управления базами данных. В этих системах приходится решать все задачи, свойственные централизованным СУБД, но, как правило, в более сложных постановках. В распределенных системах возникают и специфические проблемы, от решения которых во многом зависит эффективность, надежность и доступность систем БД. В настоящее время большинство распределенных СУБД базируется на реляционной модели данных и рассчитано на использование в локальных сетях ЭВМ. Многие проблемы распространяются и на распределенные СУБД в территориально разнесенных сетях, и почти все проблемы сохраняются для распределенных СУБД, основанных на других моделях данных.
Централизованные ИС с помощью СУБД решили основные проблемы файловых систем – устранение избыточности, несвязность, несогласованность данных.
Централизация процессов обработки д. позволяет устранить такие недостатки как несвязанность, противоречивость и избыточность д. в ИС, обеспечивает возможность стандартизации представления д., санкционированного доступа и т.п. Доводы в пользу централизации д.:
- д., возникающие в различных подразделениях, рассматриваются системой как одно целое (логически);
- большой объем д. общего назначения;
- используются централизованными приложениями;
- относительно легко реализуется защита д.
Однако по мере роста БД, использование их в территориально разнесенных организациях приводит к тому, что централизованная СУБД плохо справляется с ростом числа обрабатываемых транзакций. Это приводит к снижению общей надежности и производительности системы при обработке запросов пользователей.
Многие приложения связаны с децентрализованным вводом и потреблением данных. Как минимум это приводит к некоторой коммуникационной сети с централизованной СУБД, где возникают следующие проблемы:
- Большой поток обменов данными (напряженный сетевой трафик);
- Низкая надежность системы из-за отказов каналов связи и центральной СУБД;
- Низкая общая производительность (узкие места - сеть и центральная ЭВМ);
- Большие затраты на разработку и эксплуатацию.
Из-за вышеперечисленных проблем, даже в технологии КЛИЕНТ-СЕРВЕР построить по-настоящему большую ИС не представляется возможным. Кроме того, многие транснациональные экономические системы физически распределены по всему миру, что делает практически невозможной централизованное хранение данных.
Очевидно, что в централизованной БД легче обеспечить безопасность и целостность, но разрешение выше перечисленных проблем возможно только на пути создания децентрализованной обработки и хранения данных, т.е. на пути перехода к распределенным БД.
При децентрализации достигается:
- Параллельность обработки вследствие децентрализации;
- Большая живучесть системы;
- Меньшие начальные затраты - сеть развивается постепенно;
- Более высокая производительность.
Выгодно хранить д. и обрабатывать на местах возникновения;
Распределенная БД
– это набор файлов (таблиц для реляционной БД), хранящийся в разных узлах информационной сети и логически с точки зрения пользователя и прикладного программиста, составляющих единую схему данных.
Основная задача СУБД в распределенной системе состоит в обеспечении средств интеграции локальных баз данных, располагающихся в некоторых узлах вычислительной сети, с тем, чтобы пользователь, работающий в любом узле сети, имел доступ ко всем этим базам данных как к единой базе данных.
При этом должны обеспечиваться:
- простота использования системы;
- развитые средства обеспечения целостности;
- возможности автономного функционирования при нарушениях связности сети или при административных потребностях;
- высокая эффективность.
В одной и той же системе одни д. могут быть централизованными, другие - децентрализованными.
Алгоритмы выполнения реляционных операций
- Если говорить только про реляционные распределенные СУБД, которые наиболее развиты в теоретическом и практическом отношении, до сих пор проводится масса исследований в области оптимизации алгоритмов выполнения реляционных операций (главным образом, соединения удаленных отношений).
Таким образом, даже рассмотрев даже небольшую часть проблем распределенных систем, можно убедиться, что они нуждаются в большом количестве исследований и экспериментов. Начавшийся в Украине переход к использованию локальных сетей дает практическую возможность проведения таких работ.