Низкая цена
Всего 249a за скачивание одной диссертации
Скидки
75 диссертаций за 4900a по акции. Подробнее
О проекте

Электронная библиотека диссертаций — нашли диссертацию, посмотрели оглавление или любые страницы за 3 рубля за страницу, пополнили баланс и скачали диссертацию.

Я впервые на сайте

Отзывы о нас

Метод анализа плана выполнения SQL-запроса, используя свойства O-большое асимптотик для оценки стоимости : диссертация ... кандидата технических наук : 05.13.11

Год: 2010

Номер работы: 89325

Автор:

Стоимость работы: 249 e

Без учета скидки. Вы получаете файл формата pdf

Оглавление и несколько страниц
Бесплатно

Вы получаете первые страницы диссертации в формате txt

Читать онлайн
постранично
Платно

Просмотр 1 страницы = 3 руб



Оглавление диссертации:

ВВЕДЕНИЕ Большинство информационных систем строится на основе реляционных СУБД [98, 99, 122], общение с которыми производится на декларативном языке запросов SQL [1-6]. Объемы хранимой информации ежегодно возрастают (по оценкам экспертов в среднем в два раза) [123,124]. На 2009 год более трети хранилищ систем по объему данных превысили один терабайт. К СУБД, а отсюда и к запросам, предъявляются требования не только реализации функциональных возможностей, но и достаточной производительности (

Запрос на языке заданий SQL позволяет описать требуемую информацию, не детализируя процесс ее получения. Алгоритм выполнения 18 запроса выбирается* компонентом* СУБД, называемым оптимизатором. Для этого запрос преобразуется в реляционное алгебраическое выражение. Далее на основе известных свойств и алгебры производится эквивалентное перебор комбинаторного преобразование выражения организуется комбинаторный вариантов выполнения запроса. Оптимизатор методами анализа производит выбор наиболее

Современные СУБД содержат развитую систему средств автоматической настройки своих компонент и структур, активная разработка и реализация которых началась в 1997 году после появления первых технических результатов реализации проекта Auto Admin [196] исследовательским центром Microsoft. Система средств автоматической настройки содержит инфраструктуру (framework), реализация которой может различаться ("What-if" интерфейс в MSSQL, LEO интерфейс в DB2, Tuning Pack в Oracle). Инфра

В 2005 году Б. Новиков предложил производить настройку методом локальной настройки запросов, учитывая историю выполнения запросов [50]. Метод локальной настройки имеет своей целью уменьшение стоимости выполнения отдельных запросов. Задача локальной настройки запросов состоит в нахождении стоимость такого плана выполнения которого среди бы множества глобально собой альтернатив, стоимости выполнения была оптимальна, либо не превышала величины некоторого заданного значения (квазиоптимальна). пр

В процессе настройки запросов на этапах анализа и оценки результатов используются различные методы исследования плана выполнения. Условно ггх можно разделить на математические (связанные с построением различных моделей в зависимости от параметров системы) и имитационные (связанные с эмуляцией поведения запросов на прогнозируемых объемах данных) методы.

В реляционных СУБД выполнение запросов происходит в подсистеме управления данными на физическом уровне. Она позволяет последовательно просматривать кортежи отношений в соответствии с предикатами запроса, используя индексы, или простым сканированием страниц базы данных. Выполнение запроса производится по его процедурному представлению совокупности последовательных вызовов процедур физической подсистемы. Формат представления (плана выполнения запроса) и его пример представлены в Приложениях 1 и

Имитационные методы позволяют создать нагрузку на СУБД заданного вида с целью исследования времени ответа существующими инженерными средствами системы и определения запросов, вызывающих режимы неудовлетворительную производительность. Заданный вид нагрузки может имитировать как запросы на проверку функциональности, так и различные практики имитационного моделирования:

а) имитация типовой нагрузки на СУБД;

б) имитация запросов на проверку функциональности. В настоящее время стандар

На сегодняшний день для анализа плана выполнения практикуются метод серого ящика и метод экспертных оценок. В методе серого ящика СУБД представляется в виде "серого" ящика системы компонент, работу каждого из которых требуется проверить путем имитации работы. Специфика баз данных состоит в том, что в большинстве случаев для имитации необходимо сгенерировать тестовые массивы данных. Генерация зачастую требует значительных ресурсов и занимает длительное время. Так что произвести доста

1.4 Постановка центрального вопроса исследования. Формулировка научной задачи Анализ современных методов решения задачи локальной настройки запросов пользователей с целью соблюдения требований к времени ответа системы, проведенный в пункте

1.2, выявил наличие противоречия прагматического характера. Оно заключается в востребованности новых средств анализа плана выполнения запроса пользователя, с одной стороны, и недостаточно разработанных способах их применения на различных этапах настро

ГЛАВА 2. РАЗРАБОТКА СПОСОБА ОЦЕНКИ СТОИМОСТИ ВЫПОЛНЕНИЯ ЗАПРОСА ПОЛЬЗОВАТЕЛЯ Задача пользователя оценки состоит стоимости в выполнения реляционного модели запроса плана построении математической выполнения запроса. Определим структуру и состав математической модели. Далее произведем формализацию модели и исследуем ее свойства.

Современные реляционные СУБД являются SQL-ориентированными. Используемая в этом случае модель данных похожа на реляционную, но отличается от нее рядом концептуальных деталей [41]. Вместе с тем, план выполнения запроса оперирует процедурами реляционной подсистемы, представляющими собой программную реализацию операций реляционной алгебры, и является взаимно однозначным отображением реляционной алгебры [46]. Несоответствие моделей данных ставит вопрос выбора способа представления запроса. Исходя

Целью построения математической модели является сокращение сроков настройки реляционного запроса путем применения методов математического анализа. Требованиями, позволяющими построить модель в соответствии с целями исследования, являются требования адекватности, достаточной простоты и аддитивности (возможности уточнять модель по мере необходимости). Стоимость вычисляется на основе затрат ресурсов компонент СУБД по формуле [115] (упрощенно): Стоимость = кг х гг + к2 х г2, где гг — количество ч

2.3.1 Выявление свойств и обоснование положений по оценке стоимости выполнения запроса пользователя Исследуем свойства асимптотической оценки О функцией д(.) количества действий при выполнении операции F £ П. Существенно не уменьшая общности задачи, рассмотрим случай одного вида ресурсов, поэтому в дальнейших рассуждениях символ г опустим. Физическая реализация реляционной операции F £ П в реляционной СУБД есть некоторая циклическая конструкция [39] по обработке кортежей отношения с целью ф

Определим отношение эквивалентности на множестве производных отношений. Задача определения эквивалентности отношений представима в виде задачи преобразуемости конъюнктивного запроса [35]. Пусть задан конечный домен D, семейство отношений Q= (Qi>

0.2> •••> Qm)> г Д е Qi ~ подмножество dL - мерных кортежей с элементами из D, множество выделенных переменных X, множество невыделенных переменных Y и два запроса з± и з 2 над X, Y, D и R. Запрос з £ 3 = {з 1 ,з 2 } имеет вид: (х1

2.4 Необходимое и достаточное условия адекватности модели стоимости выполнения запроса пользователя Задача построения модели стоимости решается в рамках локального метода настройки запросов пользователей. Это обуславливает необходимость выполнения следующего ограничения на исследуемое поведение системы: Необходимое условие: Математическая модель адекватна, если по количеству затрат ресурсов можно судить о времени выполнения запроса. Локальный метод рассматривает запрос независимо от других за

3.1 Обоснование методики построения и анализа стоимости выполнентш запроса пользователя Методику построения и анализа стоимости выполнения реляционного запроса пользователя можно представить в виде последовательности этапов (рис.

3.1). На первом этапе необходимо произвести анализ системы и выделить множество параметров предметной области а (т.е. не параметров, параметры, характеризующих моделируемые сущности, характеризующие реляционные модели этих сущностей), влияющих на поведение си

Модели операций реляционной алгебры, используемые оптимизатором СУБД для определения их стоимости, учитывают множество параметров окружения модель СУБД, настроек экземпляра БД, параметров физического 10g хранения данных, гистограмм распределения данных и т.д. Так, например, стоимости полного сканирования таблицы СУБД Oracle учитывает порядка 14 параметров [115]. Однако большинство из них в процессе эксплуатации не изменяются, т.е. могут считаться константами. Оставшиеся функционально зависят

Не касаясь вопроса логического соответствия языка SQL и реляционной алгебры3, отметим однозначную зависимость реляционной алгебры от запроса на языке SQL. выражения Каждой операции реляционной алгебры однозначно соответствует логическая конструкция (конструкции) запроса, определяя предметную интерпретацию операции. Это позволяет определить методику построения модели стоимости в виде этапов: I. Предметная интерпретация операции; П. Определение списка параметров операции и функции асимптот

В (6) для перехода от асимптотически точной оценки к оценке количества используемых ресурсов при непредельных значениях параметров требуется вычислить значение константы С. Ее можно интерпретировать как сортировки все эти исходных отношений, с последующим модификациями сканированием отсортированных данных с целью получения желаемого Поэтому операции реализуются алгоритма сортировки-слияния и имеют аналогичную ему асимптотическую хранения для выполнения операции соединения среднее время, требу