Что такое схема в sql
Перейти к содержимому

Что такое схема в sql

  • автор:

SQL-Ex blog

Создание схемы SQL для организации объектов базы данных, предоставления разрешений и упрощения обслуживания

При создании объектов или доступа к ним в SQL Server вы можете также указывать имя схемы объекта. Что такое схема, и как она используется в Microsoft SQL Server?

Здесь мы вкратце сделаем обзор истории схем, рассмотрим определение схемы, встроенные схемы, причины использования схем, а также примеры создания схем и присвоения им разрешений.

Что такое схема?

Схемой в SQL Server является просто группа объектов в текущей базе данных. Не следует ее путать с определением схемы в Oracle, которая аналогична базе данных в SQL Server.

История схем

До SQL Server 2000 включительно владельцем объекта являлся пользователь, который его создал. Это означало, что при удалении пользователя в базе данных требовалось переприсвоить объекты, им созданные, другому пользователю. Начиная с SQL Server 2005, схемы есть способ разделить создателя объекта и сам объект.

Встроенные схемы

  • dbo
    • Схема по умолчанию
    • Предполагается, если не указано имя схемы. В запросах используется [ИмяТаблицы] или [ИмяСхемы].[ИмяТаблицы]
    • Владельцем является пользователь Guest (гость). Отключено по умолчанию.
    • Если когда и используется, то редко.
    • Схема для представлений метаданных SQL Server
    • Информация об объекте
    • Информация о выполняющемся запросе
    • Динамические административные представления (DMV) в памяти

    Зачем использовать схемы?

    • Гибкость в организации объектов баз данных
    • Множество пользователей могут иметь разрешения на схему
    • Пользователей можно удалять, не оказывая влияния на объекты или схемы
    • Позволяют нескольким объектам иметь одинаковые имена, например, в хранилище данных с данными из нескольких источников данных с одинаковыми именами таблиц, схема добавляет уровень различия.

    Что может послужить примером использования схем?

    • Комплектующие
    • Аренда
    • Продажи
    • Услуги

    Оператор создания схемы

    Вот полный синтаксис T-SQL CREATE SCHEMA:

    • Создать новую базу данных SQL
    • Создать пользователя с именем User1
    • Создать схемы для отделов комплектующих (Parts), аренды (Rentals), продаж (Sales) и услуг (Service)
    • Создать новую таблицу в каждой схеме
    • Создать простую хранимую процедуру, которая будет запрашивать все записи в соответствующей таблице
    • Предоставить разрешения на select и execute в схеме Parts пользователю User1

    Затем мы подключимся как User1 и выполним хранимую процедуру [Parts].[Proc1] в базе данных SkiShop.

    Запрос выполняется и, конечно, не возвращает никаких записей, поскольку таблица пустая, но мы видим, что хранимая процедура выполнилась. Мы увидели, что пользователь USER1 имеет права на select и execute для таблицы Parts.TableA, которые мы предоставили схеме Parts.

    Теперь давайте посмотрим, что произойдет с другими схемами и таблицами при попытке выполнить другие три хранимых процедуры или выборки из таблиц в трех других схемах, в которых User1 не имеет разрешений.

    Мы видим следующие ошибки, говорящие о том, что мы не имеем разрешений на выполнение хранимых процедур.

    Msg 229, Level 14, State 5, Procedure Rentals.Proc1, Line 1 [Batch Start Line 2]
    The EXECUTE permission was denied on the object ‘Proc1’, database ‘SkiShop’, schema ‘Rentals’.

    Msg 229, Level 14, State 5, Procedure Sales.Proc1, Line 1 [Batch Start Line 2]
    The EXECUTE permission was denied on the object ‘Proc1’, database ‘SkiShop’, schema ‘Sales’.

    Msg 229, Level 14, State 5, Procedure Service.Proc1, Line 1 [Batch Start Line 2]
    The EXECUTE permission was denied on the object ‘Proc1’, database ‘SkiShop’, schema ‘Service’.

    А попытки непосредственно обратиться к таблицам дает следующие ошибки, утверждающие, что мы не имеем разрешений на выборку из таблиц.

    Msg 229, Level 14, State 5, Line 8
    The SELECT permission was denied on the object ‘TableA’, database ‘SkiShop’, schema ‘Rentals’.

    Msg 229, Level 14, State 5, Line 9
    The SELECT permission was denied on the object ‘TableA’, database ‘SkiShop’, schema ‘Sales’.

    Msg 229, Level 14, State 5, Line 10
    The SELECT permission was denied on the object ‘TableA’, database ‘SkiShop’, schema ‘Service’.

    Схема базы данных

    Схемы используются в модели безопасности компонента Database Engine для упрощения взаимоотношений между пользователями и объектами, и, следовательно, схемы имеют очень большое влияние на взаимодействие пользователя с компонентом Database Engine. В этом разделе рассматривается роль схем в безопасности компонента Database Engine. В первом подразделе описывается взаимодействие между схемами и пользователями, а во втором обсуждаются все три инструкции языка Transact-SQL, применяемые для создания и модификации схем.

    Разделение пользователей и схем

    — это коллекция объектов базы данных, имеющая одного владельца и формирующая одно пространство имен. (Две таблицы в одной и той же схеме не могут иметь одно и то же имя.) Компонент Database Engine поддерживает именованные схемы с использованием понятия принципала (principal). Как уже упоминалось, принципалом может быть индивидуальный принципал и групповой принципал.

    Индивидуальный принципал представляет одного пользователя, например, в виде регистрационного имени или учетной записи пользователя Windows. Групповым принципалом может быть группа пользователей, например, роль или группа Windows. Принципалы владеют схемами, но владение схемой может быть с легкостью передано другому принципалу без изменения имени схемы.

    Отделение пользователей базы данных от схем дает значительные преимущества, такие как:

    один принципал может быть владельцем нескольких схем;

    несколько индивидуальных принципалов могут владеть одной схемой посредством членства в ролях или группах Windows;

    удаление пользователя базы данных не требует переименования объектов, содержащихся в схеме этого пользователя.

    Каждая база данных имеет схему по умолчанию, которая используется для определения имен объектов, ссылки на которые делаются без указания их полных уточненных имен. В схеме по умолчанию указывается первая схема, в которой сервер базы данных будет выполнять поиск для разрешения имен объектов. Для настройки и изменения схемы по умолчанию применяется параметр DEFAULT_SCHEMA инструкции CREATE USER или ALTER USER. Если схема по умолчанию DEFAULT_SCHEMA не определена, в качестве схемы по умолчанию пользователю базы данных назначается схема dbo.

    Инструкция CREATE SCHEMA

    В примере ниже показано создание схемы и ее использование для управления безопасностью базы данных. Прежде чем выполнять этот пример, необходимо создать пользователей базы данных Alex и Vasya, как будет описано в следующей статье (вы можете вернуться к этим примерам позже).

    В этом примере создается схема poco, содержащая таблицу Product и представление view_Product. Пользователь базы данных Vasya является принципалом уровня базы данных, а также владельцем схемы. (Владелец схемы указывается посредством параметра AUTHORIZATION. Принципал может быть владельцем других схем и не может использовать текущую схему в качестве схемы по умолчанию.)

    Две другие инструкции, применяемые для работы с разрешениями для объектов базы данных, GRANT и DENY, подробно рассматриваются позже. В этом примере инструкция GRANT предоставляет инструкции SELECT разрешения для всех создаваемых в схеме объектов, тогда как инструкция DENY запрещает инструкции UPDATE разрешения для всех объектов схемы.

    С помощью инструкции CREATE SCHEMA можно создать схему, сформировать содержащиеся в этой схеме таблицы и представления, а также предоставить, запретить или удалить разрешения на защищаемый объект. Как упоминалось ранее, защищаемые объекты — это ресурсы, доступ к которым регулируется системой авторизации SQL Server. Существует три основные области защищаемых объектов: сервер, база данных и схема, которые содержат другие защищаемые объекты, такие как регистрационные имена, пользователи базы данных, таблицы и хранимые процедуры.

    Инструкция CREATE SCHEMA является атомарной. Иными словами, если в процессе выполнения этой инструкции происходит ошибка, не выполняется ни одна из содержащихся в ней подынструкций.

    Порядок указания создаваемых в инструкции CREATE SCHEMA объектов базы данных может быть произвольным, с одним исключением: представление, которое ссылается на другое представление, должно быть указано после представления, на которое оно ссылается.

    Принципалом уровня базы данных может быть пользователь базы данных, роль или роль приложения. (Роли и роли приложения рассматриваются в одной из следующих статей.) Принципал, указанный в предложении AUTHORIZATION инструкции CREATE SCHEMA, является владельцем всех объектов, созданных в этой схеме. Владение содержащихся в схеме объектов можно передавать любому принципалу уровня базы данных посредством инструкции ALTER AUTHORIZATION.

    Для исполнения инструкции CREATE SCHEMA пользователь должен обладать правами базы данных CREATE SCHEMA. Кроме этого, для создания объектов, указанных в инструкции CREATE SCHEMA, пользователь должен иметь соответствующие разрешения CREATE.

    Инструкция ALTER SCHEMA

    Инструкция ALTER SCHEMA перемещает объекты между разными схемами одной и той же базы данных. Инструкция ALTER SCHEMA имеет следующий синтаксис:

    Использование инструкции ALTER SCHEMA показано в примере ниже:

    Здесь изменяется схема HumanResources базы данных AdventureWorks2012, перемещая в нее таблицу ContactType из схемы Person этой же базы данных. Инструкцию ALTER SCHEMA можно использовать для перемещения объектов между разными схемами только одной и той же базы данных. (Отдельные объекты в схеме можно изменить посредством инструкции ALTER TABLE или ALTER VIEW.)

    Инструкция DROP SCHEMA

    Для удаления схемы из базы данных применяется инструкция DROP SCHEMA. Схему можно удалить только при условии, что она не содержит никаких объектов. Если схема содержит объекты, попытка выполнить инструкцию DROP SCHEMA будет неуспешной.

    Как указывалось ранее, владельца схемы можно изменить посредством инструкции ALTER AUTHORIZATION, которая изменяет владение сущностью. Язык Transact-SOL не поддерживает инструкции CREATE AUTHORIZATION и DROP AUTHORIZATION. Владелец схемы указывается с помощью инструкции CREATE SCHEMA.

    Учебник по языку SQL (DDL, DML) на примере диалекта MS SQL Server. Часть вторая

    Вступление и DDL – Data Definition Language (язык описания данных)

    DML – Data Manipulation Language (язык манипулирования данными)

    В первой части мы уже немного затронули язык DML, применяя почти весь набор его команд, за исключением команды MERGE.

    Рассказывать про DML я буду по своей последовательности выработанной на личном опыте. По ходу, так же постараюсь рассказать про «скользкие» места, на которые стоит акцентировать внимание, эти «скользкие» места, схожи во многих диалектах языка SQL.

    Т.к. учебник посвящается широкому кругу читателей (не только программистам), то и объяснение, порой будет соответствующее, т.е. долгое и нудное. Это мое видение материала, которое в основном получено на практике в результате профессиональной деятельности.

    Основная цель данного учебника, шаг за шагом, выработать полное понимание сути языка SQL и научить правильно применять его конструкции. Профессионалам в этой области, может тоже будет интересно пролистать данный материал, может и они смогут вынести для себя что-то новое, а может просто, будет полезно почитать в целях освежить память. Надеюсь, что всем будет интересно.

    Т.к. DML в диалекте БД MS SQL очень сильно связан с синтаксисом конструкции SELECT, то я начну рассказывать о DML именно с нее. На мой взгляд конструкция SELECT является самой главной конструкцией языка DML, т.к. за счет нее или ее частей осуществляется выборка необходимых данных из БД.

    • SELECT – выборка данных
    • INSERT – вставка новых данных
    • UPDATE – обновление данных
    • DELETE – удаление данных
    • MERGE – слияние данных

    В данной части, мы рассмотрим, только базовый синтаксис команды SELECT, который выглядит следующим образом:

    Тема оператора SELECT очень обширная, поэтому в данной части я и остановлюсь только на его базовых конструкциях. Я считаю, что, не зная хорошо базы, нельзя приступать к изучению более сложных конструкций, т.к. дальше все будет крутиться вокруг этой базовой конструкции (подзапросы, объединения и т.д.).

    Также в рамках этой части, я еще расскажу о предложении TOP. Это предложение я намерено не указал в базовом синтаксисе, т.к. оно реализуется по-разному в разных диалектах языка SQL.

    Если язык DDL больше статичен, т.е. при помощи него создаются жесткие структуры (таблицы, связи и т.п.), то язык DML носит динамический характер, здесь правильные результаты вы можете получить разными путями.

    Обучение так же будет продолжаться в режиме Step by Step, т.е. при чтении нужно сразу же своими руками пытаться выполнить пример. После делаете анализ полученного результата и пытаетесь понять его интуитивно. Если что-то остается непонятным, например, значение какой-нибудь функции, то обращайтесь за помощью в интернет.

    Примеры будут показываться на БД Test, которая была создана при помощи DDL+DML в первой части.

    Для тех, кто не создавал БД в первой части (т.к. не всех может интересовать язык DDL), может воспользоваться следующим скриптом:

    Все, теперь мы готовы приступить к изучению языка DML.

    SELECT – оператор выборки данных

    Первым делом, для активного редактора запроса, сделаем текущей БД Test, выбрав ее в выпадающем списке или же командой «USE Test».

    Начнем с самой элементарной формы SELECT:

    В данном запросе мы просим вернуть все столбцы (на это указывает «*») из таблицы Employees – можно прочесть это как «ВЫБЕРИ все_поля ИЗ таблицы_сотрудники». В случае наличия кластерного индекса, возвращенные данные, скорее всего будут отсортированы по нему, в данном случае по колонке ID (но это не суть важно, т.к. в большинстве случаев сортировку мы будем указывать в явном виде сами при помощи ORDER BY …):

    ID Name Birthday Email PositionID DepartmentID HireDate ManagerID
    1000 Иванов И.И. 1955-02-19 i.ivanov@test.tt 2 1 2015-04-08 NULL
    1001 Петров П.П. 1983-12-03 p.petrov@test.tt 3 3 2015-04-08 1003
    1002 Сидоров С.С. 1976-06-07 s.sidorov@test.tt 1 2 2015-04-08 1000
    1003 Андреев А.А. 1982-04-17 a.andreev@test.tt 4 3 2015-04-08 1000

    Вообще стоит сказать, что в диалекте MS SQL самая простая форма запроса SELECT может не содержать блока FROM, в этом случае вы можете использовать ее, для получения каких-то значений:

    (No column name) (No column name) (No column name)
    825 2015-04-11 12:12:36.0406743 1

    Обратите внимание, что выражение (5550/100*15) дало результат 825, хотя если мы посчитаем на калькуляторе получится значение (832.5). Результат 825 получился по той причине, что в нашем выражении все числа целые, поэтому и результат целое число, т.е. (5550/100) дает нам 55, а не (55.5).

    • Целое / Целое = Целое (т.е. в данном случае происходит целочисленное деление)
    • Вещественное / Целое = Вещественное
    • Целое / Вещественное = Вещественное

    Здесь (123.) = (123.0), просто в данном случае 0 можно отбросить и оставить только точку.

    При других арифметических операциях действует та же самая логика, просто в случае деления этот нюанс более актуален.

    Поэтому обращайте внимание на тип данных числовых столбцов. В том случае если он целый, а результат вам нужно получить вещественный, то используйте преобразование, либо просто ставьте точку после числа указанного в виде константы (123.).

    Для преобразования полей можно использовать функцию CAST или CONVERT. Для примера воспользуемся полем ID, оно у нас типа int:

    ID (No column name) (No column name) (No column name) (No column name)
    1000 10 10 10 10.000000
    1001 10 10.01 10.01 10.010000
    1002 10 10.02 10.02 10.020000
    1003 10 10.03 10.03 10.030000

    На заметку. В БД ORACLE синтаксис без блока FROM недопустим, там для этой цели используется системная таблица DUAL, которая содержит одну строку:

    Примечание. Имя таблицы во многих РБД может предваряться именем схемы:

    Схема – это логическая единица БД, которая имеет свое наименование и позволяет сгруппировать внутри себя объекты БД такие как таблицы, представления и т.д.

    Определение схемы в разных БД может отличатся, где-то схема непосредственно связанна с пользователем БД, т.е. в данном случае можно сказать, что схема и пользователь – это синонимы и все создаваемые в схеме объекты по сути являются объектами данного пользователя. В MS SQL схема – это независимая логическая единица, которая может быть создана сама по себе (см. CREATE SCHEMA).

    По умолчанию в базе MS SQL создается одна схема с именем dbo (Database Owner) и все создаваемые объекты по умолчанию создаются именно в данной схеме. Соответственно, если мы в запросе указываем просто имя таблицы, то она будет искаться в схеме dbo текущей БД. Если мы хотим создать объект в конкретной схеме, мы должны будем так же предварить имя объекта именем схемы, например, «CREATE TABLE имя_схемы.имя_таблицы(…)».

    В случае MS SQL имя схемы может еще предваряться именем БД, в которой находится данная схема:

    • в одном запросе мы обращаемся к объектам расположенных в разных схемах или базах данных
    • требуется сделать перенос данных из одной схемы или БД в другую
    • находясь в одной БД, требуется запросить данные из другой БД
    • и т.п.

    Так же не забываем, что в тексте запроса мы можем использовать как однострочные «— …», так и многострочные «/* … */» комментарии. Если запрос большой и сложный, то комментарии могут очень помочь, вам или кому-то другому, через некоторое время, вспомнить или разобраться в его структуре.

    Если столбцов в таблице очень много, а особенно, если в таблице еще очень много строк, плюс к тому если мы делаем запросы к БД по сети, то предпочтительней будет выборка с непосредственным перечислением необходимых вам полей через запятую:

    Т.е. здесь мы говорим, что нам из таблицы нужно вернуть только поля ID и Name. Результат будет следующим (кстати оптимизатор здесь решил воспользоваться индексом, созданным по полю Name):

    ID Name
    1003 Андреев А.А.
    1000 Иванов И.И.
    1001 Петров П.П.
    1002 Сидоров С.С.

    На заметку. Порой бывает полезным посмотреть на то как осуществляется выборка данных, например, чтобы выяснить какие индексы используются. Это можно сделать если нажать кнопку «Display Estimated Execution Plan – Показать расчетный план» или установить «Include Actual Execution Plan – Включить в результат актуальный план выполнения запроса» (в данном случае мы сможем увидеть уже реальный план, соответственно, только после выполнения запроса):

    Анализ плана выполнения очень полезен при оптимизации запроса, он позволяет выяснить каких индексов не хватает или же какие индексы вообще не используются и их можно удалить.

    Если вы только начали осваивать DML, то сейчас для вас это не так важно, просто возьмите на заметку и можете спокойно забыть об этом (может это вам никогда и не пригодится) – наша первоначальная цель изучить основы языка DML и научится правильно применять их, а оптимизация это уже отдельное искусство. Порой важнее, чтобы на руках просто был правильно написанный запрос, который возвращает правильные результат с предметной точки зрения, а его оптимизацией уже занимаются отдельные люди. Для начала вам нужно научиться просто правильно писать запросы, используя любые средства для достижения цели. Главная цель которую вы сейчас должны достичь – чтобы ваш запрос возвращал правильные результаты.

    Задание псевдонимов для таблиц

    При перечислении колонок их можно предварять именем таблицы, находящейся в блоке FROM:

    Но такой синтаксис обычно использовать неудобно, т.к. имя таблицы может быть длинным. Для этих целей обычно задаются и применяются более короткие имена – псевдонимы (alias):

    Здесь emp – псевдоним для таблицы Employees, который можно будет использоваться в контексте данного оператора SELECT. Т.е. можно сказать, что в контексте этого оператора SELECT мы задаем таблице новое имя.

    Конечно, в данном случае результаты запросов будут точно такими же как и для «SELECT ID,Name FROM Employees». Для чего это нужно будет понятно дальше (даже не в этой части), пока просто запоминаем, что имя колонки можно предварять (уточнять) либо непосредственно именем таблицы, либо при помощи псевдонима. Здесь можно использовать одно из двух, т.е. если вы задали псевдоним, то и пользоваться нужно будет им, а использовать имя таблицы уже нельзя.

    DISTINCT – отброс строк дубликатов

    Ключевое слово DISTINCT используется для того чтобы отбросить из результата запроса строки дубликаты. Грубо говоря представьте, что сначала выполняется запрос без опции DISTINCT, а затем из результата выбрасываются все дубликаты. Продемонстрируем это для большей наглядности на примере:

    Наглядно это будет выглядеть следующим образом (все дубликаты помечены одним цветом):

    Теперь давайте рассмотрим где это можно применить, на более практичном примере – вернем из таблицы Employees только уникальные идентификаторы отделов (т.е. узнаем ID отделов в которых числятся сотрудники):

    DepartmentID
    1
    2
    3

    Здесь мы получили три строки, т.к. 2 сотрудника у нас числятся в одном отделе (ИТ).

    Теперь узнаем в каких отделах, какие должности фигурируют:

    DepartmentID PositionID
    1 2
    2 1
    3 3
    3 4

    Здесь мы получили 4 строчки, т.к. повторяющихся комбинаций (DepartmentID, PositionID) в нашей таблице нет.

    Ненадолго вернемся к DDL

    Так как данных для демонстрационных примеров начинает не хватать, а рассказать хочется более обширно и понятно, то давайте чуть расширим нашу таблицу Employess. К тому же немного вспомним DDL, как говорится «повторение – мать учения», и плюс снова немного забежим вперед и применим оператор UPDATE:

    Убедимся, что данные обновились успешно:

    ID Name LastName FirstName MiddleName Salary BonusPercent
    1000 Иванов И.И. Иванов Иван Иванович 5000 50
    1001 Петров П.П. Петров Петр Петрович 1500 15
    1002 Сидоров С.С. Сидоров Сидор NULL 2500 NULL
    1003 Андреев А.А. Андреев Андрей NULL 2000 30

    Задание псевдонимов для столбцов запроса

    Думаю, здесь будет проще показать, чем написать:

    ФИО Дата приема Дата рождения ZP
    Иванов Иван Иванович 2015-04-08 1955-02-19 5000
    Петров Петр Петрович 2015-04-08 1983-12-03 1500
    NULL 2015-04-08 1976-06-07 2500
    NULL 2015-04-08 1982-04-17 2000

    Как видим заданные нами псевдонимы столбцов, отразились в заголовке результирующей таблицы. Собственно, это и есть основное предназначение псевдонимов столбцов.

    Обратите внимание, т.к. у последних 2-х сотрудников не указано отчество (NULL значение), то результат выражения «LastName+’ ‘+FirstName+’ ‘+MiddleName» так же вернул нам NULL.

    Для соединения (сложения, конкатенации) строк в MS SQL используется символ «+».

    Запомним, что все выражения в которых участвует NULL (например, деление на NULL, сложение с NULL) будут возвращать NULL.

    На заметку.
    В случае ORACLE для объединения строк используется оператор «||» и конкатенация будет выглядеть как «LastName||’ ‘||FirstName||’ ‘||MiddleName». Для ORACLE стоит отметить, что у него для строковых типов есть исключение, для них NULL и пустая строка » это одно и тоже, поэтому в ORACLE такое выражение вернет для последних 2-х сотрудников «Сидоров Сидор » и «Андреев Андрей ». На момент версии ORACLE 12c, насколько я знаю, опции которая изменяет такое поведение нет (если не прав, прошу поправить меня). Здесь мне сложно судить хорошо это или плохо, т.к. в одних случаях удобнее поведение NULL-строки как в MS SQL, а в других как в ORACLE.

    В ORACLE тоже допустимы все перечисленные выше псевдонимы столбцов, кроме […].

    Для того чтобы не городить конструкцию с использованием функции ISNULL, в MS SQL мы можем применить функцию CONCAT. Рассмотрим и сравним 3 варианта:

    FullName1 FullName2 FullName3
    Иванов Иван Иванович Иванов Иван Иванович Иванов Иван Иванович
    Петров Петр Петрович Петров Петр Петрович Петров Петр Петрович
    NULL Сидоров Сидор Сидоров Сидор
    NULL Андреев Андрей Андреев Андрей

    В MS SQL псевдонимы еще можно задавать при помощи знака равенства:

    Использовать для задания псевдонима ключевое слово AS или же знак равенства, наверное, больше дело вкуса. Но при разборе чужих запросов, данные знания могут пригодиться.

    Напоследок скажу, что для псевдонимов имена лучше задавать, используя только символы латиницы и цифры, избегая применения ‘…’, "…" и […], то есть использовать те же правила, что мы использовали при наименовании таблиц. Дальше, в примерах я буду использовать только такие наименования и никаких ‘…’, "…" и […].

    Основные арифметические операторы SQL

    Оператор Действие
    + Сложение (x+y) или унарный плюс (+x)
    Вычитание (x-y) или унарный минус (-x)
    * Умножение (x*y)
    / Деление (x/y)
    % Остаток от деления (x%y). Для примера 15%10 даст 5

    Приоритет выполнения арифметических операторов такой же, как и в математике. Если необходимо, то порядок применения операторов можно изменить используя круглые скобки — (a+b)*(x/(y-z)).

    И еще раз повторюсь, что любая операция с NULL дает NULL, например: 10+NULL, NULL*15/3, 100/NULL – все это даст в результате NULL. Т.е. говоря просто неопределенное значение не может дать определенный результат. Учитывайте это при составлении запроса и при необходимости делайте обработку NULL значений функциями ISNULL, COALESCE:

    ID Name Result1 Result2 Result3
    1000 Иванов И.И. 2500 2500 2500
    1001 Петров П.П. 225 225 225
    1002 Сидоров С.С. NULL 0 0
    1003 Андреев А.А. 600 600 600
    1004 Николаев Н.Н. NULL 0 0
    1005 Александров А.А. NULL 0 0

    Немного расскажу о функции COALESCE:

    В основном, я сосредоточусь на рассказе конструкций языка DML и по большей части не буду рассказывать о функциях, которые будут встречаться в примерах. Если вам непонятно, что делает та или иная функция поищите ее описание в интернет, можете даже поискать информацию сразу по группе функций, например, задав в поиске Google «MS SQL строковые функции», «MS SQL математические функции» или же «MS SQL функции обработки NULL». Информации по функциям очень много, и вы ее сможете без труда найти. Для примера, в библиотеке MSDN, можно узнать больше о функции COALESCE:

    Вырезка из MSDN Сравнение COALESCE и CASE

    Выражение COALESCE — синтаксический ярлык для выражения CASE. Это означает, что код COALESCE(expression1. n) переписывается оптимизатором запросов как следующее выражение CASE:

    Для примера рассмотрим, как можно воспользоваться остатком от деления (%). Данный оператор очень полезен, когда требуется разбить записи на группы. Например, вытащим всех сотрудников, у которых четные табельные номера (ID), т.е. те ID, которые делятся на 2:

    ID Name
    1000 Иванов И.И.
    1004 Николаев Н.Н.
    1002 Сидоров С.С.

    ORDER BY – сортировка результата запроса

    Предложение ORDER BY используется для сортировки результата запроса.

    LastName FirstName Salary
    Андреев Андрей 2000
    Иванов Иван 5000
    Петров Петр 1500
    Сидоров Сидор 2500

    После имя поля в предложении ORDER BY можно задать опцию DESC, которая служит для сортировки этого поля в порядке убывания:

    LastName FirstName Salary
    Иванов Иван 5000
    Сидоров Сидор 2500
    Андреев Андрей 2000
    Петров Петр 1500

    Стоит отметить, что в предложении ORDER BY можно использовать и поля, которые не перечислены в предложении SELECT (кроме случая, когда используется DISTINCT, об этом случае я расскажу ниже). Для примера забегу немного вперед используя опцию TOP и покажу, как например, можно отобрать 3-х сотрудников у которых самая высокая ЗП, с учетом что саму ЗП в целях конфиденциальности я показывать не должен:

    ID LastName FirstName
    1000 Иванов Иван
    1002 Сидоров Сидор

    Конечно здесь есть случай, что у нескольких сотрудников может быть одинаковая ЗП и тут сложно сказать каких именно трех сотрудников вернет данный запрос, это уже нужно решать с постановщиком задачи. Допустим, после обсуждения с постановщиком данной задачи, вы согласовали и решили использовать следующий вариант – сделать дополнительную сортировку по полю даты рождения (т.е. молодым у нас дорога), а если и дата рождения у нескольких сотрудников может совпасть (ведь такое тоже не исключено), то можно сделать третью сортировку по убыванию значений ID (в последнюю очередь под выборку попадут те, у кого ID окажется максимальным – например, те кто был принят последним, допустим табельные номера у нас выдаются последовательно):

    Т.е. вы должны стараться чтобы результат запроса был предсказуемым, чтобы вы могли в случае разбора полетов объяснить почему в «черный список» попали именно эти люди, т.е. все было выбрано честно, по утверждённым правилам.

    Сортировать можно так же используя разные выражения в предложении ORDER BY:

    Так же в ORDER BY можно использовать псевдонимы заданные для колонок:

    Стоит отметить что в случае использования предложения DISTINCT, в предложении ORDER BY могут использоваться только колонки, перечисленные в блоке SELECT. Т.е. после применения операции DISTINCT мы получаем новый набор данных, с новым набором колонок. По этой причине, следующий пример не отработает:

    Т.е. предложение ORDER BY применяется уже к итоговому набору, перед выдачей результата пользователю.

    Примечание 1. Так же в предложении ORDER BY можно использовать номера столбцов, перечисленных в SELECT:

    Для начинающих выглядит удобно и заманчиво, но лучше забыть и никогда не использовать такой вариант сортировки.

    Если в данном случае (когда поля явно перечислены), такой вариант еще допустим, то для случая с использованием «*» такой вариант лучше никогда не применять. Почему – потому что, если кто-то, например, поменяет в таблице порядок столбцов, или удалит столбцы (и это нормальная ситуация), ваш запрос может так же работать, но уже неправильно, т.к. сортировка уже может идти по другим столбцам, и это коварно тем что данная ошибка может обнаружиться очень нескоро.

    В случае, если бы столбы были явно перечислены, то в вышеуказанной ситуации, запрос либо бы продолжал работать, но также правильно (т.к. все явно определено), либо бы он просто выдал ошибку, что данного столбца не существует.

    Так что можете смело забыть, о сортировке по номерам столбцов.

    Примечание 2.
    В MS SQL при сортировке по возрастанию NULL значения будут отображаться первыми.

    Соответственно при использовании DESC они будут в конце

    Если необходимо поменять логику сортировки NULL значений, то используйте выражения, например:

    В ORACLE для этой цели предусмотрены 2 опции NULLS FIRST и NULLS LAST (применяется по умолчанию). Например:

    Обращайте на это внимание при переходе на ту или иную БД.

    TOP – возврат указанного числа записей

    Обычно данное выражение используется с предложением ORDER BY и мы уже смотрели примеры, когда нужно было вернуть N-первых строк из результирующего набора.

    Без ORDER BY обычно данное предложение применяется, когда нужно просто посмотреть на неизвестную нам таблицу, в которой может быть очень много записей, в этом случае мы можем, для примера, попросить вернуть нам только первые 10 строк, но для наглядности мы скажем только 2:

    Так же можно указать слово PERCENT, для того чтобы вернулось соответствуй процент строк из результирующего набора:

    На моей практике чаше применяется именно выборка по количеству строк.

    Так же с TOP можно использовать опцию WITH TIES, которая поможет вернуть все строки в случае неоднозначной сортировки, т.е. это предложение вернет все строки, которые равны по составу строкам, которые попадают в выборку TOP N, в итоге строк может быть выбрано больше чем N. Давайте для демонстрации добавим еще одного «Программиста» с окладом 1500:

    и введем еще одного сотрудника без указания должности и отдела с окладом 2000:

    Теперь давайте выберем при помощи опции WITH TIES всех сотрудников, у которых оклад совпадает с окладами 3-х сотрудников, с самым маленьким окладом (надеюсь дальше будет понятно, к чему я клоню):

    Здесь хоть и указано TOP 3, но запрос вернул 4 записи, т.к. значение Salary которое вернуло TOP 3 (1500 и 2000) оказалось у 4-х сотрудников. Наглядно это работает примерно следующим образом:

    На заметку.
    В разных БД TOP реализуется разными способами, в MySQL для этого есть предложение LIMIT, в котором дополнительно можно задать начальное смещение.

    В ORACLE 12c, тоже ввели свой аналог совмещающий функциональность TOP и LIMIT – ищите по словам «ORACLE OFFSET FETCH». До версии 12c для этой цели обычно использовался псевдостолбец ROWNUM.

    А что же будет если применить одновременно предложения DISTINCT и TOP? На такие вопросы легко ответить, проводя эксперименты. В общем, не бойтесь и не ленитесь экспериментировать, т.к. большая часть познается именно на практике. Порядок слов в операторе SELECT следующий, первым идет DISTINCT, а после него идет TOP, т.е. если рассуждать логически и читать слева-направо, то первым применится отброс дубликатов, а потом уже по этому набору будет сделан TOP. Что-ж проверим и убедимся, что так и есть:

    Salary
    1500
    2000

    Т.е. в результате мы получили 2 самые маленькие зарплаты из всех. Конечно может быть случай что ЗП для каких-то сотрудников может быть не указанной (NULL), т.к. схема нам это позволяет. Поэтому в зависимости от задачи принимаем решение либо обработать NULL значения в предложении ORDER BY, либо просто отбросить все записи, у которых Salary равна NULL, а для этого переходим к изучению предложения WHERE.

    WHERE – условие выборки строк

    Данное предложение служит для фильтрации записей по заданному условию. Например, выберем всех сотрудников работающих в «ИТ» отделе (его >

    ID LastName FirstName Salary
    1004 NULL NULL 1500
    1003 Андреев Андрей 2000
    1001 Петров Петр 1500

    Предложение WHERE пишется до команды ORDER BY.

    1. WHERE – если указано, то первым делом из всего набора Employees идет отбор только удовлетворяющих условию записей
    2. DISTINCT – если указано, то отбрасываются все дубликаты
    3. ORDER BY – если указано, то делается сортировка результата
    4. TOP – если указано, то из отсортированного результата возвращается только указанное число записей

    Рассмотрим для наглядности пример:

    Наглядно это будет выглядеть следующим образом:

    Стоит отметить, что проверка на NULL делается не знаком равенства, а при помощи операторов IS NULL и IS NOT NULL. Просто запомните, что на NULL при помощи оператора «=» (знак равенства) сравнивать нельзя, т.к. результат выражения будет так же равен NULL.

    Например, выберем всех сотрудников, у которых не указан отдел (т.е. DepartmentID IS NULL):

    ID Name
    1005 Александров А.А.

    Теперь для примера посчитаем бонус для всех сотрудников у которых указано значение BonusPercent (т.е. BonusPercent IS NOT NULL):

    Да, кстати, если подумать, то значение BonusPercent может равняться нулю (0), а так же значение может быть внесено со знаком минус, ведь мы не накладывали на данное поле никаких ограничений.

    Хорошо, рассказав о проблеме, нам пока сказали считать, что если (BonusPercent<=0 или BonusPercent IS NULL), то это означает что у сотрудника так же нет бонуса. Для начала, как нам сказали, так и сделаем, реализуем это при помощи логического оператора OR и NOT:

    Т.е. здесь мы начали изучать булевы операторы. Выражение в скобках «(BonusPercent<=0 OR BonusPercent IS NULL)» проверяет на то что у сотрудника нет бонуса, а NOT инвертирует это значение, т.е. говорит «верни всех сотрудников которые не сотрудники у которых нет бонуса».

    Так же данное выражение можно переписать и сразу сказав сразу «верни всех сотрудников, у которых есть бонус» выразив это выражением (BonusPercent>0 и BonusPercent IS NOT NULL):

    Также в блоке WHERE можно делать проверку разного рода выражений с применением арифметических операторов и функций. Например, аналогичную проверку можно сделать, использовав выражение с функцией ISNULL:

    Булевы операторы и простые операторы сравнения

    Да, без математики здесь не обойтись, поэтому сделаем небольшой экскурс по булевым и простым операторам сравнения.

    Булевых операторов в языке SQL всего 3 – AND, OR и NOT:

    AND логическое И. Ставится между двумя условиями (условие1 AND условие2). Чтобы выражение вернуло True, нужно, чтобы истинными были оба условия
    OR логическое ИЛИ. Ставится между двумя условиями (условие1 OR условие2). Чтобы выражение вернуло True, достаточно, чтобы истинным было только одно условие
    NOT инвертирует условие/логическое_выражение. Накладывается на другое выражение (NOT логическое_выражение) и возвращает True, если логическое_выражение = False и возвращает False, если логическое_выражение = True

    Для каждого булева оператора можно привести таблицы истинности где дополнительно показано какой будет результат, когда условия могут быть равны NULL:

    Есть следующие простые операторы сравнения, которые используются для формирования условий:

    Условие Значение
    = Равно
    < Меньше
    > Больше
    <= Меньше или равно
    >= Больше или равно
    <>
    !=
    Не равно

    Плюс имеются 2 оператора для проверки значения/выражения на NULL:

    IS NULL Проверка на равенство NULL
    IS NOT NULL Проверка на неравенство NULL

    Приоритет: 1) Все операторы сравнения; 2) NOT; 3) AND; 4) OR.

    При построении сложных логических выражений используются круглые скобки:

    Так же при помощи использования круглых скобок, можно изменить стандартную последовательность вычислений.

    Здесь я постарался дать представление о булевой алгебре в достаточном для работы объеме. Как видите, чтобы писать условия посложнее без логики уже не обойтись, но ее здесь немного (AND, OR и NOT) и придумывали ее люди, так что все достаточно логично.

    Идем к завершению второй части

    Как видите даже про базовый синтаксис оператора SELECT можно говорить очень долго, но, чтобы остаться в рамках статьи, напоследок я покажу дополнительные логических операторы – BETWEEN, IN и LIKE.

    BETWEEN – проверка на вхождение в диапазон

    Этот оператор имеет следующий вид:

    В роли значений могут выступать выражения.

    Разберем на примере:

    ID Name Salary
    1002 Сидоров С.С. 2500
    1003 Андреев А.А. 2000
    1005 Александров А.А. 2000

    Собственно, BETWEEN это упрощенная запись вида:

    Перед словом BETWEEN может использоваться слово NOT, которое будет осуществлять проверку значения на не вхождение в указанный диапазон:

    Соответственно, в случае использования BETWEEN, IN, LIKE вы можете так же объединять их с другими условиями при помощи AND и OR:

    IN – проверка на вхождение в перечень значений

    Этот оператор имеет следующий вид:

    Думаю, проще показать на примере:

    ID Name Salary
    1001 Петров П.П. 1500
    1003 Андреев А.А. 2000
    1004 Николаев Н.Н. 1500

    Т.е. по сути это аналогично следующему выражению:

    В случае NOT это будет аналогично (получим всех кроме тех, кто из отдела 3 и 4):

    Так же запрос с NOT IN можно выразить и через AND:

    Учтите, что искать NULL значения при помощи конструкции IN не получится, т.к. проверка NULL=NULL вернет так же NULL, а не True:

    В этом случае разбивайте проверку на несколько условий:

    Или же можно написать что-то вроде:

    Думаю, первый вариант, в данном случае будет более правильным и надежным. Ну ладно, это всего лишь пример, для демонстрации того какие еще конструкции можно строить.

    Так же стоит упомянуть еще более коварную ошибку, связанную с NULL, которую можно допустить при использовании конструкции NOT IN. Для примера, давайте попробуем выбрать всех сотрудников, кроме тех, у которых отдел равен 1 или у которых отдел вообще не указан, т.е. равен NULL. В качестве решения напрашивается вариант:

    Но выполнив запрос, мы не получим ни одной строки, хотя мы ожидали увидеть следующее:

    ID Name DepartmentID
    1001 Петров П.П. 3
    1002 Сидоров С.С. 2
    1003 Андреев А.А. 3
    1004 Николаев Н.Н. 3

    Опять же шутку здесь сыграло NULL указанное в списке значений.

    Разберем почему в данном случае возникла логическая ошибка. Разложим запрос при помощи AND:

    Правое условие (DepartmentID<>NULL) нам всегда здесь даст неопределенность, т.е. NULL. Теперь вспомним таблицу истинности для оператора AND, где (TRUE AND NULL) дает NULL. Т.е. при выполнении левого условия (DepartmentID<>1) из-за неопределенного правого условия в результате мы получим неопределенное значение всего выражения (DepartmentID<>1 AND DepartmentID<>NULL), поэтому строка не войдет в результат.

    Переписать условие правильно можно следующим образом:

    IN еще можно использовать с подзапросами, но к такой форме мы вернемся, уже в последующих частях данного учебника.

    LIKE – проверка строки по шаблону

    Про данный оператор я расскажу только в самом простом виде, который является стандартом и поддерживается большинством диалектов языка SQL. Даже в таком виде при помощи него можно решить много задач, которые требуют выполнить проверку по содержимому строки.

    Этот оператор имеет следующий вид:

    1. Знак подчеркивания «_» — говорит, что на его месте может стоять любой единичный символ
    2. Знак процента «%» — говорит, что на его месте может стоять сколько угодно символов, в том числе и ни одного

    Рассмотрим примеры с символом «_»:

    При помощи ESCAPE можно задать отменяющий символ, который отменяет проверяющее действие специальных символов «_» и «%». Данное предложение используется, когда в строке нужно непосредственно проверить наличие знака процента или знака подчеркивания.

    Для демонстрации ESCAPE давайте занесем в одну запись мусор:

    И посмотрим, что вернут следующие запросы:

    В случае, если требуется проверить строку на полное совпадение, то вместо LIKE лучше использовать просто знак «=»:

    На заметку.
    В MS SQL в шаблоне оператора LIKE так же можно задать поиск по регулярным выражениям, почитайте о нем в интернете, в том случае, если вам станет недостаточно стандартных возможностей данного оператора.

    В ORACLE для поиска по регулярным выражениям применяется функция REGEXP_LIKE.

    Немного о строках

    В случае проверки строки на наличие Unicode символов, нужно будет ставить перед кавычками символ N, т.е. N’…’. Но так как у нас в таблице все символьные поля в формате Unicode (тип nvarchar), то для этих полей можно всегда использовать такой формат. Пример:

    Если делать правильно, при сравнении с полем типа varchar (ASCII) нужно стараться использовать проверки с использованием ‘…’, а при сравнении поля с типом nvarchar (Unicode) нужно стараться использовать проверки с использованием N’…’. Это делается для того, чтобы избежать в процессе выполнения запроса неявных преобразований типов. То же самое правило используем при вставке (INSERT) значений в поле или их обновлении (UPDATE).

    При сравнении строк стоит учесть момент, что в зависимости от настройки БД (collation), сравнение строк может быть, как регистро-независимым (когда ‘Петров’=’ПЕТРОВ’), так и регистро-зависимым (когда ‘Петров'<>’ПЕТРОВ’).
    В случае регистро-зависимой настройки, если требуется сделать поиск без учета регистра, то можно, например, сделать предварительное преобразование правого и левого выражения в один регистр – верхний или нижний:

    Немного о датах

    При проверке на дату, вы можете использовать, как и со строками одинарные кавычки ‘…’.

    Вне зависимости от региональных настроек в MS SQL можно использовать следующий синтаксис дат ‘YYYYMMDD’ (год, месяц, день слитно без пробелов). Такой формат даты MS SQL поймет всегда:

    В некоторых случаях, дату удобнее задавать при помощи функции DATEFROMPARTS:

    Так же есть аналогичная функция DATETIMEFROMPARTS, которая служит для задания Даты и Времени (для типа datetime).

    Еще вы можете использовать функцию CONVERT, если требуется преобразовать строку в значение типа date или datetime:

    Значения 104 и 120, указывают какой формат даты используется в строке. Описание всех допустимых форматов вы можете найти в библиотеке MSDN задав в поиске «MS SQL CONVERT».

    Функций для работы с датами в MS SQL очень много, ищите «ms sql функции для работы с датами».

    Немного о числах и их преобразованиях

    Информация этого раздела наверно больше будет полезна ИТ-специалистам. Если вы таковым не являетесь, а ваша цель просто научится писать запросы для получения из БД необходимой вам информации, то такие тонкости вам возможно и не понадобятся, но в любом случае можете бегло пройтись по тексту и взять что-то на заметку, т.к. если вы взялись за изучение SQL, то вы уже приобщаетесь к ИТ.

    В отличие от функции преобразования CAST, в функции CONVERT можно задать третий параметр, который отвечает за стиль преобразования (формат). Для разных типов данных может использоваться свой набор стилей, которые могут повлиять на возвращаемый результат. Использование стилей мы уже затрагивали при рассмотрении преобразования строки функцией CONVERT в типы date и datetime.

    Подробней про функции CAST, CONVERT и стили можно почитать в MSDN – «Функции CAST и CONVERT (Transact-SQL)»: msdn.microsoft.com/ru-ru/library/ms187928.aspx

    Для упрощения примеров здесь будут использованы инструкции языка Transact-SQL – DECLARE и SET.

    Конечно, в случае преобразования целого числа в вещественное (которое я привел вначале данного урока, в целях демонстрации разницы между целочисленным и вещественным делением), знание нюансов преобразования не так критично, т.к. там мы делали преобразование целого числа в вещественное (диапазон которого намного больше диапазона целых):

    Возможно не стоило указывать способ неявного преобразования, получаемого делением на (1.), т.к. желательно стараться делать явные преобразования, для большего контроля типа получаемого результата. Хотя, в случае, если мы хотим получить результат типа numeric, с указанным количеством цифр после запятой, то мы можем в MS SQL применить трюк с умножением целого значения на (1., 1.0, 1.00 и т.д):

    В некоторых случаях детали преобразования могут быть действительно важны, т.к. они влияют на правильность полученного результата, например, в случае, когда делается преобразование числового значения в строку (varchar). Рассмотрим примеры по преобразованию значений типа money и float в varchar:

    Как видно из примера, плавающие типы float, real в некоторых случаях действительно могут создать большую погрешность, особенно при перегонке в строку и обратно (такое может быть при разного рода интеграциях, когда данные, например, передаются в текстовых файлах из одной системы в другую).

    Если нужно явно контролировать точность до определенного знака, более 4-х, то для хранения данных, порой лучше использовать тип decimal/numeric. Если хватает 4-х знаков, то можно использовать и тип money – он примерно соотвествует numeric(20,4).

    Примечание.
    С версии MS SQL 2008, можно использовать вместо конструкции:

    Более короткий синтаксис инициализации переменных:

    Заключение второй части

    В этой части, я постарался вспомнить и отразить наиболее важные моменты, касающиеся базового синтаксиса. Базовая конструкция – это костяк, без которого нельзя приступать к изучению более сложных конструкций языка SQL.

    Надеюсь, данный материал поможет людям, делающим первые шаги в изучении языка SQL.

    What are database schemas? 5 minute guide with examples

    Any application will require sophisticated ways to store and retrieve data. Some apps are more data intensive than others, but it is smart to budget for databases that scale well. More important, however, is the technical construction and design of your database. The relationships your data forms will lead to the construction of your database schema.

    A database schema is an abstract design that represents the storage of your data in a database. It describes both the organization of data and the relationships between tables in a given database. Developers plan a database schema in advance so they know what components are necessary and how they will connect to each other.

    In this guide, we will learn what a database schema is and why they are used. We will go through a few common examples so you can learn how to configure a database schema on your own.

    Today, we will go over:

    Get hands-on with databases today.

    Join the millions of developers getting hands-on experience with over 500 courses.

    Database Design Fundamentals for Software Engineers

    Definition of terms

    Before we get too into the weeds with database schemas, let’s go over some database basics like the difference between relational and non-relational databases.

    Data type: An attribute of a datum that informs how it will be interpreted. The main data types are: integer, float, character, string, and boolean.

    Relational databases: Relational databases are organized depending on the internal relationships between data. The primary language used to create and manipulate relational databases is SQL

    Database object: Data structures in a relational database that are used for the storage or reference of data. The most common is a table, but others include indexes, sequences, stored procedures, etc.

    Tables: Tables are database objects that contain all the data in relational databases. They are formatted in a row-and-column layout similar to a spreadsheet.

    Non-relational databases: A non-relational database is a database that is non-tabular. Data can be structured in many different ways. Some of the most common types of non-relational databases are: column-oriented, graph-based, key-value store, and document-oriented.

    Key-value pair: A key-value pair is a tuple composed of one two linked data items. The key is a constant that can be called to retrieve the value that it is assigned to.

    Entity: An entity in a database management context is a real-world item that is being stored.

    Entity type: An entity type classifies entities by storing information that relates to entities.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *