Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://repository.hneu.edu.ua/handle/123456789/19435
Название: Аналіз даних в SQL Server засобами Python
Другие названия: Анализ данных в SQL Server средствами Python
Data analysis in SQL Server means of Python
Авторы: Федько В. В.
Fedko V. V.
Ключевые слова: Business intelligence
Data mining
Data Scientist
Data Engineer
SQL Server
Machine Learning Services
операційна база даних
сховище даних
мови R та Python
аналіз даних
візуалізація даних
операционная база данных
хранилище данных
языки R и Python
анализ данных
визуализация данных
operating database
data warehouse
R and Python languages
data analysis
data visualization
Дата публикации: 2018
Библиографическое описание: Федько В. В. Аналіз даних в SQL Server засобами Python / В. В. Федько // Збірник наукових праць Харківського національного університету Повітряних Сил. – 2018. – 2(56).
Краткий осмотр (реферат): Розглянуто можливості інструментальних засобів аналізу даних. Викладено способи зберігання даних, які адаптовані до ефективного виконання запитів аналізу даних, а також мовні засоби, що представлені в компоненті Microsoft SQL Server як Machine Learning Services (in-database). Проведено порівняння операційних баз даних (OLTP-систем) і сховищ даних, які орієнтовані на аналіз даних (OLAP-систем). Наведено приклади обох систем, а також розглянуто систему їхньої взаємодії (ETL-система). Описано інструментальні засоби аналізу даних, які в найпростіших випадках застосовуються до OLAP-кубів. Подано мовні засоби виконання аналізу даних в більш складних випадках. Проведено порівняння мов R і Python, з якого випливає, що мова Python дозволяє будувати завершені програми обробки даних, а бібліотеки в ній майже такі самі, як і в мові R. Показано, що, з огляду на велику популярність мовних засобів аналізу даних в останні випуски SQL Server включено компонент SQL Server R Services, в результаті чого нові можливості в SQL Server дозволили обійти обмеження, яке полягає в тому, що всі дані повинні зберігатися в пам'яті. Описано основні переваги компонента Machine Learning Services, а також особливості його установки. Продемонстровано на конкретних прикладах можливості виконання розрахунків і графічного подання результатів мовою Python у середовищі SQL Server для проведення аналізу даних. Рассмотрены возможности инструментальных средств анализа данных. Изложены способы хранения данных, адаптированные к эффективному выполнению запросов анализа данных, а также языковые средства, представленные в компоненте Microsoft SQL Server как Machine Learning Services (in-database). Проведено сравнение операционных баз данных (OLTP-систем) и хранилищ данных, которые ориентированы на анализ данных (OLAP-систем). Даны примеры обеих систем, а также рассмотрена система их взаимодействия (ETL-система). Описаны инструментальные средства анализа данных, которые в простейших случаях применяются к OLAP-кубам. Представлены языковые средства выполнения анализа данных в более сложных случаях. Проведено сравнение языков R и Python, из которого следует, что язык Python позволяет строить завершенные приложения обработки данных, а библиотеки в нем почти такие же, как и в языке R. Показано, что, учитывая большую популярность языковых средств анализа данных в последние выпуски SQL Server включены компонент SQL Server R Services, в результате чего новые возможности в SQL Server позволили обойти ограничения, которое заключается в том, что все данные должны храниться в памяти. Описаны основные преимущества компонента Machine Learning Services, а также особенности его установки. Продемонстрированы на конкретных примерах возможности выполнения расчетов и графического представления результатов на языке Python в среде SQL Server для проведения анализа данных. The possibilities of data analysis tools are considered. Methods of data storage adapted to the effective execution of data analysis requests are described, as well as the language tools presented in the Microsoft SQL Server component as Machine Learning Services (in-database). Comparison of operational databases (OLTP-systems) and data warehouses, which are focused on data analysis (OLAP-systems) are compared. Examples of both systems are given, and the system of their interaction (ETL-system) is considered. Describes data analysis tools, which in the simplest cases are applied to OLAP-cube. Presented are the language tools for performing data analysis in more complex cases. Comparison of the R and Python languages is performed, from which it follows that the Python language allows you to build complete data processing applications, and the libraries in it are almost the same as in the R language. It is shown that, given the great popularity of language analysis tools in the latest issues of SQL Server included the SQL Server R Services component, resulting in new features in SQL Server that circumvented the restriction that all data must be stored in memory. Describes the main advantages of the Machine Learning Services component, as well as the features of its installation. Demonstrated on specific examples of the possibility of performing calculations and graphical representation of results in Python in a SQL Server environment for data analysis.
URI (Унифицированный идентификатор ресурса): http://www.repository.hneu.edu.ua/handle/123456789/19435
Располагается в коллекциях:Статті (ІС)

Файлы этого ресурса:
Файл Описание РазмерФормат 
Федько_Статья.pdf976,65 kBAdobe PDFЭскиз
Просмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.