Azure SQL Data Warehouse adalah layanan Data Warehouse-as-a-Service (DWaaS) yang dikelola oleh Microsoft Azure. Data warehouse sendiri adalah repository terpusat untuk data yang dikumpulkan dari sistem operasional suatu perusahaan. Sistem data ini berfokus pada pengumpulan data dari berbagai sumber untuk keperluan akses dan analisis. Azure SQL Data Warehouse berbasis pada rilis terbaru dari SQL Server dan menyediakan fitur warehouse data tingkat perusahaan.
Azure SQL Data Warehouse pertama kali dirilis pada Juli 2016 dan memungkinkan bisnis untuk mengonsolidasikan data warehouse mereka secara terpusat serta memberikan akses global untuk analitik dan pelaporan. Layanan ini menawarkan skalabilitas dengan sumber daya cloud Azure dan memanfaatkan Massively Parallel Processing (MPP) untuk menjalankan kueri dengan cepat di atas jumlah data yang besar.
Azure SQL Data Warehouse dapat digunakan oleh analis data, ilmuwan data, dan pengguna akhir. Ilmuwan data dan analis data bertanggung jawab atas desain penyimpanan data, akses, serta kueri yang akan mengambil data dari penyimpanan relasional dan non-relasional. Sementara itu, pengguna akhir menjalankan kueri dan dashboard untuk mengolah informasi yang tersimpan di Azure SQL Data Warehouse guna mengambil keputusan bisnis.
Cara Kerja Azure SQL Data Warehouse
Azure SQL Data Warehouse dirancang untuk implementasi data warehouse tingkat perusahaan dan mampu menyimpan data dalam jumlah besar (hingga petabyte) di Microsoft Azure. Dengan menggunakan MPP, layanan ini dapat memproses kueri analitik secara efisien sehingga menghasilkan respons cepat untuk kumpulan data besar. Selain itu, Azure SQL Data Warehouse memungkinkan tampilan berbasis SQL tunggal untuk mengakses baik database relasional maupun penyimpanan Big Data non-relasional, sehingga bisnis dapat mengintegrasikan data terstruktur, tidak terstruktur, serta streaming dalam satu warehouse berbasis cloud.
Pengguna dapat mengelola Azure SQL Data Warehouse menggunakan SQL Server Management Studio (SSMS) atau menulis kueri dengan Azure Data Studio (ADS).
Azure SQL Data Warehouse menggunakan PolyBase untuk menjalankan kueri langsung ke penyimpanan big data seperti Hadoop. PolyBase memungkinkan organisasi menggunakan kueri T-SQL standar untuk mengambil data ke dalam warehouse, menciptakan satu lapisan kueri SQL untuk semua data. Penyimpanan data menggunakan format kolom (columnar storage) yang mengurangi biaya penyimpanan dan meningkatkan kinerja kueri.
Arsitektur Azure SQL Data Warehouse berbasis skala-out yang membagi proses komputasi data ke beberapa node. Layanan ini memisahkan komputasi dan penyimpanan sehingga pengguna dapat menskalakannya secara independen dan hanya membayar untuk kapasitas yang dibutuhkan.
Kelebihan dan Kekurangan Azure SQL Data Warehouse
Kelebihan:
- Model pembayaran fleksibel (pay-as-you-go) yang lebih hemat dibanding membangun warehouse data sendiri.
- Memanfaatkan sumber daya komputasi dan penyimpanan cloud Azure.
- Dapat diskalakan sesuai kebutuhan.
- Manajemen sistem dilakukan oleh Microsoft.
- Menjamin ketersediaan hingga 99,9%.
- Memenuhi standar kepatuhan seperti PCI-DSS, SOX, dan HIPAA.
- Dilengkapi fitur keamanan canggih seperti Azure Threat Detection.
- Data yang tersimpan diamankan dengan Transparent Data Encryption (TDE).
- Terintegrasi dengan Azure Active Directory, Data Factory, Data Lake Storage, Databricks, dan Microsoft Power BI.
Kekurangan:
- Migrasi data ke layanan cloud bisa jadi sulit.
- Kesulitan dalam memindahkan data dari lingkungan IaaS.
- Hanya mendukung 32 koneksi simultan.
- Mendukung maksimal 1.024 koneksi aktif.
- Tidak mendukung in-memory OLTP.
- Beberapa fitur hanya tersedia di portal klasik Azure SQL Data Warehouse.
Harga
Memahami struktur harga Azure SQL Data Warehouse sangat penting agar pelanggan dapat memilih kapasitas yang sesuai untuk kebutuhan bisnis mereka. Berbeda dengan layanan cloud lain yang memiliki satu jenis biaya, Azure SQL Data Warehouse mengenakan biaya untuk dua jenis sumber daya: komputasi dan penyimpanan.
Penyimpanan data dikenakan tarif $122,88 per 1 TB per bulan, yang mencakup ukuran warehouse serta penyimpanan snapshot inkremental selama 7 hari. Penyimpanan geo-redundan untuk pemulihan bencana dihitung mulai dari $0,12 per GB per bulan.
Biaya komputasi didasarkan pada Data Warehouse Units (DWUs) yang memiliki skala fleksibel, mulai dari DW100c seharga $1,20 per jam hingga DW30000c seharga $360 per jam. Diskon tersedia untuk pelanggan dengan perjanjian multi-tahun.