Data Warehouse

Data Warehouse


Data Warehouse Adalah pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung DSS (Decision Suport System) dan EIS (Executive Information System). Data warehouse merupakan penyimpanan data yang dibuat secara khusus dimana data diorganisasi sehingga data-data tersebut dapat dengan mudah diakses oleh pengguna akhir untuk beberapa aplikasi.

Data Warehouse adalah sebuah konsep serta kombinasi teknologi yang memberikan fasilitas pada suatu organisasi dalam pengelolaan serta pemeliharaan data historis yang didapatkan dari sistem maupun aplikasi operasional (Ferdiana, 2008). Teknologi data warehouse dibutuhkan oleh sebagian besar organisasi atau perusahaan, yang mana memungkinkan untuk melakukan integrasi beberapa macam data yang berasal dari berbagai sistem dan aplikasi.

Data Warehouse adalah database yang didesain khusus untuk mengerjakan proses query, membuat laporan dan analisa. Data yang di simpan adalah data business history dari sebuah organisasi /perusahaan, dimana data tersebut tidak tersimpan secara rinci/detil. Sehingga data dapat bertahan lebih lama berbeda dengan data OLTP (Online Transactional Processing) yang tersimpan sampai prosesnya berlangsung secara lengkap. Sumber data pada data warehouse berasal dari berbagai macam format, software, platform dan jaringan yang beda. Data tersebut adalah hasil dari proses transaksi perusahan / organisasi sehari.hari. Karena berasal dari sumber yang berbeda beda tadi, maka data pada data warehouse harus tersimpan dalam sebuah format yang baku.

Data Warehouse juga merupakan salah satu sistem pendukung keputusan, yaitu dengan menyimpan data dari berbagai sumber, mengorganisasikannya dan dianalisa oleh para pengambil kebijakan. Akan tetapi data warehouse tidak dapat memberikan keputusan secara langsung. Namun ia dapat memberikan informasi yang dapat membuat user menjadi lebih paham dalam membuat kebijakan strategis. Ada 4 karakteristik dari data warehouse : subject oriented, integrated, time variant dan non volatile.


Pengertian Data Warehouse Menurut Para Ahli

Ralph Kimbali, data warehouse adalah suatu sistem yang mengekstrak, melakukan pembersihan, menyesuaikan diri serta mengirimkan sumber data pada suatu data penyimpanan dimensional dan selanjutnya memberi dukungan pada implementasi query serta analisa dalam rangka pengambilan keputusan.
Vivek Gupta (System Services Group, 1997), pengertian data warehouse adalah sistem yang terstruktur dan berskala besar yang berguna untuk menganalisa data statis yang sudah ditransformasikan dari berbagai aplikasi sumber asalnya supaya sesuai dengan struktur bisnis, terkumpul dalam jangka waktu lama, direprentasikan pada terminologi bisnis serta terpadu agar kudah dalam menganalisa.
Elmasri & Navathe (2004), data warehouse adalah kumpulan yang beraal dari informasi yang memiliki keunggulan yang sama (sama baiknya). Data warehouse memiliki perbedaan utama dalam karakteristik yang lebih menekankan pada aplikasi pendukung keputusan.Definisi ini menganggap bahwa data warehouse mempunyai karakteristik yang tidak sama dengan sistem pendukung operasional yang lain.
Bill Inmon (1996), menyatakan bahwa data warehouse merupakan dasar dari proses pengambilan keputusan. Bill Inmon disebut-sebut sebagai Bapak Data Warehouse.
Poe (1996) menyatakan bahwa data warehouse merupakan basis data analisa yang hanya bisa dibaca serta dipergunakan sebagai bahan pada sistem pendukung keputusan. Pemikiran Poe sejalan dengan Bill Inmon yang memandang bahwa data warehouse sebagai dasar pada sistem pengambilan keputusan.
Eckerson, Wayne W menyatakan bahwa data warehouse merupakan penempatan data yang sudah diuraikan yang beraal dari database operasional, eksternal serta database lain dari organisasi.
Malik, Shadan (2005), menyatakan bahwa data warehouse merupakan tempat penyimpanan data historikal yang diorganisasikan berdasarkan pada subyek untuk pengambilan keputusan pada organisasi. Data warehouse mem-fasilitasi pada kegiatan, antara lain Data Mining dan mendukung pengambilan keputusan.

Empat karakteristik data warehouse:

  1. Subject oriented: Memungkinkan user untuk menentukan tidak hanya bagaimana namun juga mengapa bisnis itu dilakukan.
  2. Integrated: Datawarehouse harus menempatkan data dari sumber yang berbeda menjadi format yang konsisten.Untuk itu,data-data tersebut harus
  3. Time variant: Data warehouse adalah tempat untuk storing data selama 5 sampai 10 tahun atau lebih, data digunakan untuk perbandingan atau perkiraan dan data ini tidak dapat diperbaharui.
  4. Non-volatile: setelah data dimasukkan kedalam data warehouse,user tidak dapat mengubah atau mengupdate data. Data yang usang dibuang,dan perubahan dianggap sebagai data baru.

Konsep Dasar Data Warehouse

  • Data-data yang berorientasi pada subyek, mempunyai dimensi waktu, terintegrasi, dan merupakan koleksi lengkap, yang dipergunakan dalam rangka mendukung proses pengambilan keputusan yang dilakukan oleh para manager pada tiap-tiap jenjang. Terutama jenjang manager dengan peringkat yang tinggi.
  • Pusat repousitori informasi yang dapat memberikan database yang berorientasi pada subyek bagi informasi yang bersifat historis yang memberi dukungan Decision Support System (DSS) serta Executive Information System (EIS).
  • Merupakan data yang didapatkan dari proses yang mana sebuah organisasi mengekstraksi makna dari aset informasi yang dimiliki. Data warehouse merupakan penemuan baru dalam bidang teknologi informasi. Dimulai sekitar 15 tahun lalu konsep data warehouse terus berkembang secara pesat sehingga konsep ini merupakan konsep yang paling banyak diperbincangkan oleh para ahli.
  • Adalah salinan dari transaksi data yang terstruktur secara spesifik pada query serta analisa.
  • Merupakan salinan dari transaksi data yang terstruktur secara spesifik pada query serta laporan.

Komponen Data Warehouse

  • Source Data

Source data merupakan gudang data dari berbagai sumber, yakni dari data internal, data eksternal, archived, dan lain-lain.

  • Data Stagging

Data yang diekstrak dan load dalam format yang sama yang tidak merubah nilai data.

  • Data Storage

Media penyimpanan data yang dihasilkan dari data stagging.

  • Metadata

Komponen yang memberi penjelasan tentang data melebihi kamus data. Metadata terbagi atas Metadata Operasional, Metadata Transformasi & Ekstrak, serta Metadata User.

  • Information Delivery

Penyampaian informasi pada pengguna yang mana terdapat teknik online, infraned serta email.

  • Management and Control

Merupakan pengelolaan serta pengendalian yang ada pada data stagging serta metadata.

Data Warehousing Process Overview Komponen utama proses data warehouse :

  • Data Sources : Data bersumber dari beberapa operasional independen sistem “legacy” dan mungkin juga dari data eksternal provider.
  • Data Extraction : Data diekstrak menggunakan custom-written atau komersial software disebut ETL
  • Data Loading : Data dimuat kedalam staging area dimana data-data tersebut diubah dan dibersihkan.
  • Comprehensive database : Pada dasarnya ini Enterprise Data Warehouse yang mendukung semua keputusan analisis dengan menyediakan ringkasan dan detail informasi dari banyak sumber berbeda.
  • Metadata : Metadata dipelihara sehingga dapat diakses oleh personil dan pengguna IT.
  • Middleware tools : Memungkinkan akses ke data warehouse

Penerapan Data Warehouse

Data warehouse diteraplan pada beberapa perusahaan/bidang berikut ini:
  • Perusahaan Telekomunikasi: untuk mengamati jumlah transaksi yang terjadi
  • Perusahaan Keuangan: mendeteksi transaksi keuangan
  • Perusahaan Asuransi: mengidentifikasi layanan kesehatan, mana yang perlu diberikan asuransi dan mana yang tidak perlu.
  • Bidang Olahraga: menganalisa statistik permainan

Langkah Penerapan Data warehouse

  • Identifikasi sistem & unit bisnis yang membutuhkan integrasi data
  • Menetapkan batasan data dan prioritas data yang dibutuhkan untuk putusan organisasional
  • Menampilkan dan memutuskan berbagai alternatif teknologi basis data yang menerapkan konsep data warehouse
  • Merencanakan pemrosesan dan perancangan standar prosedur operasional implementasi data warehouse.

Arsitektur Data Warehouse

  • Operational database layer : Sumber data untuk data warehouse-Organisasi sistem Enterprise Resource Planning berada pada layer ini.
  • Data access layer : Interface antara akses layer operasional dan informasional- Alat-alat untuk mengekstrak,mengubah dan memuat data kedalam warehouse berada pada layer ini.
  • Metadata layer: Kamus data-Ini biasanya lebih detail daripada sistem operasional kamus data.
  • Informational access layer : Data diakses untuk membuat laporan dan analisis dan alat –alat untuk pelaporan dan analisis data.Disebut juga datamart. Business intelligence tools berada pada layer ini.

Perbedaan Data Warehouse dan Data Mining

Teknologi data warehouse digunakan untuk melakukan OLAP (On-line Analytical Processing) , sedangkan data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst (dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang mempengaruhi data mining.

jika belum mengetahui apa itu Data Mining Silahkan baca rangkuman data minning

You Might Also Like:

Share this: