Friday, October 28, 2011

OLAP (Online Analitical Processing)

OLAP (Online Analitical Processing)

Berikut adalah beberapa penjelasan mengenai OLAP dan komponen2nya... :D


OLAP

OLAP (Online Analitical Processing) adalah suatu jenis pemrosesan yang memanipulasi dan menganalisa data bervolume besar dari berbagai perspektif (multidimensi) secara kompleks.

Multidimensional
Adalah sekumpulan data yang bisa dilihat dari sudut pandang yang berbeda. Data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran.

Contoh Multidimensional
Contoh : penjualan buku dapat dilihat dari segi lokasi Buku, waktu, lokasi penjualan / toko dan sebagainya.
Contoh lain : mendapatkan informasi rata2 nilai penalaran verbal dan matematika dilihat dari segi propinsi asal sekolah, tempat pendaftaran, jenis kelamin, pekerjaan orang tua dan sebagainya.

Visualisasi dari OLAP berupa cube dengan masing2 atribut yang berbeda pada panjang, lebar dan tinggi cube.

gambar1. cube

Fact Tabel
Fact tabel merupakan tabel utama dari cube. Cube sendiri menggabungkan beberapa dimensi tabel (akan dibahas selanjutnya). Fact tabel berasal dari data transaksi dari gudang datanya. Fact tabel mempunyai dua tipe kolom, yaitu kolom yang menyimpan nilai-nilai numeric atau yang biasa disebut dengan measure dan kolom yang menyimpan foreign key yang mengacu ke tabel lainnya (dimensi tabel).
Syarat fact tabel yaitu terdapat kumpulan key dari dimensi tabel dan variabel yang akan diukur.

Dimensi tabel
Dimensi tabel adalah tabel yang berelasi dengan fact tabel. Cara mendapatkan isi dimensi tabel yaitu dengan mengetahui entitas dari suatu pencarian (misalnya penjualan atau informasi rata2 nilai)

Contoh kasus 1 :

Ingin diperoleh jumlah penjualan buku pada suatu waktu


Penyelesaian :
Fact tabel         :    tabel penjualan
Dimensi tabel :    waktu (tabel Waktu, PK : idWaktu),
buku (tabel Buku; PK : idBuku),
pengarang(tabel Pengarang; PK : idPengarang),
toko (tabel Toko; PK : idToko)

Contoh kasus 2 :

Ingin diperoleh info mengenai rata2 nilai penalaran verbal dan matematika tes penerimaan mahasiswa baru SMU Sleman yang mendaftar di Paingan, berjenis kelamin wanita, pekerjaan orang tuanya dosen


Penyelesaian :
Fact tabel                 :    data2 dari calon mahasiswa
Dimensi tabel           :    propinsi asal SMU (tabel propinsi, PK : idProp),
                                 tempat pendaftaran (tabel lokasiPendaftaran; PK : idLokasi),
                                 jenis kelamin(tabel jenisKelamin; PK : idJenisKelamin),
                                 pekerjaan orang tua (tabel pekerjaanOrtu; PK : idPekerjaanOrtu)

Measure                   :    avg penalaran verbal & matematika

gambar2. fact tabel dan dimensi tabel

Permodelan Data Multidimensional

Star schema
Star schema : terdapat satu tabel fakta dan beberapa tabel dimensi.

gambar3. star schema

Karakteristik dari model ini adalah :
o  Pusat dari star disebut fact tabel
o  Fact tabel mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel dimensi
o  Setiap tabel dimensi berelasi langsung dengan fact tabel
o  Dimensi tabel berisikan data tentang informasi atau waktu
o  Relasi antara fact tabel dengan dimensi-dimensinya adalah 1 – N (one to many)
o  Primary key pada dimensi tabel akan menjadi key pada fact tabel atau dapat dikatakan bahwa fact tabel memiliki kombinasi key dari dimensi tabel tersebut

Snowflake Scheme
Snowflake Scheme merupakan pengembangan dari star schema. Perbedaannya terletak pada normalisasi data dan jumlah tabel. Dimensi tabel dinormalisasi secara sebagian atau keseluruhan untuk mengurangi nilai duplikat pada tabel.

gambar4. snowflakes schema
Keuntungan menggunakan model snowflake adalah :
o  Pemakain space yang lebih sedikit
o  Update dan maintenance yang lebih mudah

Sedangkan kerugian menggunakan model ini yaitu :
o  Model lebih komplek dan rumit
o  Proses query lebih lambat
o  Performance yang kurang bagus