Pentaho Data Integration part I


Alhamdulillah, akhirnya dapat mengikuti pelatihan pentaho. Pentaho sendiri ternyata cukup luas, dan saya mengambil satu pelatihan yang menurut saya cukup penting, yaitu data integration. Sebelumnya saya mengenal Pentaho dari otodidak karena ada pekerjaan yang menggunakan Pentaho. Namun, di pelatihan ini, saya dapat mengetahui PDI (Pentaho Data Integration) secara lebih mendalam. Sebuah tools open source yang kaya fungsi😀

Sekilas tentang data integration. Dalam enterprise atau korporat biasanya memiliki banyak aplikasi yang platformnnya belum tentu sama satu dengan yang lain. Mungkin ada aplikasi yang menggunakan MySql sebagai DBMSnya, atau juga DBMS yang lain (Oracle, Postgre, SQLServer). Di saat yang sama, manajemen atau eksekutif meminta report/dashboard untuk melihat KPI (key performance indicator) yang biasanya data-datanya tersebar di beberapa aplikasi. Nah, di sini PDI berperan untuk mengintegrasikan data yang tersebar, lalu menggudangkan (datawarehousing) ke dalam gudang data (datawarehouse).

Kita dapat merancang aliran, transformasi data, alur lojik dengan aplikasi GUI dari PDI, yaitu Spoon. Kita ekstrak data dari datasource, lalu kita olah/transform ke bentuk yang kita inginkan, dan akhirnya kita tempatkan pada sebuah datawarehouse. Di datawarehouse ini kita bisa distribusikan lagi ke datamart-datamart. Datamart adalah database yang berisi data dari datawarehouse yang sudah diklasifikasikan menurut jenis/bidang/lingkup yang didefinisikan. Misalkan, datamart untuk bagian keuangan. Di datamart tersebut berisi tabel-tabel yang berkaitan dengan bagian keuangan.

Datawarehouse/datamart tersebut jika ingin dioptimalkan sebagai sumber data bagi report atau dashboard, maka harus dalam model multidimensi, yang populer adalah skema bintang. Dalam skema bintang, kita membagi menjadi Dimensi dan Measure. Dimensi adalah field yang tidak bisa diukur, sedangkan measure adalah field yang bisa diukur. Contoh untuk dimensi adalah nama_cabang, contoh untuk measure adalah jumlah_transaksi. Jadi intinya, dengan PDI, kita dapat mengolah data, mengintegrasikan data, memanipulasi data, membentuk skema bintang, dan banyak lagi. Yang hasilnya dapat diolah dengan OLAP, ataupun dikeluarkan dalam bentuk report atau dashboard (dengan tools yang lain tentunya)

Untuk instalasi, dan sedikit tutorial akan dipost  di lain kesempatan ya saudara-saudara🙂

Comments
4 Responses to “Pentaho Data Integration part I”
  1. Irfan says:

    gan, mau tanya nich… ak terrtarik workshop BI pentaho, dimana y??? makasih salam kenal

    • faqih says:

      Hi Irfan,

      trainingnya bisa di phi integration, salah satu perusahaan yang punya core business BI. Mereka juga mengadakan pelatihan Pentaho community edition. Direkturnya bernama Pa Feris, beliau asik. join di mailing list pentaho ID untuk saling share ilmu BI nya🙂

  2. bimojoe says:

    halo.. kalo ngajar pentaho datawarehouse mau ga mas? tks

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: