Course: Data Analytics di Asia Tenggara: Difference between revisions

Line 247: Line 247:


Setidaknya ada 5 langkah utama yang terlibat dalam analisis data.
Setidaknya ada 5 langkah utama yang terlibat dalam analisis data.
[[File:Course RevoU Data Analytics 180647.png|center|thumb]]
=== Definisi masalah dan \hipotesis ===
Data analytics tidaklah melulu tentang coding.
Untuk melakukan analisis, pertama-tama tentu kamu perlu mendefinisikan masalah yang ada.
Ini bisa menjadi jebakan atau perangkap bagi banyak data analyst.
Hal ini membutuhkan ''analytical thinking'' dan ''problem solving'', menafsirkan ''requirement'' bisnis untuk memandu menganalisis data, dan mulai merancang proyek data mu.
Kamu memerlukan dokumentasi yang tepat; banyak yang menyebutnya PRD (Project Requirement Document). Amazon mempunyai gaya "narasi" untuk memandu proyek dan menentukan goal.
Amazon menggunakan narasi yang terdiri dari:
* Tujuan
* Latar belakang
* Hipotesa
* Detail Inisiatif
Termasuk semua stakeholder dan proses yang terlibat.
Dengan cara ini, kamu bisa menghubungkan obyektif bisnis dengan analisis data.
For example, if you are building a new product, you do not have the data yet.
Which is why you need to conduct experiments to test the beta version of a product to different customers.
You need to do random sampling, but you need to make sure the sample is representative to the customers that you are targeting.
You can design the experiment to test different things, A/B  Testing by changing colors or UX of the product.
The data can be qualitative such as interview results, or it can be quantitative, like the NPS (Net Promoter Score).
Conducting analysis for these experiments or hypothesis testing is also something that will be learned during the weeks in the RevoU data analytics program.
=== Pengumpulan data ===
Kedua, setelah tujuan dan latar belakang yang jelas telah teridentifikasi dari ''problem statement'', kamu perlu menentukan data apa yang akan dikumpulkan untuk memecahkan masalah.
Data tersebut mungkin sudah ada atau mungkin perlu kamu cari dari data sekunder atau wawancara. Data tidak selalu kuantitatif; bisa juga kualitatif.
Aturan praktisnya adalah mempunyai setidaknya dua atau lebih sumber (dan pastikan datanya valid).
Kamu tidak ingin hanya mengandalkan satu dasar karena kamu perlu memvalidasi.
Dalam beberapa kasus, kalau datanya belum ada, kamu perlu ''membuat eksperimen'' untuk mendapatkan data tersebut.
Untuk melakukan eksperimen, kamu perlu menentukan pertanyaan bisnis, membuat hipotesis, dan menentukan bagaimana kamu akan menguji dan mendapatkan data.
Biasanya, bagian ini dilakukan oleh tim ''growth project'' di sebuah perusahaan.
Misalnya, kalau kamu sedang membuat produk baru, kamu belum mempunyai data.
Itulah sebabnya kamu perlu melakukan eksperimen untuk menguji versi beta suatu produk ke pelanggan yang berbeda.
Kamu perlu melakukan pengambilan sampel secara acak, tetapi juga perlu memastikan sampel tersebut mewakili pelanggan yang kamu targetkan atau tidak.
Kamu dapat merancang eksperimen untuk menguji berbagai hal, A/B testing dengan mengubah warna atau UX (User Experience) produk.
Datanya bisa kualitatif seperti hasil wawancara, atau bisa juga kuantitatif seperti NPS (Net Promoter Score).
Melakukan analisis untuk eksperimen atau pengujian hipotesis ini juga merupakan sesuatu yang akan dipelajari selama berminggu-minggu dalam program Data Analytics RevoU.
=== Persiapan & transformasi data ===
Kemudian, setelah kumpulan data tersebut siap, kamu perlu mempersiapkannya sebelum melakukan analisis.
Apa artinya "menyiapkan data"?
Yah, tidak semua kumpulan data itu sudah ideal untuk kamu.
Beberapa titik data akan lebih jauh dari rata-rata; ada 'outliers'.
Ini berbeda dari data yang ada.
Untuk melakukan ini, kamu perlu mempunyai indikator statistik, seperti mean (rata-rata) dan standar deviasi.