Course: Data Analytics di Asia Tenggara: Difference between revisions
| Line 247: | Line 247: | ||
Setidaknya ada 5 langkah utama yang terlibat dalam analisis data. | Setidaknya ada 5 langkah utama yang terlibat dalam analisis data. | ||
[[File:Course RevoU Data Analytics 180647.png|center|thumb]] | |||
=== Definisi masalah dan \hipotesis === | |||
Data analytics tidaklah melulu tentang coding. | |||
Untuk melakukan analisis, pertama-tama tentu kamu perlu mendefinisikan masalah yang ada. | |||
Ini bisa menjadi jebakan atau perangkap bagi banyak data analyst. | |||
Hal ini membutuhkan ''analytical thinking'' dan ''problem solving'', menafsirkan ''requirement'' bisnis untuk memandu menganalisis data, dan mulai merancang proyek data mu. | |||
Kamu memerlukan dokumentasi yang tepat; banyak yang menyebutnya PRD (Project Requirement Document). Amazon mempunyai gaya "narasi" untuk memandu proyek dan menentukan goal. | |||
Amazon menggunakan narasi yang terdiri dari: | |||
* Tujuan | |||
* Latar belakang | |||
* Hipotesa | |||
* Detail Inisiatif | |||
Termasuk semua stakeholder dan proses yang terlibat. | |||
Dengan cara ini, kamu bisa menghubungkan obyektif bisnis dengan analisis data. | |||
For example, if you are building a new product, you do not have the data yet. | |||
Which is why you need to conduct experiments to test the beta version of a product to different customers. | |||
You need to do random sampling, but you need to make sure the sample is representative to the customers that you are targeting. | |||
You can design the experiment to test different things, A/B Testing by changing colors or UX of the product. | |||
The data can be qualitative such as interview results, or it can be quantitative, like the NPS (Net Promoter Score). | |||
Conducting analysis for these experiments or hypothesis testing is also something that will be learned during the weeks in the RevoU data analytics program. | |||
=== Pengumpulan data === | |||
Kedua, setelah tujuan dan latar belakang yang jelas telah teridentifikasi dari ''problem statement'', kamu perlu menentukan data apa yang akan dikumpulkan untuk memecahkan masalah. | |||
Data tersebut mungkin sudah ada atau mungkin perlu kamu cari dari data sekunder atau wawancara. Data tidak selalu kuantitatif; bisa juga kualitatif. | |||
Aturan praktisnya adalah mempunyai setidaknya dua atau lebih sumber (dan pastikan datanya valid). | |||
Kamu tidak ingin hanya mengandalkan satu dasar karena kamu perlu memvalidasi. | |||
Dalam beberapa kasus, kalau datanya belum ada, kamu perlu ''membuat eksperimen'' untuk mendapatkan data tersebut. | |||
Untuk melakukan eksperimen, kamu perlu menentukan pertanyaan bisnis, membuat hipotesis, dan menentukan bagaimana kamu akan menguji dan mendapatkan data. | |||
Biasanya, bagian ini dilakukan oleh tim ''growth project'' di sebuah perusahaan. | |||
Misalnya, kalau kamu sedang membuat produk baru, kamu belum mempunyai data. | |||
Itulah sebabnya kamu perlu melakukan eksperimen untuk menguji versi beta suatu produk ke pelanggan yang berbeda. | |||
Kamu perlu melakukan pengambilan sampel secara acak, tetapi juga perlu memastikan sampel tersebut mewakili pelanggan yang kamu targetkan atau tidak. | |||
Kamu dapat merancang eksperimen untuk menguji berbagai hal, A/B testing dengan mengubah warna atau UX (User Experience) produk. | |||
Datanya bisa kualitatif seperti hasil wawancara, atau bisa juga kuantitatif seperti NPS (Net Promoter Score). | |||
Melakukan analisis untuk eksperimen atau pengujian hipotesis ini juga merupakan sesuatu yang akan dipelajari selama berminggu-minggu dalam program Data Analytics RevoU. | |||
=== Persiapan & transformasi data === | |||
Kemudian, setelah kumpulan data tersebut siap, kamu perlu mempersiapkannya sebelum melakukan analisis. | |||
Apa artinya "menyiapkan data"? | |||
Yah, tidak semua kumpulan data itu sudah ideal untuk kamu. | |||
Beberapa titik data akan lebih jauh dari rata-rata; ada 'outliers'. | |||
Ini berbeda dari data yang ada. | |||
Untuk melakukan ini, kamu perlu mempunyai indikator statistik, seperti mean (rata-rata) dan standar deviasi. | |||