Catatan Belajar Data Analytics Part 2

Catatan Belajar Data Analytics Part 2

E. Materi Matematika Dasar
Beberapa judul materi matematika dasar yang paling dibutuhkan untuk data analisis:

Statistika dasar: materi ini mencakup konsep-konsep dasar seperti rata-rata, median, modus, deviasi standar, distribusi, dan pengujian hipotesis.

Aljabar linear: materi ini mencakup konsep-konsep dasar seperti matriks, determinan, vektor, dan operasi matriks.

Kalkulus: materi ini mencakup konsep-konsep dasar seperti turunan, integral, dan fungsi.

Teori probabilitas: materi ini mencakup konsep-konsep dasar seperti probabilitas diskrit dan kontinu, distribusi probabilitas, dan probabilitas bersyarat.

Regresi linear: materi ini mencakup konsep-konsep dasar tentang model regresi linear sederhana dan ganda.

Teori graf: materi ini mencakup konsep-konsep dasar tentang graf, seperti struktur graf, jaringan, dan analisis jaringan.

Penguasaan atas materi-materi di atas dapat membantu seorang data analis memahami dan menerapkan teknik dan metode analisis data dengan lebih baik. Namun demikian, materi-materi ini hanya sebagian kecil dari keahlian yang diperlukan untuk menjadi seorang data analis yang sukses. Kemampuan berpikir kritis, kemampuan komunikasi yang baik, dan keahlian teknis seperti penggunaan perangkat lunak analisis data juga sangat penting.

F. Materi statistika dasar yang paling dibutuhkan untuk analisis data 

Konsep dasar statistika: materi ini mencakup definisi konsep dasar statistika seperti rata-rata, median, modus, deviasi standar, varian, kuartil, persentil, dan distribusi data.

Probabilitas dan distribusi: materi ini mencakup konsep probabilitas seperti probabilitas diskrit dan kontinu, distribusi probabilitas, dan distribusi normal.

Pengujian hipotesis: materi ini mencakup teknik pengujian hipotesis dan p-value, serta jenis-jenis pengujian hipotesis seperti uji t, uji z, dan ANOVA.

Regresi dan korelasi: materi ini mencakup teknik analisis regresi sederhana dan berganda, serta korelasi antara variabel-variabel.

Analisis varians (ANOVA): materi ini mencakup teknik analisis variasi data dalam kelompok-kelompok yang berbeda.

Analisis regresi logistik: materi ini mencakup teknik analisis data kategorikal dan non-linier, serta analisis faktor.

Penguasaan atas materi-materi di atas dapat membantu seorang data analis memahami dan menerapkan teknik dan metode analisis data dengan lebih baik. Namun demikian, materi-materi ini hanya sebagian kecil dari keahlian yang diperlukan untuk menjadi seorang data analis yang sukses. Kemampuan berpikir kritis, kemampuan komunikasi yang baik, dan keahlian teknis seperti penggunaan perangkat lunak analisis data juga sangat penting.

G. Excel

Excel adalah program spreadsheet atau lembar kerja elektronik yang digunakan untuk mengorganisir, menghitung, dan menganalisis data secara efektif. Excel adalah salah satu program komputer yang paling populer di dunia dan digunakan di berbagai bidang, termasuk bisnis, keuangan, ilmu pengetahuan, dan teknologi.

Excel menyediakan berbagai fitur untuk memanipulasi data, seperti:

Penghitungan: Excel menyediakan berbagai rumus dan fungsi untuk melakukan penghitungan dan analisis data, seperti SUM, AVERAGE, COUNT, dan lainnya.

Grafik dan Diagram: Excel memungkinkan pengguna untuk membuat grafik dan diagram untuk membantu visualisasi data.

Format dan Tampilan: Excel memungkinkan pengguna untuk memformat data dengan berbagai cara, termasuk menambahkan warna, huruf tebal, dan tampilan tabel yang berbeda.

Filter dan Sorting: Excel memungkinkan pengguna untuk memfilter dan mengurutkan data dengan cepat dan mudah.

PivotTables: Excel menyediakan fitur PivotTable yang memungkinkan pengguna untuk menganalisis data dalam format yang berbeda.

H. PivotTable 
PivotTable adalah salah satu fitur yang sangat berguna dalam Excel yang memungkinkan pengguna untuk menganalisis data dengan mudah. 

Berikut adalah cara menggunakan PivotTable di Excel:

Persiapkan data: Pastikan bahwa data Anda terstruktur dengan benar dan telah diatur dalam bentuk tabel.

Pilih sel di dalam tabel: Klik pada sel di dalam tabel yang akan digunakan sebagai sumber data PivotTable.

Buat PivotTable: Pilih menu "Insert" pada menu bar di atas lembar kerja Excel, kemudian pilih "PivotTable". Kemudian, pilih lokasi di mana Anda ingin menempatkan PivotTable, seperti "New Worksheet" atau "Existing Worksheet".

Tentukan field sumber data: Pilih field sumber data yang ingin digunakan dalam PivotTable dari daftar field yang tersedia.

Tentukan field untuk baris, kolom, dan nilai: Pilih field yang ingin Anda gunakan untuk baris, kolom, dan nilai dari daftar field yang tersedia dan seret ke dalam area yang sesuai.

Tentukan nilai agregat: Tentukan nilai yang ingin Anda agregasikan, seperti jumlah, rata-rata, atau maksimum, dengan mengklik pada nama field dan memilih fungsi agregat yang diinginkan dari menu drop-down.

Atur tampilan PivotTable: Sesuaikan tampilan PivotTable dengan menambahkan atau menghapus field, mengubah tampilan, atau menyesuaikan pengaturan lainnya.

Setelah selesai, kita dapat menggunakan PivotTable untuk menganalisis data dan mendapatkan wawasan baru dari informasi yang tersembunyi di dalam data. PivotTable juga memungkinkan kita untuk menampilkan data dengan cara yang berbeda, sehingga memudahkan untuk melihat pola dan tren yang mungkin tidak terlihat jika hanya melihat data mentah.

I. Rumus-rumus yang digunakan di excel

Berikut adalah beberapa rumus penting yang sering digunakan di Excel:

SUM: Menjumlahkan sel atau rentang sel.
Contoh penggunaan: =SUM(A1:A5)

AVERAGE: Menghitung rata-rata dari sel atau rentang sel.
Contoh penggunaan: =AVERAGE(A1:A5)

COUNT: Menghitung jumlah sel yang mengandung angka atau teks.
Contoh penggunaan: =COUNT(A1:A5)

MAX: Mengembalikan nilai terbesar dari sel atau rentang sel.
Contoh penggunaan: =MAX(A1:A5)

MIN: Mengembalikan nilai terkecil dari sel atau rentang sel.
Contoh penggunaan: =MIN(A1:A5)

IF: Menjalankan tes logika dan memberikan hasil yang berbeda tergantung pada hasil tes.
Contoh penggunaan: =IF(A1>10,"Lulus","Tidak Lulus")

VLOOKUP: Mencari nilai dalam tabel dan mengembalikan nilai terkait dari kolom yang ditentukan.
Contoh penggunaan: =VLOOKUP(A1,Table1,2,FALSE)

CONCATENATE: Menggabungkan teks dari beberapa sel menjadi satu sel.
Contoh penggunaan: =CONCATENATE(A1," ",B1)

DATE: Mengembalikan nilai tanggal berdasarkan tanggal, bulan, dan tahun yang ditentukan.
Contoh penggunaan: =DATE(2022,2,24)

ROUND: Membulatkan nilai ke angka desimal tertentu.
Contoh penggunaan: =ROUND(A1,2)

SUMIF: Menjumlahkan sel dalam rentang yang memenuhi kriteria tertentu.
Contoh penggunaan: =SUMIF(A1:A5,">10")

COUNTIF: Menghitung jumlah sel dalam rentang yang memenuhi kriteria tertentu.
Contoh penggunaan: =COUNTIF(A1:A5,"A")

AVERAGEIF: Menghitung rata-rata sel dalam rentang yang memenuhi kriteria tertentu.
Contoh penggunaan: =AVERAGEIF(A1:A5,">10")

IFERROR: Menampilkan nilai alternatif jika rumus menghasilkan kesalahan.
Contoh penggunaan: =IFERROR(A1/B1,"N/A")

INDEX: Mengambil nilai sel dari rentang yang ditentukan oleh nomor baris dan kolom.
Contoh penggunaan: =INDEX(A1:C5,3,2)

MATCH: Mencari nilai dalam rentang dan mengembalikan nomor baris atau kolom di mana nilai tersebut ditemukan.
Contoh penggunaan: =MATCH("Apple",A1:A5,0)

LEFT: Mengambil sejumlah karakter tertentu dari awal teks dalam sel.
Contoh penggunaan: =LEFT(A1,5)

RIGHT: Mengambil sejumlah karakter tertentu dari akhir teks dalam sel.
Contoh penggunaan: =RIGHT(A1,3)

MID: Mengambil sejumlah karakter tertentu dari tengah teks dalam sel.
Contoh penggunaan: =MID(A1,3,5)

ROUNDUP: Membulatkan nilai ke atas ke angka desimal tertentu.
Contoh penggunaan: =ROUNDUP(A1,2)

Dalam pengolahan data, penting untuk memahami banyak rumus dan fungsi yang tersedia di Excel untuk membantu menghasilkan analisis yang akurat dan tepat waktu.

J. Data visualization

Data visualization adalah teknik untuk mengkomunikasikan data dan informasi melalui penggunaan visualisasi seperti grafik, diagram, peta, dan visualisasi lainnya. Tujuannya adalah untuk memperjelas dan menyederhanakan informasi yang kompleks dan membantu orang memahami data dengan lebih mudah dan cepat.

Data visualization dapat membantu dalam pengambilan keputusan bisnis dengan memudahkan dalam melihat pola dan tren yang muncul dalam data. Ini juga dapat membantu dalam mengidentifikasi anomali atau tren yang tidak biasa, serta memahami hubungan antara berbagai faktor dalam suatu masalah.

Beberapa jenis visualisasi data yang umum digunakan termasuk:

Grafik garis: Merepresentasikan data numerik dalam bentuk garis dan digunakan untuk menunjukkan tren dan pola dari data seiring waktu.

Diagram batang: Menggunakan batang vertikal atau horizontal untuk membandingkan data kategori yang berbeda.

Diagram lingkaran: Merepresentasikan data numerik dalam bentuk persentase dari lingkaran.

Heatmap: Mewakili data numerik dengan menggunakan warna untuk menunjukkan tingkat intensitas data.

Peta: Digunakan untuk menunjukkan data geografis dan spasial, seperti lokasi pelanggan atau penjualan di suatu wilayah.

Pemilihan visualisasi yang tepat sangat penting untuk memastikan informasi yang disampaikan dapat dimengerti dan efektif. Keterampilan dalam memvisualisasikan data dapat membantu para profesional dan pengambil keputusan dalam memahami dan menganalisis data dengan lebih efektif.

K. Heatmap
Heatmap adalah teknik visualisasi data yang menggunakan warna untuk menunjukkan nilai atau intensitas data dalam format tabel. Warna yang dipilih biasanya melambangkan rentang nilai tertentu, di mana warna terang mewakili nilai yang lebih tinggi dan warna yang lebih gelap mewakili nilai yang lebih rendah.

Heatmap sangat berguna ketika bekerja dengan data kuantitatif yang kompleks, seperti data waktu atau data spasial, di mana informasi yang dikandung dalam setiap sel data sangat banyak. Ketika digunakan dengan benar, heatmap dapat membantu pengguna dengan cepat mengidentifikasi pola dan tren dalam data serta menyoroti anomali atau titik data yang penting.

Beberapa contoh penggunaan heatmap dalam analisis data meliputi:

Pemetaan geografis data seperti penjualan, suhu atau populasi.

Analisis hubungan antara variabel dengan mengidentifikasi korelasi positif atau negatif.

Pemantauan kinerja atau aktivitas dengan mengidentifikasi titik-titik waktu atau lokasi dengan tingkat aktivitas yang lebih tinggi.

Dalam Excel, untuk membuat heatmap, kita dapat menggunakan Conditional Formatting atau PivotTable. Dalam Python, library visualisasi data seperti Seaborn dan Matplotlib juga menyediakan fungsionalitas untuk membuat heatmap.

L. Aplikasi yang bisa digunakan untuk membuat peta data

Berikut adalah beberapa aplikasi yang bisa digunakan untuk membuat peta data:

QGIS: QGIS adalah software pemetaan open-source yang memiliki banyak fitur pemetaan dan analisis data. Aplikasi ini dapat digunakan untuk membuat peta statis atau interaktif.

ArcGIS: ArcGIS adalah aplikasi pemetaan yang sangat populer dan digunakan secara luas di seluruh dunia. Aplikasi ini menawarkan berbagai macam fitur pemetaan dan analisis data, termasuk pemetaan tematik dan peta interaktif.

Tableau: Tableau adalah software visualisasi data yang menyediakan fitur untuk membuat peta data interaktif dengan cepat dan mudah. Aplikasi ini juga menyediakan integrasi dengan banyak sumber data.

Google Maps: Google Maps adalah aplikasi pemetaan online yang menyediakan banyak fitur pemetaan dan analisis data. Aplikasi ini dapat digunakan untuk membuat peta interaktif dan dapat diakses dari berbagai perangkat.

Mapbox: Mapbox adalah platform pemetaan dan lokasi yang menyediakan berbagai macam fitur pemetaan dan analisis data. Aplikasi ini memungkinkan pengguna untuk membuat peta interaktif yang dapat disesuaikan dengan mudah.

M. Tableau

Tableau adalah software visualisasi data yang sangat populer dan banyak digunakan di berbagai industri untuk mengolah, menganalisis, dan memvisualisasikan data dengan cara yang intuitif dan efektif. Dengan Tableau, pengguna dapat menggabungkan berbagai sumber data, termasuk data berbasis file, database, dan sumber data online seperti Google Analytics, Salesforce, dan lain-lain.

Tableau menawarkan antarmuka drag-and-drop yang mudah digunakan, yang memungkinkan pengguna untuk memvisualisasikan data dengan cepat dan efektif. Beberapa jenis visualisasi yang dapat dibuat dengan Tableau meliputi bar chart, line chart, pie chart, heat map, scatter plot, dan masih banyak lagi.

Selain itu, Tableau juga menawarkan berbagai fitur analisis data dan kemampuan prediktif yang memungkinkan pengguna untuk menemukan pola dan tren dalam data, serta membuat model prediksi. Tableau juga menyediakan fitur kolaborasi yang memungkinkan pengguna untuk berbagi dan bekerja sama pada proyek secara online.

Tableau tersedia dalam dua varian: Tableau Desktop dan Tableau Server. Tableau Desktop merupakan aplikasi desktop yang dapat digunakan untuk membuat dan menganalisis visualisasi data. Sedangkan Tableau Server adalah platform web yang memungkinkan pengguna untuk berbagi visualisasi data secara online dengan pengguna lain dalam organisasi.

Tableau juga menyediakan berbagai sumber daya dan dukungan untuk membantu pengguna mempelajari dan mengoptimalkan penggunaan software ini, seperti tutorial online, forum pengguna, dan kelas pelatihan.

N. Cara menggunakan tableau

Berikut adalah beberapa langkah dasar untuk menggunakan Tableau:

Memuat data: Buka Tableau dan mulai dengan memuat data ke dalam software. Data dapat berasal dari berbagai sumber, seperti file Excel atau database.

Membuat lembar kerja: Setelah data dimuat, buat lembar kerja baru dengan mengeklik ikon lembar kerja di bagian bawah antarmuka pengguna. Kemudian, seret dan lepaskan bidang data ke dalam lembar kerja untuk membuat visualisasi data.

Memilih jenis visualisasi: Pilih jenis visualisasi yang ingin dibuat, seperti bar chart, line chart, pie chart, atau scatter plot. Tableau juga menyediakan jenis visualisasi yang lebih kompleks, seperti heat map, tree map, dan bubble chart.

Menyesuaikan visualisasi: Sesuaikan visualisasi dengan menambahkan label, dimensi, atau mengubah skala sumbu. Anda juga dapat menambahkan filter untuk membantu mengeksplorasi data dengan lebih efektif.

Menyimpan dan berbagi: Setelah visualisasi selesai dibuat, simpan lembar kerja sebagai file dan bagikan dengan orang lain melalui email atau platform kolaborasi lainnya.

Selain langkah-langkah dasar tersebut, Tableau juga memiliki fitur-fitur lanjutan seperti kemampuan analisis prediktif dan kemampuan kolaborasi dengan pengguna lain dalam organisasi. Untuk mempelajari lebih lanjut tentang penggunaan Tableau, kita dapat mengakses tutorial online atau mengikuti pelatihan resmi yang disediakan oleh Tableau.

Komentar

Postingan populer dari blog ini

Belajar Menjadi Blogger