Oleh: Pandu Dwi Luhur Pambudi, S.Kom., M.Kom., M.I.M (Faculty Member PJJ CS)
Dosen BINUS Online Computer Science

Data Science bukan sekadar coding dan analisis data. Di balik model yang canggih, terdapat dasar matematika yang kuat. Untuk memahami bagaimana algoritma bekerja, kita perlu memahami konsep matematika yang mendasarinya.

Di bawah ini, kami merangkum 25 definisi matematika paling penting dalam Data Science. Beberapa istilah mungkin sudah Anda kenal, seperti Gradient Descent, Normal Distribution, Sigmoid, Correlation, Cosine Similarity, Naive Bayes, F1 Score, ReLU, Softmax, MSE, MSE + L2 Regularization, K-Means, Linear Regression, SVM, dan Log Loss.

Namun, bagaimana dengan istilah berikut? Mari kita bahas lebih lanjut!

1. Maximum Likelihood Estimation (MLE)

MLE adalah metode statistik yang digunakan untuk memperkirakan parameter model dengan memaksimalkan kemungkinan data yang diamati.

2. Z-score

Z-score mengukur seberapa jauh suatu data dari rata-rata dalam satuan standar deviasi. Digunakan dalam normalisasi data dan deteksi outlier.

3. Ordinary Least Squares (OLS)

OLS adalah solusi tertutup untuk regresi linear yang diperoleh menggunakan metode MLE.

4. Entropy

Konsep dalam teori informasi yang mengukur ketidakpastian atau kebingungan dalam suatu variabel acak. Sering digunakan dalam algoritma Decision Tree dan t-SNE.

5. Eigen Vectors

Vektor yang tidak berubah arah setelah transformasi linear. Dalam Principal Component Analysis (PCA), eigenvektor dari matriks kovarians digunakan untuk mengidentifikasi dimensi utama dalam data.

6. R-Squared (R²)

Digunakan dalam regresi untuk mengukur seberapa baik model menjelaskan variabilitas dalam data. Semakin tinggi R², semakin baik model dalam menjelaskan data.

7. KL Divergence

Mengukur seberapa besar informasi yang hilang ketika satu distribusi digunakan untuk mendekati distribusi lain. Sering digunakan sebagai fungsi loss dalam t-SNE.

8. Singular Value Decomposition (SVD)

Teknik dekomposisi matriks yang mendasar dalam aljabar linear. Digunakan dalam berbagai aplikasi, seperti reduksi dimensi dan kompresi data.

9. Lagrange Multipliers

Teknik optimasi matematika untuk menyelesaikan masalah dengan batasan. Contoh penerapannya adalah dalam derivasi PCA, di mana kita ingin memaksimalkan variansi dengan batasan panjang vektor.

Mengapa Ini Penting?

Memahami dasar matematika dalam Data Science sangatlah penting untuk: ✅ Memahami bagaimana algoritma bekerja di balik layar. ✅ Menyesuaikan model agar lebih akurat. ✅ Mengembangkan algoritma baru yang lebih efisien.

Apakah Anda sudah mengenal semua konsep ini? Atau masih ada yang terdengar asing? Tulis di kolom komentar! 📩🔥

#DataScience #MachineLearning #Mathematics #AI #DeepLearning

 

Penulis: Pandu Dwi Luhur Pambudi (with the help of AI)

Gambar dan Reference: blog.dailydoseofDS.com