PCA mengambil kumpulan data dengan beberapa variabel sebagai input, dan menghasilkan kumpulan data ke dalam subruang yang lebih rendah, yaitu kumpulan data yang dikurangi dengan variabel yang lebih sedikit. Ini sering digunakan dalam analisis data eksplorasi untuk membangun model prediktif, tetapi j...
Apa itu vektor? Vektor adalah subset daritensor, yang dalammachine learning (ML)adalah istilah umum untuk sekelompok angka—atau pengelompokan kelompok angka—dalam ruangn-dimensi. Tensor berfungsi sebagai perangkat pembukuan matematika untuk data. Bekerja dari elemen terkecil: ...
data pelatihan berlabel; namun, seperti model pembelajaran yang diawasi - dan tidak seperti kebanyakan contoh pembelajaran tanpa pengawasan - penyandi otomatis memiliki kebenaran dasar untuk mengukur keluarannya: masukan asli itu sendiri (atau versi modifikasi dari masukan tersebut). Oleh karena itu, ...
data melalui proses yang dikenal sebagaiExtract, Transform, and Load (ETL) atau proses yang dikenal sebagai Extract, Load, and Transform (ELT). Bagi sebagian besar organisasi yang menggunakan ETL, prosesnya mengandalkan otomatisasi, dan efisien, terdefinisi dengan baik, kontinu, dan berbasis ...
Penyematan kata menangkap hubungan semantik antara kata-kata, memungkinkan model untuk memahami dan merepresentasikan kata-kata dalam ruang vektor kontinu tempat kata-kata yang mirip berdekatan satu sama lain. Representasi semantik ini memungkinkan pemahaman bahasa yang lebih spesifik. ...
Dalam terminologi statistik, “bukti” dalam “batas bawah bukti” mengacu padap(x), data input yang dapat diamati yang tampaknya perlu direkonstruksi oleh VAE. Variabel yang dapat diamati dalam data input itu adalah "bukti" untuk variabel laten yang ditemukan oleh autoencoder. “Batas bawah...
(kadang-kadang disebut matriks peringkat pengguna). Di sini, pengguna diwakili dalam baris dan item dalam kolom. Dalam matriksRij, nilai yang diberikan mewakili perilaku penggunauterhadap itemi. Nilai-nilai ini dapat berupa angka kontinu yang diberikan oleh pengguna (misalnya peringkat) atau ...
Support vector regression (SVR) adalah perluasan dari SVM, yang diterapkan pada masalah regression (yaitu hasil yang bersifat kontinu). Mirip dengan SVM linier, SVR menemukan hyperplane dengan margin maksimum di antara titik-titik data, dan biasanya digunakan untuk prediksi deret waktu. ...
Gaussian Naïve Bayes (GaussianNB): Ini adalah varian dari pengklasifikasi Naïve Bayes, yang digunakan dengan distribusi Gaussian—yaitu distribusi normal—dan variabel kontinu. Model ini dipasang dengan mencari mean dan deviasi standar tiap-tiap kelas. ...