Senin, 04 April 2011

Web Mining

Web Mining adalah penerapan teknik data mining untuk menemukan pola dari Web. Menurutanalisis target, pertambangan web dapat dibagi menjadi tiga jenis, yaitu pertambanganpenggunaan Web, pertambangan konten Web dan pertambangan struktur Web.

Web Usage Mining adalah Pertambangan penggunaan Web adalah proses penggalian informasi yang bergunadari server log sejarah yaitu pengguna. Pertambangan Penggunaan Web adalahproses mencari tahu apa yang pengguna cari di Internet. Beberapa pengguna mungkinhanya melihat data tekstual, sedangkan beberapa yang lain mungkin tertarik dalamdata multimedia.

Web Content Mining Pertambangan konten web adalah proses untuk menemukan informasi yang bergunadari teks, gambar, data audio atau video di web. Pertambangan konten Web kadang-kadang disebut web text mining, karena isi teks adalah daerah yang paling banyakditeliti. Teknologi yang biasa digunakan di pertambangan web konten NLP (Naturalpengolahan bahasa) dan IR (Information retrieval). Walaupun data mining adalah istilahyang relatif baru, teknologi tidak. Perusahaan telah menggunakan komputer kuat untukmenyaring volume data scanner supermarket dan menganalisis laporan penelitian pasar selama bertahun-tahun. Namun, inovasi secara terus menerus daya komputerpengolahan, penyimpanan disk, dan software statistik secara dramatis meningkatkanakurasi analisis saat mengemudi menurunkan biaya.


Web Structure Mining Pertambangan struktur Web adalah proses menggunakan teori graph untukmenganalisis struktur node dan koneksi dari sebuah situs web. Menurut jenis data webstruktural, pertambangan struktur web dapat dibagi menjadi dua jenis:
1. Mengekstrak pola dari hyperlink di web: hyperlink adalah komponen struktural yang menghubungkan halaman web ke lokasi yang berbeda.
2. Pertambangan struktur dokumen: Analisis struktur seperti pohon struktur halaman untuk menggambarkan penggunaan HTML atau XML tag.

1 komentar: