Konsep Dasar XML Retrieval
Pengertian Extensible Markup Language (XML)
Extensible Markup
Language (XML)
adalah sebuah sintax untuk menandai data dengan tag-tag sederhana. XML
memberikan efisiensi dalam melakukan proses manipulasi informasi pada suatu dokumen
atau data secara terstruktur. XML dikembangkan pada tahun tahun 1996 dan
mendapatkan pengakuan World Wide
Web Consortium (W3C) pada
bulan Februari tahun 1998. XML dapat didefinisika secara bebas, namun dalam
pembuatannya pengguna harus memperhatikan aturan-aturan agar menghasilkan XML
yg benar.
2.1.1
Kegunaan Extensible Markup Language (XML)
Ada beberapa kegunaan dari Extensible Markup
Language (XML) yaitu sebagai berikut :
-
Mendefinisikan
keterhubungan suatu document atau data.
-
Merupakan
suatu format standar untuk mendefinisikan informasi suatu dokumen.
-
Berfungsi
untuk pertukaran data meskipun berbeda platform.
XML Retrieval
XML Retrival merupakan sistem temu kembali
sebuah informasi, dokumen atau file menggunakan dokumen XML yang berstruktur.
Tujuan XML retrieval adalah mengimplementasikan temu kembali informasi yang
berfokus pada strategi pengembalian elemen XML suatu dokumen yang merupakan
hasil respon sebuah kueri. Bahasa pada kueri pada XML retrieval dipresentasikan
menjadi dua, yaitu Conten and Structure
(CAS) queries dan Content Only (CO) queries. CAS kueri merupakan kata kunci yang sifatnya terstruktur
sehingga informasi yang didapat lebih spesifik berupa isi, dan struktur daari
document XML, sedangkan CO kueri merupakan kata kunci yg sifatnya tidak
terstruktur.
Model Untuk XML Retrieval
Model yang dijelaskan dalam makalah ini adalah
vector space model. Menurut (Ogi livie,2010) dalam temu-kembali menggunakan
vector space model, dokumen dan kueri direpresentasikan sebagai vector. Term
frekuesi (tf) merupakan frekuensi kemunculan suatu term t pada dokumen d.
Dokumen frekuensi (df) merupakan banyaknya dokumen dalam database yang
mengandung kata tertentu (Manning, et
al.,2008).
Evaluasi XML Retrieval
Berikut adalah beberapa penjelasan
terkait dengan evaluasi XML retrieval:
Pengertian
Evaluasi
Menurut (Firman B. Aji dan S. Martin Sirait, 1990) evaluasi
merupakan suatu usaha untuk mengukur dan memberi nilai secara objektif terhadap
pencapaian hasil-hasil yang telah direncanakan sebelumnya. Sedangkan menurut
(M. Manullang, 2005) evaluasi merupakan membandingkan hasil pekerjaan (actual result) dengan
alat pengukur (standar) yang sudah ditentukan. Sehingga dapat disimpulkan bahwa
evaluasi adalah penilaian hasil sebuah proses yang telah dilakukan dengan
menggunakan standar tertentu, gunakan meningkatkan efetifitas dari proses yang
dilakukan. Dalam makalah ini evaluasi
yang dilakukan terhadap information retrieval system khususnya pada XML retrieval.
Tujuan Evaluasi
Menurut (Chowdhury, 1999) evaluasi memiliki
beberapa tujuan, yaitu:
1. Untuk
menilai tujuan dan rencana program sebelum melaksanakan program tersebut.
2.
Untuk menentukan seberapa baik kinerja tujuan
atau harapan yang diinginkan.
3.
Untuk menentukan alasan atau penyebab dari
keberhasilan maupun kegagalan program
tersebut.
4.
Untuk mengungkap prinsip-prinsip yang mendasari
suatu program yang berhasil.
5.
Untuk mengeksplorasi tentik yang dapat
meningkatkan efektivitas program.
6.
Untuk memperbaiki cara yang digunakan untuk
mencapai tujuan.
Kriteria Evaluasi
Untuk menentukan parameter evaluasi information retrieval system menurut
(Chowdhury, 1999) evaluasi dikelompokkan menjadi 5 kriteria, yaitu:
1.
Recall dan precision
Parameter kriteria ini ada 5 yaitu indeks exhaustivity, term spesifitas,
bahasan pengindeksan, perumusan permintaan dan strategi pencarian.
2. Respon
waktu
Parameter kriteria ini ada 5 yaitu pengorganisasian dokumen yang
tersedia, jenis query, lokasi
pusat informasi, frekuensi yang menerima permintaan pengguna dan ukuran koleksi.
3. Upaya
pengguna
Parameter kriteria ini ada 3 yaitu aksesbilitas system, sistem
menyediakan pedoman cara menggunakannya, fasilitas untuk berinteraksi dengan
sistem.
Parameter kriteria ini mengacu kepada sifat output seperti
referensi bibliografi, abstrak
atau full teks.
5.
Cangkupan koleksi
Parameter kriteria ini ada 4 yaitu jenis perangkat input dan ukuran perangkat penyimpanan, kedalaman analisis subjek, sifat perminataan pengguna dan bentuk fisik
dokumen.
2.3.1
Recall dan Precision
Recall merupakan
perbandingan antara dokumen relevan yang ditemukan dan dokumen relevan yang
terdapat pada database. Sedangkan precision merupakan perbandingan
antara dokumen relevan yang ditemukan dan dokumen yang ditemukan. Persamaan recall
dan precision dapat dilihat pada persamaan 1.1 dan persamaan 1.2.
Recall
= |Ra| / |R| (1.1)
Precision
= |Ra| / |A| (1.2)
Keteragan
: Ra = dokumen relevan yang ditemukan,
R =
dokumen relevan yang terdapat pada database,
A =
dokumen yang ditemukan.
Menurut (Baeza-Yates &Ribeiro-Neto,
1999)
Average precision (AVP) berfungsi untuk mengevaluasi secara kuantitatif
kinerja temu kembali yang diperoleh dengan menggunakan eleven standard recall
yaitu 0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, dan 1
Posting Komentar untuk "Konsep Dasar XML Retrieval"