Konsep Dasar XML Retrieval


         Pengertian Extensible Markup Language (XML)

Extensible Markup Language (XML) adalah sebuah sintax untuk menandai data dengan tag-tag sederhana. XML memberikan efisiensi dalam melakukan proses manipulasi informasi pada suatu dokumen atau data secara terstruktur. XML dikembangkan pada tahun tahun 1996 dan mendapatkan pengakuan World Wide Web Consortium (W3C) pada bulan Februari tahun 1998. XML dapat didefinisika secara bebas, namun dalam pembuatannya pengguna harus memperhatikan aturan-aturan agar menghasilkan XML yg benar.
Berikut adalah contoh dari XML :


2.1.1    Kegunaan Extensible Markup Language (XML)

Ada beberapa kegunaan dari Extensible Markup Language (XML) yaitu sebagai berikut :
-          Mendefinisikan keterhubungan suatu document atau data.
-          Merupakan suatu format standar untuk mendefinisikan informasi suatu dokumen.
-          Berfungsi untuk pertukaran data meskipun berbeda platform.

XML Retrieval

XML Retrival merupakan sistem temu kembali sebuah informasi, dokumen atau file menggunakan dokumen XML yang berstruktur. Tujuan XML retrieval adalah mengimplementasikan temu kembali informasi yang berfokus pada strategi pengembalian elemen XML suatu dokumen yang merupakan hasil respon sebuah kueri. Bahasa pada kueri pada XML retrieval dipresentasikan menjadi dua, yaitu Conten and Structure (CAS) queries dan Content Only (CO) queries. CAS kueri merupakan kata kunci yang sifatnya terstruktur sehingga informasi yang didapat lebih spesifik berupa isi, dan struktur daari document XML, sedangkan CO kueri merupakan kata kunci yg sifatnya tidak terstruktur.

Model Untuk XML Retrieval

Model yang dijelaskan dalam makalah ini adalah vector space model. Menurut (Ogi livie,2010) dalam temu-kembali menggunakan vector space model, dokumen dan kueri direpresentasikan sebagai vector. Term frekuesi (tf) merupakan frekuensi kemunculan suatu term t pada dokumen d. Dokumen frekuensi (df) merupakan banyaknya dokumen dalam database yang mengandung kata tertentu (Manning, et al.,2008).

          

Evaluasi XML Retrieval

Berikut adalah beberapa penjelasan terkait dengan evaluasi XML retrieval:
Pengertian Evaluasi
Menurut (Firman B. Aji  dan S. Martin Sirait, 1990) evaluasi merupakan suatu usaha untuk mengukur dan memberi nilai secara objektif terhadap pencapaian hasil-hasil yang telah direncanakan sebelumnya. Sedangkan menurut (M. Manullang, 2005) evaluasi merupakan membandingkan  hasil pekerjaan (actual result) dengan alat pengukur (standar) yang sudah ditentukan. Sehingga dapat disimpulkan bahwa evaluasi adalah penilaian hasil sebuah proses yang telah dilakukan dengan menggunakan standar tertentu, gunakan meningkatkan efetifitas dari proses yang dilakukan.  Dalam makalah ini evaluasi yang dilakukan terhadap information retrieval system khususnya pada XML retrieval.
Tujuan Evaluasi
Menurut (Chowdhury, 1999) evaluasi memiliki beberapa tujuan, yaitu:
1.      Untuk menilai tujuan dan rencana program sebelum melaksanakan program tersebut.
2.      Untuk menentukan seberapa baik kinerja tujuan atau harapan yang diinginkan.
3.      Untuk menentukan alasan atau penyebab dari keberhasilan maupun kegagalan program tersebut.
4.      Untuk mengungkap prinsip-prinsip yang mendasari suatu program yang berhasil.
5.      Untuk mengeksplorasi tentik yang dapat meningkatkan efektivitas program.
6.      Untuk memperbaiki cara yang digunakan untuk mencapai tujuan.

Kriteria Evaluasi
Untuk menentukan parameter evaluasi information retrieval system menurut (Chowdhury, 1999) evaluasi dikelompokkan menjadi 5 kriteria, yaitu:
1.      Recall dan precision
Parameter kriteria ini ada 5 yaitu indeks exhaustivity, term spesifitas, bahasan pengindeksan, perumusan permintaan dan strategi pencarian.
2.      Respon waktu
Parameter kriteria ini ada 5 yaitu pengorganisasian dokumen yang tersedia, jenis query, lokasi pusat informasi, frekuensi yang menerima permintaan pengguna dan ukuran koleksi.
3.      Upaya pengguna

Parameter kriteria ini ada 3 yaitu aksesbilitas system, sistem menyediakan pedoman cara menggunakannya, fasilitas untuk berinteraksi dengan sistem.
4.      Penyajian
Parameter kriteria ini mengacu kepada sifat output seperti referensi bibliografi, abstrak atau full teks.
5.      Cangkupan koleksi
Parameter kriteria ini ada 4 yaitu jenis perangkat input dan  ukuran perangkat penyimpanan,  kedalaman analisis subjek,  sifat perminataan pengguna dan bentuk fisik dokumen.
2.3.1        Recall dan Precision
Recall merupakan perbandingan antara dokumen relevan yang ditemukan dan dokumen relevan yang terdapat pada database. Sedangkan precision merupakan perbandingan antara dokumen relevan yang ditemukan dan dokumen yang ditemukan. Persamaan recall dan precision dapat dilihat pada persamaan 1.1 dan persamaan 1.2.
                                    Recall = |Ra| / |R|                                             (1.1)
                                                Precision = |Ra| / |A|                                       (1.2)
Keteragan :    Ra = dokumen relevan yang ditemukan,
                        R   =  dokumen relevan yang terdapat pada database,
                        A   =  dokumen yang ditemukan.
Menurut (Baeza-Yates &Ribeiro-Neto, 1999) Average precision (AVP) berfungsi untuk mengevaluasi secara kuantitatif kinerja temu kembali yang diperoleh dengan menggunakan eleven standard recall yaitu 0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, dan 1

Posting Komentar untuk "Konsep Dasar XML Retrieval"