Pengenalan Menyeluruh. Pengenalan 2003  16.5 bil Laman web 3 bil laman / 59GB teks dimuat setiap hari Hayat  44 hari 10MB/s teks : connection capable.

Slides:



Advertisements
Similar presentations
Protokol Rangkaian Bab 6
Advertisements

PEMBANGUNAN ENJIN GELINTAR tp PENGENALAN DIRI Saidah Saad Bilik No. 54, Paras 4, Blok D, Bgn FTSM. Jabatan Sains Maklumat, FTSM, UKM
Tan Sim Tee A97299 Quah Cheak Seong A97271 Chung Wui Fah A97154 Lee Chun Aik A97212 Ng Wai Mann A97262 Scalable Web Search by Adaptive Online Agents: An.
BAB 3-2 Sifat Robot. Objektif Boleh mengetahui ciri/spesifikasi robot Boleh menerangkan ciri/spesifikasi yang menerangkan kelakuan dan sifat robot Boleh.
1 Bab 9 Kesan Sosial: Kebaikan - golongan kurang upaya, warga tua dan orang awam.
Ketidaktentuan –Tidak lengkap –tidak konsisten, –tidakpasti… atau ketiga- tiganya sekali.
PENGENALAN KEPADA SISTEM MULTIMEDIA (WXET 3142) BAB 4 : IMEJ DAN GRAFIK (sambungan)
Model Capaian Maklumat
Measuring indeks Quality using Random Walks on the Web Disediakan oleh: Ang Pek Ling A97105 Beh Jin Hong A97110 Chung Yee Mun A97155 Emilee Tan Su-Chin.
BAB 5-4 Training Aplikasi Machine Vision. Objektif Boleh mengetahui kepentingan training pada vision system Boleh menghuraikan aplikasi vision system.
Bab 5-3 Image Processing and Analysis. Objektif Boleh mengetahui langkah-langkah yg terlibat di dalam Fungsi II Boleh menghuraikan keperluan dan fungsi.
PCS (Personal Communications Services) – CDMA (Code Division Multiple Access) PCS (Personal Communications Services) PCS merupakan perkhidmatan telefon.
RANGKA RUJUKAN ROBOT (ROBOT REFERENCE FRAMES)
Pengenalan Enjin Gelintar
INTERNET SEBAGAI MEDIA MAKLUMAT BARU DI ERA MAKLUMAT.
Prinsip-prinsip Spesifikasi Rekabentuk
1 Bab 8 Halatuju dan Kekangan dalam Antaramuka : Multisensori.
AMPS /D-AMPS ADVANCED MOBILE PHONE SYSTEM/DIGITAL ADVANCED MOBILE PHONE SYSTEM.
Pengindeksan Dan Fail Songsang (inverted File). Indeks Songsang Sistem capaian maklumat membangunkan indeks songsang untuk mencari katakunci dalam koleksi.
BAB 1 - MANTIK Pembelajaran kaedah dan prinsip untuk membezakan di antara hujah yang baik dengan yang lemah. Memudahkan penyusunan idea-idea dengan teratur,
SISTEM PENCARIAN DAN CAPAIAN DOKUMEN
COMP423.  Query expansion  Two approaches ◦ Relevance feedback ◦ Thesaurus-based  Most Slides copied from ◦
1 Query Operations Relevance Feedback & Query Expansion.
Information Retrieval and Web Search Relevance Feedback. Query Expansion Instructor: Rada Mihalcea.
Query expansion COMP423. Menu Query expansion Two approaches Relevance feedback Thesaurus-based Most Slides copied from
Pernyataan Kawalan Java
Strategi Algoritma Universitas Ahmad Dahlan
BAB 4 PERSAMPELAN.
Kandungan 1 RAID - (Redundant Array of Independent (or Inexpensive) Disks 2 Komputer Pelayan (Server) 3 Perisian Komputer Politeknik Seberang Perai.
KEPERLUAN KETEPATAN DATA DAN ANALISIS STATISTIK
BAB 2 PLANNING Objektif: Pengenalan kepada perancangan projek
REKABENTUK MODEL PANGKALAN DATA RANGKAIAN
PENGENALAN KEPADA JELMAAN LAPLACE
NEUROCITE 2.0: Simulator Peramalan Rangkaian Neural Buatan
Pengenalan kepada Teori Perakaunan
Konsep Pengukuran dalam Penyelidikan
PENERBITAN ELEKTRONIK
PEMARKAHAN LAPORAN AKNC Anugerah Kualiti Naib Canselor 2014
BAB 3 ANALISIS SISTEM Objektif:
Teori Komunikasi Interpersonal
BAB 9 VB6 DAN PANGKALAN DATA.
Prinsip-prinsip Kebolehgunaan
Regresi Sederhana dan Analisis Korelasi
MODULE 3 : HARDWARE : MONITOR PREVENTIVE MAINTENANCE WORK
PENGUMPULAN PROJEK DALAM SATU SISTEM APLIKATI
MODUL 3 FILING SYSTEM.
PERISIAN HAMPARAN ELEKTRONIK
Masalah Tugasan.
E4161 SISTEM KOMPUTER DAN APLIKASI
Pengenalan Sistem Automasi Industri
Pernyataan if.. Pernyataan switch..
BAB 8 TATASUSUNAN.
Pengenalan.
Penyelesaian Rangkaian Multimedia
REKABENTUK RANGKAIAN MUDAH
PENERBITAN ELEKTRONIK
BAB 2(a):PENGENALAN KEPADA JELMAAN LAPLACE
2.0 PENGALAMATAN RANGKAIAN
SSQL1113 Statistik Untuk Sains Sosial
Prinsip-prinsip Kebolehgunaan
MENGGUNAKAN OBJEK VISUAL BASIC 6.0
BAB 2 PLANNING Objektif: Pengenalan kepada perancangan projek
Oleh: Zaihan Abdul Ghani A Sharifah Suhaila Mohd Ramli A103305
POLITEKNIK PORT DICKSON E4161 SISTEM KOMPUTER & APLIKASI
Kebolehgunaan Semula Perisian
Bab 6 Pengaturcaraan Lisp.
ICT HANDYBOOK SPM LA2 COMPUTER SYSTEMS 2.3 Software.
3.4.3 KONFIGURASI DAN UJIAN RANGKAIAN
Penilaian Capaian & Maklumbalas Berkaitan
Keperluan rangkaian bagi aplikasi multimedia
Presentation transcript:

Pengenalan Menyeluruh

Pengenalan 2003  16.5 bil Laman web 3 bil laman / 59GB teks dimuat setiap hari Hayat  44 hari 10MB/s teks : connection capable to downloading

Pengenalan Nov 97 : AltaVista handle 20 bil queries per day

Apa itu enjin gelintar ? Enjin gelintar ialah suatu program yang digunakan untuk mencari dan mencapai maklumat berdasarkan kepada sebutan gelintaran (search terms) yang diberi oleh pengguna. Ia membenarkan pengguna menjelajah pangkalan data yang mengandungi teks terdiri daripada berjuta-juta di laman web. Apabila perisian enjin gelintar dapat padankan maklumat yang dicari (hits), ia akan menerangkan dimana pautan maklumat terdapat dan seterusnya pengguna akan terus menjelajah. search engine -- (a computer program that retrieves documents or files or data from a database or from a computer network (especially from the internet))

Query String IR System Ranked Documents 1. Page1 2. Page2 3. Page3. Document corpus Web Spider Pengenalan

Pelayan Google Pelayan UKM FTSM URL Pengenalan

klien Enjin kueri pemangkatan Modul Himpunan Analisis Repositori laman Indeks: kemudahan struktur teks Modul Kawalan Lelabah WWW Lelabah Modul Indeks Maklumbalas pengguna kueri keputusan Senibina Enjin Carian (Arasu et.al 2001)

Enjin Gelintar Empat komponen Asas Pangkalan data rujukan kepada laman web Robot pengindeksan yang mejelajah WWW Antaramuka Membolehkan pengguna untuk hantar kueri Memaparkan hasil yang diperolehi Sistem Capaian Maklumat

SISTEM PENCARIAN DAN CAPAIAN DOKUMEN Apa itu maklumat ? Teori Maklumat Kitar Hayat Maklumat

Information Hierarchy Wisdom Knowledge Information Data The raw material of information Information Data organized and presented by someone Knowledge Information read, heard or seen and understood Wisdom Distilled and integrated knowledge and understanding

Maklumat Where is the Life we have lost in living? Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information? -- T.S. Eliot, “The Rock” Where is the information we have lost in data?

Apa itu maklumat Tidak ada definisi yang tepat Berbeza mengikut bidang : philosophy, psychology, signal processing, physics Oxford English Dictionary information: informing, telling; thing told, knowledge, items of knowledge, news knowledge: knowing familiarity gained by experience; person’s range of information; a theoretical or practical understanding of; the sum of what is known Kamus Dewan Knowledge in the form of facts

Teori Maklumat Disebut “Communication Theory” Communication may be over time and space Noise SourceDecodingEncodingDestination Message Channel StorageSource Decoding (Retrieval/Reading) Encoding (writing/indexing) Destination Message

Information Life Cycle Creation UtilizationSearching Active Inactive Semi-Active Retention/ Mining Disposition Discard Using Creating Authoring Modifying Organizing Indexing Storing Retrieval Distribution Networking Accessing Filtering

Authoring/Modifying Converting Data+Information+Knowledge to New Information. Creating information from observation, thought. Editing and Publication. Collecting and Integrating information. Affects Data, Information and Metadata. Indexing Organizing/Indexing

Storing/Retrieving Information Storage How and Where is Information stored? Retrieving Information. How is information recovered from storage How to find needed information Linked with Accessing/Filtering stage Distribution/Networking Transmission of information How is information transmitted? Networks vs Broadcast.

Accessing/Filtering Using the organization created in the O/I stage to: Select desired (or relevant) information Locate that information Retrieve the information from its storage location (often via a network) Using/Creating Using Information. Transformation of Information to Knowledge. Knowledge to New Data and New Information.

Creation UtilizationSearching Active Inactive Semi-Active Retention/ Mining Disposition Discard Using Creating Authoring Modifying Organizing Indexing Storing Retrieval Distribution Networking Accessing Filtering Sistem Pencarian Dan Capaian Dokumen

Pengenalan Micheal Lesk membahagikan era teknologi maklumat kepada tujuh era iaitu : Maklumat lanjut rujuk kertas kerja yang bertajuk : The Seven Ages Of Information Retrieval Childhood ( ) The SchoolBoy (1960s) AdultHood(1970s) Maturity (1980s) MidLife Crisis (1990s) Fulfillment (2000s) Retirement (2010)

SISTEM PENCARIAN DAN CAPAIAN DOKUMEN (MAKLUMAT) Definisi CM Komponen Asas CM Teknik Carian Maklumat Berasas Katakunci Teknik Carian dan Capaian Maklumat

Definisi Menurut Tengku(1989), capaian maklumat adalah satu pengajian cara korpus suatu simpanan maklumat ditentukan dan dicapai berdasarkan kehendak tertentu. berkenaan perwakilan, penstoran, perorganisasian dan perolehan maklumat mengikut pertanyaan atau kueri dan keperluan pengguna

Untuk sistem capaian maklumat, 3 elemen asas yang diperlukan (Brown, 1996). Perwakilan Dokumen (representasi): dokumen yang menyediakan penerangan maklumat secara formal yang terdapat dalam sesuatu dokumen. Perwakilan pertanyaan (query): menyediakan penerangan mengenai maklumat yang diperlukan Pengukuran yang berkaitan di antara pertanyaan dan dokumen: menyediakan suatu tatacara atau prosedur untuk memadankan antara keperluan maklumat dengan dokumen bagi memenuhi keperluan tersebut. Definisi

D : set perwakilan dokumen Q : set perwakilan kehendak pengguna (kueri) R : D x Q  real numbers fungsi yang akan menentukan bagi setiap dokumen dan kueri suatu nombor tertentu (real number) bagi diwakili oleh suatu pangkatan (berkaitan) dokumen berdasarkan kueri yang dimasukkan.

Asas Sistem Capaian Dokumen PemprosesPemproses Output Dokumen Pertanyaan Input feedback -operasi sebutan -Stemming -Truncation Sistem capaian maklumat diillustrasi seperti rajah (van Rijsbergen, 1979) Komponen Asas CM

Teknik pencarian maklumat berasaskan web boleh dijalankan menggunakan beberapa teknik bergantung kepada operator yang digunakan selain penggunaan bahasa tabii. Operator yang boleh digunakan Boolean operator Positional operator Relational operator Teknik Carian Maklumat Berasaskan Katakunci

Operator yang boleh digunakan (AND, OR, NOT, \ dan XOR) : Q1 AND Q2 Documents that are in BOTH sets: Q1 and Q2 Q1 OR Q2 Documents that are in at least in one set: Q1 or Q2 NOT Q1 All documents except the one in set Q1 Q1 \ Q2 Logical “minus” all documents from Q1 except those that belong to Q2. Used also as “binary NOT” (Q1 NOT Q2) Q1 XOR Q2 Exclusive OR - documents that belong to exactly one set: Q1 or Q2, but not both. In other words (Q1 OR Q2) \ (Q1 AND Q2) Teknik Carian Maklumat : Boolean Operator

Boolean Queries AND and OR Usually expressed as INFIX operators in IR ((a AND b) OR (c AND b)) NOT is UNARY PREFIX operator ((a AND b) OR (c AND (NOT b))) AND and OR can be n-ary operators (a AND b AND c AND d) Some rules - (De Morgan revisited) NOT(a) AND NOT(b) = NOT(a OR b) NOT(a) OR NOT(b)= NOT(a AND b) NOT(NOT(a)) = a

SAME Example: Sains SAME Maklumat Only records containing both Sains and Maklumat within the same bibliographic field will be retrieved. WITH Example: Sains WITH Maklumat Only records containing both Sains and Maklumat in the same sentence in a bibliographic field will be retrieved from this search. NEAR Example: Sains NEAR Maklumat Only records with the terms Sains and Maklumat next to each other within the same bibliographic field would be retrieved from this search. Sains or Maklumat could display first in the field. Teknik Carian Maklumat : Positional Operator Positional operator digunakan untuk mendapatkan rekod dalam rekod bibliografik yang sama.

ADJ Example: Sains ADJ Maklumat Only records with the terms Sains and Maklumat adjacent to each other within the same bibliographic field and with Sains listed first in this field would be retrieved from this search Tambahan : penggabungan operator boleh dilakukan bagi mengecil atau meluaskan jarak antara perkataan Example: FROM ADJ1 HERE ADJ2 ETERNITY This example shows how to search for the title, "From Here to Eternity.“ ADJ2 means that the words may be within two searchable words of each other, but they must be in the order they were entered. Teknik Carian Maklumat : Positional Operator

Pengguna boleh memberikan pemberat. Sesetengah enjin carian web membenarkan pengguna menggunakan simbol (+) atau (-) untuk memberi pemberat kepada perkataan. Contoh : cost AND +paper Jika ujud di dalam sesuatu dokumen yang mengandungi cost dan paper maka term paper akan dipangkat lebih tinggi (pemberat lebih besar) berbanding term cost Teknik Carian Maklumat : Kaedah Lain

Belkin dan Croft (1987) membahagikan teknik capaian kepada padanan tepat dan padanan separa. Teknik Capaian Padanan TepatPadanan Separa CorakTeks Pencarian Boolean Kebarangkalian Ruang Clustering ….. Vektor Teknik Carian dan Capaian Maklumat

Teknik Sistem Carian Dan Capaian Terdapat beberapa teknik yang boleh dilakukan dalam proses carian dan capaian dalam sistem capaian dokumen bagi enjin gelintar Teknik Capaian padanan tepat Boolean Dokumen dinyatakan sebagai satu set d j = {t i,…..t n } dimana setiap t i adalah perkataan yang terdapat pada dokumen d j. query yang digunakan adalah dalam bentuk operasi boolean yang piawai iaitu AND, OR, NOT dan XOR. carian seperti yang diterangkan sebelum ini

Boolean Lanjutan Capaian Lanjutan Boolean merupakan peningkatan daripada capaian Boolean. Ianya memberi pemberat bagi perkataan. tf (term frequency) atau frekuensi perkataan menunjukkan berapa kali perkataan tersebut wujud dalam dokumen. Ia direkabentuk untuk mengemaskini capaian boolean dimana beberapa pengoperasian dan teknik ditambah seperti keupayaan capaian dalam bentuk pemangkatan atau susunan (rank) mengikut jujukan menaik atau menurun serta nilai pemberat bagi meningkatkan lagi keupayaan capaian sesuatu query. Teknik Sistem Carian Dan Capaian : Boolean Lanjutan

Contoh pemangkatan melalui frekuensi perkataan (Enjin Carian Sony)  x AND y : tfx x tfy  x OR y : tfx + tfy  NOT x : 0 if tfx > 0, 1 if tfx = 0 Memberikan pemberat kepada perkataan melalui frekuensi, membenarkan dokumen yang mengandungi banyak perkataan kueri dipangkat lebih tinggi. Skor adalah 0 jika dokumen tidak menepati Syarat Boolean. Teknik Sistem Carian Dan Capaian : Boolean Lanjutan

Cara capaian dokumen yang menyusun dokumen mengikut pangkatan dengan menggunakan teori kebarangkalian. Mencapai suatu kualiti capaian yang optimum berdasarkan suatu andaian. Ianya dijana berdasarkan pengiraan menggunakan similarity coefficient diantara kueri dan dokumen. Ia dijana dlm bentuk kebarangkalian bagi menyatakan kerelevanan diantara keduanya. Dua asas pendekatan digunakan Bergantung kepada penggunaan patern bagi meramal kerelevanan (Maron and Kuhns, 1960) Penggunaan setiap term pada kueri sebagai klu bagi kerelevanan dengan suatu dokumen (Robertson and Spark Jones 1976) Asas Penggunaan teorem Bayes Teknik Sistem Carian Dan Capaian : Capaian Berkebarangkalian

Kueri q (q 1,q 2 ) Jana q dan capai n dokumen (katakan n = 5) dan d i mewakili dokumen berikut q1q1 q2q2 q1q1 q1q2q1q2 q2q2 d 1 d 2 d 3 d 4 d 5 Katakan d 2 dan d 4 adalah relevan P(q 1 | d i adalah relevan) = ½ P(q 1 | d i adalah tidak relevan) = 2/3 P(q 2 | d i adalah relevan) = 1 P(q 2 | d i adalah tidak relevan) = 1/3 Teknik Sistem Carian Dan Capaian : Capaian Berkebarangkalian

Model capaian ruang vektor menyatakan kedua-dua pertanyaan dan dokumen sebagai set perkataan mengira persamaan antara perkataan pertanyaan dan dokumen. Model ini menganggap bahawa set ini boleh digunakan untuk mengenalpasti kedua-dua rekod dan maklumat yang ditanya. Semua perkataan pada model ini mempunyai kepentingan yang sama. teknik pemberat digunakan untuk menentukan paras atau tahap kepentingan bagi setiap perkataan. Fungsi kesamaan digunakan untuk mengira persamaan vektor antara perkataan pertanyaan dan dokumen. Dua perkara yang selalu digunakan iaitu ukuran kosine dan songsangan fungsi kekerapan dokumen. Teknik Sistem Carian Dan Capaian : Capaian Ruang Vektor

Kueri dan setiap dokumen dipetakan kepada vektor dengan setiap dimensi mewakili nilai tf-idf bagi setiap perkataan. Dimana dokumen dokumen : dokumen dengan set term indeks dengan pemberat. Pemberat dijanakan bagi menentukan kepentingan (keberkaitan) sesuatu term kepada dokumen dj = (W1,j, W2,j, ……, Wi,j) dan Kueri Kueri : kueri adalah term indeks dengan pemberat. Pemberat dijanakan bagi menentukan kepentingan (keberkaitan) sesuatu term kepada kehendak pengguna q = (W1,j, W2,j, ……, Wi,j) Teknik Sistem Carian Dan Capaian : Capaian Ruang Vektor

Dokumen d j dan kueri q merupakan vector dalam ruang t dimensi. Kepentingan sesuatu term bergantung kepada kekerapan keujudan sesuatu term tersebut pada satu-satu dokumen. Jika term A dinyatakan lebih dari term B maka dokumen tersebut lebih menerangkan tentang A dari B. Jika freqi,j adalah kekerapan term ki dalam dokumen dj. Maka wi,j = freqi,j. Komponen adalah 0 jika tidak wujud, nilai positif diberi (bergantung kepada frekuensi perkataan dan frekuensi dokumen songsang) jika ianya wujud. Dokumen dipangkat melalui jarak dengan kueri, dengan itu dokumen akan dipangkat paling tinggi sekiranya sudut antaranya dan kueri adalah paling kecil. Jarak ditentukan berdasarkan pengiraan skor kesamaan (similarity score calculation). Jarak boleh merupakan magnitud perbezaan vektor yang dinormalkan atau mungkin kosin (cosine) bagi sudut antara vektor-vektor. Teknik Sistem Carian Dan Capaian : Capaian Ruang Vektor

Perwakilan Grafik Example: D 1 = 2T 1 + 3T 2 + 5T 3 D 2 = 3T 1 + 7T 2 + T 3 Q = 0T 1 + 0T 2 + 2T 3 T3T3 T1T1 T2T2 D 1 = 2T 1 + 3T 2 + 5T 3 D 2 = 3T 1 + 7T 2 + T 3 Q = 0T 1 + 0T 2 + 2T Adakah D 1 atau D 2 lebih sama dgn Q? Bagaimana untuk mengukur darjah kesamaan? Jarak ? Sudut?

Contoh Q : gold silver truck D 1 : Shipment of gold damaged in a fire D 2 : Delivery of silver arrived in a silver truck D 3 : Shipment of gold arrived in a truck Variablegoldsilvertruck N333 n212 R222 r112

Contoh Q : gold silver truck D 1 : Shipment of gold damaged in a fire D 2 : Delivery of silver arrived in a silver truck D 3 : Shipment of gold arrived in a truck Variablegoldsilvertruck N333 n212 R222 r112 bilangan dokumen dalam koleksi

Contoh Q : gold silver truck D 1 : Shipment of gold damaged in a fire D 2 : Delivery of silver arrived in a silver truck D 3 : Shipment of gold arrived in a truck Variablegoldsilvertruck N333 n212 R222 r112 bilangan dokumen yang mengandungi term t

Contoh Q : gold silver truck D 1 : Shipment of gold damaged in a fire D 2 : Delivery of silver arrived in a silver truck D 3 : Shipment of gold arrived in a truck Variablegoldsilvertruck N333 n212 R222 r112 bilangan term yang relevan bagi kueri yang diberikan

Contoh Q : gold silver truck D 1 : Shipment of gold damaged in a fire D 2 : Delivery of silver arrived in a silver truck D 3 : Shipment of gold arrived in a truck Variablegoldsilvertruck N333 n212 R222 r112 bilangan dokumen relevan yang mengandungi term t

Variablegoldsilvertruck N333 n212 R222 r112 N : bilangan dokumen dalam koleksi n : bilangan indeks dokumen yang mengandungi term t R : bilangan term yang relevan bagi kueri yang diberikan r : bilangan indeks dokumen relevan yang mengandungi term t Contoh Penyelesaian seterusnya akan dibincang pada pendetailan ruang vektor menggunakan …..

Robertson-Sparck Jones Weights Predictive formulation

Tesaurus adalah set item (frasa atau perkataan ) dan set hubungan di antara item-item tersebut. 3 perkara asas yang berkaitan dengan tesaurus di dalam capaian maklumat ialah: 1. pembinaan: ada 2 jenis tesaurus iaitu secara manual dan secara automatik. 2. capaian: diberi satu pertanyaan yang khusus, maka tesaurus akan mencapai dan menggunakan perkataan tersebut untuk meningkat dan mengembangkan pertanyaan. 3. penilaian: selepas tesaurus dibina, adalah penting menilai kebaikan yang mampu dilakukannya. Tesaurus manual dinilai melalui perkembangan pertanyaan yang dicapai untuk memastikan peningkatan keupayaan capaian. TESAURUS

Tesaurus menyediakan maklumat sinonim dan semantik berkaitan perkataan dan frasa. Example: physician syn: ||croaker, doc, doctor, MD, medical, mediciner, medico, ||sawbones rel: medic, general practitioner, surgeon, Bagi setiap term, t, pada kueri, ia akan memperkembangkan kueri dengan sinonim dan perkataan yang berkaitan dengan t dari tesaurus. Pemberat yang digunakan adalah kurang dari term kueri yang asal TESAURUS

WordNet A more detailed database of semantic relationships between English words. Developed by famous cognitive psychologist George Miller and a team at Princeton University. About 144,000 English words. Nouns, adjectives, verbs, and adverbs grouped into about 109,000 synonym sets called synsets. Penggunaan WordNet dalam perkembangan kueri Add synonyms in the same synset. Add hyponyms to add specialized terms. Add hypernyms to generalize a query. Add other related terms to expand query.

WordNet Synset Relationships Antonym: front  back Attribute: benevolence  good (noun to adjective) Pertainym: alphabetical  alphabet (adjective to noun) Similar: unquestioning  absolute Cause: kill  die Entailment: breathe  inhale Holonym: chapter  text (part-of) Meronym: computer  cpu (whole-of) Hyponym: tree  plant (specialization) Hypernym: fruit  apple (generalization)