Kursbeskrivning
Syfte
Kursens syfte är att öka förståelsen för metoder för informationssökning (Information Retrieval), strukturering, och kunskapsextraktion (text mining) speciellt från Internet-baserade källor.
Den ger den bakgrund och metoder som behövs för kursen EITN05 Semantisk Web-programmering.
Innehåll
Informationssökning: Basala begrepp för sökning och rankning, vektormodeller, tf-idf baserad relevans. System för informationssökning.
Sökspråk: Olika sökspråk för sökning i strukturerade databaser presenteras.
Strukturerad information: Indexering, sökning och relevansrankning av sökresultat. Exemplifieras med hjälp av sökningar i strukturerade databaser (SRU/CQL).
"Feature extraction": Extrahera egenskaper för dokument.
"Computational Intelligence": Grundläggande metoder för kunskapsextraktion och klassificering (som neurala nätverk, Support Vector Machines m fl) gås igenom och experimenteras med. Utnyttja extraherade egenskaper för att implementera ämnes-klassifikation för textdokument.
Prestanda: Prestandamätetal som "precision" och "recall"