Sammanfattning:
|
Projektets mål är att göra ett fritt tillgängligt, lättanvänt system för att generera vertikala sökmaskiner inom valfritt ämnesområde. Systemet ska inkludera de senaste forskningsresultaten för effektiv spindling genom URL scheduling, state-of-the-art ämnesklassifikationsmetoder (inkluderande teknik från lingvistisk analys) och integreras med högkvalitativa databas-system för indexering/sökning (Zebra, Terrier, Lucene). Det ska vara möjligt att enkelt bootstrappa en vertikal sökmaskin genom t.ex. en bokmärkessamling eller ett antal dokument. Projektet baseras på en existerande Web-spindel, Combine http://combine.it.lth.se/ som ska modifieras och integreras med andra fritt tillgängliga komponenter.
|