Verkefnalisti Tækniþróunarsjóðs
23.6.2006
Íslenskur textaskimi
Dæmi um notkun textaskima eru t.d.:
- Auðkenning allra nafna (s.s. mannanafna, fyrirtækjaheita, örnefna, o.þ.h.) úr texta
- Skimun eftir völdum efnisorðum í fyrirspurnum (t.d. orða eins og "útsvar", "tollar", eða vöruheita í fyrirspurn til Skattstjóra).
- Víð efnisorðaskimun á vefsíðutexta, þar sem t.d. er leitað eftir nöfnum tónlistarmanna, áfangastöðum flugfélaga og bókartitlum. Slíka greiningu má t.d. nota til að birta auglýsingar sem tengjast efni viðkomandi síðu.
Skiminn opnar nýja möguleika í textavinnslu á íslensku, hvort sem er á Vefnum eða við útgáfu bóka eða tímarita.
Verkefnið miðast við almenna lausn á vandamálinu, en lögð sérstök áhersla á fyrri liðina tvo sem nefndir eru að ofan. Afraksturinn verður verðmæt söluvara, en skilar um leið mikilvægri einingu í svokallaðan málfræðimarkara sem unnið er að hjá Orðabók Háskólans.
Rannsóknartími 1 ár.
Umsjónarmaður Rannís er Snæbjörn Kristjánsson, netf.: skr@rannis.is
| Fréttasafn |



