Orodja - SPOT

STARK

STARK je orodje za analizo skladenjsko razčlenjenih korpusov po načelu ‘od spodaj navzgor’, ki dopolnjuje prevladujoča orodja za brskanje po korpusih na podlagi vnaprej pripravljenih poizvedovanj. Za dani korpus v formatu CONLL-U orodje izvede samodejno luščenje vseh relevantnih skladenjskih dreves glede na uporabnikove nastavitve (od konkretnih besednih zvez do abstraktnejših skladenjskih vzorcev) in zanje poleg pogostosti ponudi tudi več drugih uporabnih statističnih izračunov. V okviru projekta SPOT orodje uporabljamo za luščenje skladenjskih vzorcev iz drevesnic SST in SSJ ter njihovo primerjavo. Za ta namen smo ga tudi bistveno izboljšali in zanj razvili uporabniku prijaznejši spletni vmesnik.

Drevesnik

Drevesnik je spletni vmesnik za brskanje po slovenskih skladenjsko razčlenjenih korpusih, s pomočjo katerega lahko jezikoslovci in drugi raziskovalci analizirajo različne slovnične pojave v slovenščini. Uporabniki v polje za iskanje vpišejo svoj iskalni pogoj, izberejo enega ali več korpusov, po katerih naj se iskanje izvede, prikazane rezultate pa si lahko ogledajo v obliki vizualiziranih skladenjskih dreves (grafov) ali prenesejo na svoj računalnik. V okviru projekta SPOT vmesnik Drevesnik uporabljamo za kvalitativno analizo skladenjskih vzorcev v govorjeni in pisni slovenščini, prenovili pa smo tudi njegovo grafično podobo.

Q-CAT

Q-CAT je namizna aplikacija za jezikoslovno označevanje besedil v slovenščini in drugih jezikih, s pomočjo katere lahko uporabniki besedam na površini ročno pripisujejo jezikoslovne interpretacije, kot so osnovne oblike, besedne vrste, skladenjska razmerja, udeleženske vloge, imenske entitete, stalne besedne zveze in druge poljubne oznake, obenem pa lahko po tako označenih besedilih nato tudi iščejo. V okviru projekta SPOT smo Q-CAT uporabili za ročno skladenjsko razčlenjevanje novih besedil drevesnice SST, za kar je bilo orodje nadgrajeno tudi z možnostjo poslušanja zvočnih posnetkov.

Označevalnik

Označevalnik CJVT je spletni vmesnik za strojno slovnično označevanje besedil v slovenščini, ki temelji na orodju CLASSLA-Stanza ter besedam na površini pripiše različne oblikoslovne, skladenjske in pomenske lastnosti, kot so osnovne oblike, besedne vrste ali stavčni členi. Tako označena besedila bistveno olajšajo njihovo nadaljnjo analizo, saj omogočajo hitrejši priklic relevantnih jezikovnih pojavov, denimo za potrebe jezikoslovnih raziskav ali luščenja specifičnih informacij. V okviru projekta SPOT smo orodje nadgradili z novimi modeli za procesiranje govorjene slovenščine, vmesnik pa služi tudi za prikaz delovanja strojnih označevalnikov splošni javnosti.

STARK

Drevesnik

Q-CAT

Označevalnik

Financiranje

Raziskovalna organizacija

Vodja projekta

Področje

Trajanje

Obseg