STARK

STARK je orodje za analizo skladenjsko razčlenjenih korpusov po načelu ‘od spodaj navzgor’, ki dopolnjuje prevladujoča orodja za brskanje po korpusih na podlagi vnaprej pripravljenih poizvedovanj. Za dani korpus v formatu CONLL-U orodje izvede samodejno luščenje vseh relevantnih skladenjskih dreves glede na uporabnikove nastavitve (od konkretnih besednih zvez do abstraktnejših skladenjskih vzorcev) in zanje poleg pogostosti ponudi tudi več drugih uporabnih statističnih izračunov. V okviru projekta SPOT bomo orodje uporabili za luščenje skladenjskih vzorcev iz drevesnic SST in SSJ ter njihovo primerjavo.

Drevesnik

Drevesnik je spletni vmesnik za brskanje po slovenskih skladenjsko razčlenjenih korpusih, s pomočjo katerega lahko jezikoslovci in drugi raziskovalci analizirajo različne slovnične pojave v slovenščini. Uporabniki v polje za iskanje vpišejo svoj iskalni pogoj, izberejo enega ali več korpusov, po katerih naj se iskanje izvede, prikazane rezultate pa si lahko ogledajo v obliki vizualiziranih skladenjskih dreves (grafov) ali prenesejo na svoj računalnik. V okviru projekta SPOT bomo vmesnik Drevesnik uporabljali za kvalitativno analizo skladenjskih vzorcev v govorjeni in pisni slovenščini.

Q-CAT

Q-CAT je namizna aplikacija za jezikoslovno označevanje besedil v slovenščini in drugih jezikih, s pomočjo katere lahko uporabniki besedam na površini ročno pripisujejo jezikoslovne interpretacije, kot so osnovne oblike, besedne vrste, skladenjska razmerja, udeleženske vloge, imenske entitete, stalne besedne zveze in druge poljubne oznake, obenem pa lahko po tako označenih besedilih nato tudi iščejo. V okviru projekta SPOT bomo Q-CAT uporabili za ročno skladenjsko razčlenjevanje novih besedil drevesnice SST, za kar je bilo orodje nadgrajeno tudi z možnostjo poslušanja zvočnih posnetkov.

Označevalnik

Označevalnik CJVT je spletni vmesnik za strojno slovnično označevanje besedil v slovenščini, ki temelji na orodju CLASSLA-Stanza ter besedam na površini pripiše različne oblikoslovne, skladenjske in pomenske lastnosti, kot so osnovne oblike, besedne vrste ali stavčni členi. Tako označena besedila bistveno olajšajo njihovo nadaljnjo analizo, saj omogočajo hitrejši priklic relevantnih jezikovnih pojavov, denimo za potrebe jezikoslovnih raziskav ali podatkovnega rudarjenja. V okviru projekta SPOT nam bo vmesnik služil predvsem za prikaz delovanja strojnih označevalnikov splošni javnosti, zaledno orodje pa bomo uporabili pri pripravi podatkov za ročno označevanje drevesnice SST.