Pomiar bliskości słów w przestrzeni semantycznej

Wyniki

W latach 2014–2015 skonstruowano przestrzeń semantyczną metodą COALS na podstawie Narodowego Korpusu Języka Polskiego. W przestrzeni można m.in. mierzyć odległość między wyrazami, czyli ich podobieństwo semantyczne. Przestrzeń wraz z podręcznikiem można pobrać z adresu http://www2.polon.uw.edu.pl/pliki/approval. Program do jej obsługi jest dostępny na licencji GNU General Public Licence pod adresem http://www2.polon.uw.edu.pl/pliki/approval/interfejs_obslugi_przestrzeni/ wraz ze swoim kodem źródłowym. Z programu można korzystać na komputerach z systemem Linux, Windows i Mac OS.

Korzystając z przestrzeni semantycznej zbudowanej na NKJP, wygenerowano 20-elementowe listy sąsiedztwa dla większości par wyrazowych analizowanych w niniejszym projekcie, a także zmierzono odległości między członami tych par. Szczegóły znajdują się w plikach gotowych do pobrania niżej.

Report • Appendix 1 • Appendix 2