Modele
Semantyka dystrybucyjna
znalazła w ostatnich latach szerokie zastosowanie w rozwiązywaniu szeregu zadań związanych z
przetwarzaniem języka naturalnego. U jej podstaw leży hipoteza, że słowa występujące w
podobnych kontekstach w dużych zbiorach danych tekstowych mają podobne znaczenie.
Znaczenia słów reprezentowane są przez wektory liczbowe.
Poniższa lista zawiera modele dystrybucyjne (zbiory wektorów reprezentujących znaczenia słów)
dla języka polskiego wygenerowane przy pomocy pakietu gensim
dla dwóch dużych korpusów tekstowych: pełnej wersji Narodowego Korpusu Języka Polskiego
(NKJP) oraz polskiej edycji Wikipedii z końca 2016 roku.