Arytmetyka wyrazów
Semantyka kompozycyjna języka opiera
się na założeniu, że znaczenie złożonych form językowych wynika ze znaczenia ich części składowych. Częstym sposobem
reprezentacji znaczenia form wielowyrazowych jest suma lub średnia arytmetyczna wektorów odpowiadających poszczególnym
wyrazom wchodzących w skład danej formy. Również analogie werbalne mogą być przedstawione przez
wyrażenia wektorowe. Np. analogia z 'królem' i 'królową' opisana w zakładce Analogie
może być opisana przy pomocy wyrażenia wektorowego król + kobieta - mężczyzna. Słowo 'królowa' powinno
odpowiadać wektorowi, który jest najbliższy wynikowi tego wyrażenia w sensie miary kosinusowej.
Przez wyrażenie wektorowe rozumieć będziemy każde wyrażenie postaci: x, p * x, p / x, x + y, x - y, x * y, x # y, [x] oraz (x), gdzie
p jest liczbą rzeczywistą różną od 0, a x i y są wektorami reprezentowanymi przez słowa lub wyrażeniami wektorowymi.
operacja | ||
---|---|---|
x + y | zi = xi + yi | |
x - y | zi = xi - yi | |
x * y | zi = 0 | jeśli |xi| = |yi| i sign(xi) ≠ sign(yi) |
zi = sign(xi)xi yi | jeśli |xi| > |yi| | |
zi = sign(yi)xi yi | jeśli |xi| < |yi| | |
x # y | zi = 0 | jeśli |xi| = |yi| i sign(xi) ≠ sign(yi) |
zi = xi | jeśli |xi| > |yi| lub |xi| = |yi| i sign(xi) = sign(yi) | |
zi = yi | jeśli |xi| < |yi| | |
[x] | normalizacja wektora x o długości większej od 0.0: wektor [x] ma długość równą 1.0 |
Do obliczeń wybrane zostały dwa modele: nkjp+wiki-forms-all-300-skipg-hs-50 (w przypadku form) oraz nkjp+wiki-lemmas-all-300-cbow-ns-50 (w przypadku lematów).