Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Stemming does not work at all for words ending with lithuanian characters #2

Open
emilis opened this issue Aug 17, 2010 · 0 comments
Open

Comments

@emilis
Copy link

emilis commented Aug 17, 2010

Could this be due to encodings mismatch in the library chain that I use?

Some words gathered using a Solr tokenizer including a filter for lt stemmer:

visuomenė
valstybė
saugumą
kurių
teisė
veiklą
produktų
kartą
metų
taptų
turinčių
kultūrinę
vertę
teisę
sąlygų
reikalų
kitą
valstybę
tarptautinių
profesinė
valstybės
visų
valstybinė
nuosavybė
įstaigų
informaciją
tinkamų
laisvė
aplinkybių
apsaugą
institucijų
susiję
kokybę
šalį
vietą
modelį
produkciją
interesų
materialinė
pavyzdžių
priemonių

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant