-
Notifications
You must be signed in to change notification settings - Fork 4
/
Copy pathtoys.py
51 lines (39 loc) · 1.63 KB
/
toys.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
from pprint import pprint
data = """
Muchos años después, frente al pelotón de fusilamiento, el coronel Aureliano Buendía había de
recordar aquella tarde remota en que su padre lo llevó a conocer el hielo. Macondo era entonces
una aldea de veinte casas de barro y cañabrava construidas a la orilla de un río de aguas diáfanas
que se precipitaban por un lecho de piedras pulidas, blancas y enormes como huevos
prehistóricos. El mundo era tan reciente, que muchas cosas carecían de nombre, y para
mencionarlas había que señalarías con el dedo.
"""
import lingwars
lingwars.download()
from lingwars.utils.install.pattern import build_parser
parser = build_parser('C:/Users/jgarcia.GIG/lingwars/brill')
r = parser.parse("El gato se sentó en la alfombra.")
from pprint import pprint
pprint(r)
raise Done()
from lingwars.text import Text, Word, Sentence
def dump_sentence(texto):
print("----")
s = Sentence(texto)
[w.print() for w in s.pos_words]
#dump_sentence("Los dos lados de la cama")
dump_sentence("El Real Madrid ha ganado 20 copas de Europa")
#dump_sentence("ha querido dejárselo largo")
dump_sentence("La palabra adfadfsr acabo de inventármela ahora")
dump_sentence("los entregué a la policía.")
dump_sentence("dilo que me llame.")
"""
# A little bit of text
text = Text(data)
from lingwars.text.word.filters import RemoveStopWords, RemovePunctuation, RemoveByEAGLES
filters = [RemoveStopWords(), RemovePunctuation()]
cnt = text.count_words(filters)
print(cnt.most_common(3))
filters = [RemoveStopWords(), RemovePunctuation(), RemoveByEAGLES(codes=['F', 'SPS', 'DA',])]
cnt = text.count_lemmas(filters=filters)
pprint(cnt)
"""