concepts-parser
Version:
Concepts Extracting from text
76 lines (75 loc) • 1.04 kB
Plain Text
# aeroportul frankfurt
# închisoarea sighet, închisoarea din sighet
[îi]nchiso(area|rii)( din)?
aeroportul\w*
aeroportul\w* de la
aeroportul\w* din
aren(a|ei)
arhiepiscop\w* de
biseric(a|ii)
cantonul(ui)?
cartierul\w*
cascada
cascadei
castelul
castelul\w* regal( de la)?
catedra\w+ mitropolitan\w+( din)?
cimitirul\w*
colegiul(ui)?
contes[ăa] de
contesa
de[sș]ertul
dinasti(a|ei)
dosarul
dosarul\w*
duces[ăa] de
ducesa
f[aâ]nt[aâ]n(ii|a)
festivalul\w*( interna[țt]ional| na[țt]ional|)?
fluviul(ui)?
gazoductu\w*
golful(ui)?
hotelul
insula
insulei
insulele
insulelor
jude[tț]ul\w*
lacul
liceul(ui)?
m[aă]n[aă]stir(ea|ii)
m[aă]n[aă]stir\w+
mun[tț]ii
muntele
muntelui
oceanul
organiza[tț]i\w+
palatul
papa
papei
parcul(ui)?
partidul\w*
pasajul\w*
pia[tț]a
podul
podului
prefectur(a|ii)
premiil\w+
premiu\w*
prin[tț]es(a|ei)
prin[tț]ul\w*
principel\w+
principes(a|ei)
provinci(a|ei)
r[aâîi]ul\w*
raionul\w*
regiun(ea|ei|ii)
sectorul(ui)?
spitalul
stadionul\w*
statul
statului
turnul(ui)?
universitatea
uraganul\w*
vulcanul\w*