ՀայՇտեմ

ArmTreeBank

«ՀայՇտեմ»-ը բազմամակարդակ որոնման համակարգով ու բարդ հարցումների հնարավորությամբ թվային մասնագիտացված կորպուս է՝ ուղղված արդի գրական արևելահայերեն տեքստերի շարահյուսական ծառերի շտեմարան (Treebank) ստեղծելու հիմնական նպատակին։

Լեզվական համաժամանակյա իրավիճակի ներկայացվածությունը կորպուսում ապահովվում է գեղարվեստական արձակ տեքստերի ու պարբերական մամուլից տարաբնույթ հրապարակումների միջոցով։ «ՀայՇտեմ»-ն ունի նաև բուհական լեզվաբանական դասագրքերից վերցված օրինակների ենթակորպուս (կորպուսի մասնագիտացված բնույթը)։ Կորպուսը պարունակում է շուրջ 100 հազար բառամթերք և 5 հազար շարահյուսական ծառ՝ ենթադրությամբ, որ այս ծավալը բավարար է լեզվական միավորների վերլուծության օրինաչափ հաճախականություն ապահովելու համար։

«ՀայՇտեմ»-ի մշակումները հիմնվում են տեքստի վերլուծության հաջորդական, բազմամակարդակ ներկայացման վրա. այն պարունակում է մոդուլային հետևյալ բաղադրիչները.

Գրանշանային վերլուծություն (բառանիշավորում, Tokenization and Word Segmentation),
Ձևաբանական վերլուծություն (բառույթավորում, խոսքիմասային ծանոթագրում, POS Tagging),
Շարահյուսական վերլուծություն (նախադասությունների կախվածության ծառերի կառուցում, Parsing)։

«ՀայՇտեմ»-ի հիմնական առավելությունն, այսպիսով, տեքստի խորը ծանոթագրումն է. կորպուսում յուրաքանչյուր բառանիշ պիտակավորված է ձևաբանորեն, լիովին նկարագրված է նախադասությունների շարահյուսական կառուցվածքը։ Լեզվաբանական ծանոթագրման համակարգը համահունչ է UD նախագծի մշակումներին և տրվում է CoNLL-U ձևաչափով։

«ՀայՇտեմ»-ի մշակումները բաց են, արտոնագրված ազատ հասանելիության CC-BY-SA պայմաններին համապատասխան։

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
bibliography		bibliography
core		core
dictionaries		dictionaries
parsers		parsers
settings		settings
sync		sync
templates		templates
tokenization		tokenization
user		user
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
manage.py		manage.py
urls.py		urls.py
wsgi.py		wsgi.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ՀայՇտեմ

ArmTreeBank

About

Releases

Packages

Languages

Armtreebank/Website

Folders and files

Latest commit

History

Repository files navigation

ՀայՇտեմ

ArmTreeBank

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages