قیمت: رایگان
پیکرهٔ درختی وابستگی فارسی اوپسالا (UPDT) مجموعهای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگرفته از پیکره فارسی اوپسالا (UPC - نسخهای تغییریافته از پیکرهٔ بیجنخان) میباشد و بر اساس قالب conll و طرح برچسبزنی Stanford Typed Dependencies تهیه شده است. ناشر این پیکره دپارتمان زبانشناسی و فیلولوژی، دانشگاه اوپسالا، سوئد است.
Seraji, M. (2015). Morphosyntactic Corpora and Tools for Persian. Doctoral dissertation, Uppsala University. Studia Linguistica Upsaliensia 16. (دریافت)
این داده حاصل رسالۀ دکتری بوده که اطلاعات کامل و جامعی را از این داده در ۵۰ صفحه از ابتدا تا پایان کار، همراه با طرح کامل برچسبزنی نحوی و مثالهای گوناگون در اختیار خواننده قرار میدهد (سراجی، ۲۰۱۵، ۱۴۶-۹۷). توضیحات تقسیمبندی جمله (sentence segmentation and tokenization) و برچسبزنی صرفی نیز در صفحات ۸۱-۶۸ آمده است.
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | |
تاریخ ثبت در پیکرهگان | ۱۳۹۲-۰۴-۰۴ |
تاریخ آخرین تغییر | ۱۳۹۸-۰۲-۲۹ |
شناسه | D3920404a |
آمار بازدید | ۹۳۱۷ |