سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

پیکره درختی وابستگی فارسی اوپسالا

معرفی: 

پیکرهٔ درختی وابستگی فارسی اوپسالا (UPDT) مجموعه‌ای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگرفته از پیکره فارسی اوپسالا (UPC - نسخه‌ای تغییریافته از پیکرهٔ بی‌جن‌خان) می‌باشد و بر اساس قالب conll و طرح برچسب‌زنی Stanford Typed Dependencies تهیه شده است. ناشر این پیکره دپارتمان زبان‌شناسی و فیلولوژی، دانشگاه اوپسالا، سوئد است.

*اطلاعات ارجاع: 

Seraji, M.‎ (2015)‎.‎ Morphosyntactic Corpora and Tools for Persian.‎ Doctoral dissertation, Uppsala University.‎ Studia Linguistica Upsaliensia 16.‎ (دریافت)

اطلاعات تکمیلی: 

این داده حاصل رسالۀ دکتری بوده که اطلاعات کامل و جامعی را از این داده در ۵۰  صفحه از ابتدا تا پایان کار، همراه با طرح کامل برچسب‌زنی نحوی و مثال‌های گوناگون در اختیار خواننده قرار می‌دهد (سراجی، ۲۰۱۵، ۱۴۶-۹۷). توضیحات تقسیم‌بندی جمله (sentence segmentation and tokenization) و برچسب‌زنی صرفی نیز در صفحات ۸۱-۶۸ آمده است.

اطلاعات انتشار:

ناشر
دانشگاه اوپسالا
مجوز
تاریخ ثبت در پیکره‌گان
۱۳۹۲-۰۴-۰۴
تاریخ آخرین تغییر
۱۳۹۸-۰۲-۲۹
شناسه
D3920404a
آمار بازدید
۸۸۰۵

© ۲۰۱۸ CRCIS All Rights Reserved.‎