قیمت: رایگان
پیکرۀ سِنتیپِرس (SentiPers) شامل مجموعهای از جملات فارسی با برچسبهای حاوی بار معنایی است که در پردازش زبان طبیعی و به طور مشخص در زمینۀ تحلیل احساس یا عقیدهکاوی کاربرد دارد. با توجه به ویژگیهای این پیکره، میتوان آن را در نوع خود اولین پیکرۀ تحلیل احساس برای زبان فارسی با چنین مشخصاتی به شمار آورد. گفتنی است که دامنۀ جملات موجود در پیکره مربوط به حوزۀ کالاهای دیجیتال است. همچنین این پیکره شامل جملاتی، هم به صورت رسمی و هم به صورت نوشتاری عامیانه یا غیررسمی است. پروژۀ توسعۀ این پیکره ادامه دارد و پیکرۀ حاضر که تحت عنوان بخش اول کار ارائه شده است مشتمل بر حدود ۱۱۰۰ جملهٔ برچسبخورده است. این پیکره در گروه پردازش زبان طبیعی دانشگاه گیلان تولید شده است.
Hosseini, P., Ramaki, A. A., Maleki, H., Anvari, M., & Mirroshandel, S. A. (2018). SentiPers: A Sentiment Analysis Corpus for Persian. arXiv preprint arXiv:1801.07737. (دریافت)
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | اختصاصی |
تاریخ ثبت در پیکرهگان | ۱۳۹۴-۰۴-۲۳ |
تاریخ آخرین تغییر | ۱۳۹۹-۱۱-۲۶ |
شناسه | D3940423a |
آمار بازدید | ۱۰۹۵۳ |