قیمت: رایگان
دریافت داده
معرفی:
پیکرۀ موجودیتهای نامدار آرمان (ArmanPersoNER) پیکرهای است که به صورت دستی برچسب خورده است و فقط برای کارهای پژوهشی منتشر شده است. این داده شامل ۲۵۰۰۱۵ توکن و ۷۶۸۲ جملۀ فارسی است. هر فایل حاوی یک توکن و برچسبهای دستی آنها در هر خط است چرا که هر جمله با یک خط جدا شده است. برچسبهای NER در فرمت IOB هستند. در این پیکره، ۶ نوع موجودیت نامدار (شامل شخص، سازمان، مکان، امکانات، تولیدات، و رویداد) مشخص شده است.
*اطلاعات ارجاع:
- Poostchi, H., Zare Borzeshi, E., Abdous, M., and Piccardi, M. (2016). PersoNER: Persian Named-Entity Recognition. In The 26th International Conference on Computational Linguistics (COLING 2016), ۳۳۸۱- ۳۳۸۹. Osaka, Japan.
- Poostchi, H., Zare Borzeshi, E., and Piccardi, M. (2018, May). BiLSTM-CRF for Persian Named-Entity Recognition; ArmanPersoNERCorpus: the First Entity-Annotated Persian Dataset.In The 11th Edition of the Language Resources and Evaluation Conference (LREC), Miyazaki, Japan, ISLRN 399-379-640-828-6, ISLRN 921-509-141-609-6.
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | بدون مجوز |
تاریخ ثبت در پیکرهگان | ۱۳۹۷-۰۸-۰۷ |
تاریخ آخرین تغییر | ۱۳۹۸-۰۲-۲۹ |
شناسه | P3970807a |
آمار بازدید | ۳۷۳۵ |