قیمت: نامشخص
دریافت داده
پیکرهٔ موجودیتهای نامدار کارانس که توسط شرکت کارانس ایرانیان تولید شده است شامل ۵۰۰ هزار واژه است که از پایگاههای اینترنتی خبری جمعآوری شده است. همچنین برای توسعۀ واژهها، از اسامی موجود در ویکیپدیا و بانکهای اسامی دیگر نیز استفاده شده است. در این پیکره، سه دستهبندی اصلی موجودیتهای نامدار یعنی مکان (LOC)، سازمان (ORG) و اشخاص (PER) برچسب خورده است (با فرمت IOB). برچسبزنی این پیکره به صورت نیمهخودکار انجام شده است و برچسبهایی که توسط عامل انسانی روی بخشی از پیکره زده شدهاند، توسط ماشین به تمام پیکره تعمیم یافته است.
بشری موحد، م. ح.، خالقی، س. م.، و مینایی بیدگلی، ب. (۱۳۹۵). پیکره موجودیتهای نامدار کارانس، تلاشی برای توسعۀ نیمهخودکار پیکرۀ زبانی. مجموعه مقالات دومین همایش ملی زبانشناسی پیکرهای. تهران: نشر نویسه پارسی.
اطلاعات انتشار:
ناشر | |
---|---|
شرایط استفاده | برای دریافت داده یا کسب اطلاعات بیشتر با ناشر(ان) تماس حاصل فرمایید. |
مجوز | نامشخص |
تاریخ ثبت در پیکرهگان | ۱۳۹۶-۱۰-۰۶ |
تاریخ آخرین تغییر | ۱۳۹۷-۱۲-۰۸ |
شناسه | p3961006a |
آمار بازدید | ۳۶۳۹ |