سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: درون سازمانی

پیکره موجودیت‌های نامدار کارانس

  • قیمت: نامشخص

    دریافت داده
معرفی: 

پیکرهٔ موجودیت‌های نامدار کارانس که توسط شرکت کارانس ایرانیان تولید شده است شامل ۵۰۰ هزار واژه است که از پایگاه‌های اینترنتی خبری جمع‌آوری شده است. همچنین برای توسعۀ واژه‌ها، از اسامی موجود در ویکی‌پدیا و بانک‌های اسامی دیگر نیز استفاده شده است. در این پیکره، سه دسته‌بندی اصلی موجودیت‌های نامدار یعنی مکان (LOC)، سازمان (ORG) و اشخاص (PER) برچسب خورده است (با فرمت IOB). برچسب‌زنی این پیکره به صورت نیمه‌خودکار انجام شده است و برچسب‌هایی که توسط عامل انسانی روی بخشی از پیکره زده شده‌اند، توسط ماشین به تمام پیکره تعمیم یافته است.

*اطلاعات ارجاع: 

بشری موحد، م. ح.، خالقی، س. م.، و مینایی بیدگلی، ب. (۱۳۹۵). پیکره موجودیت‌های نامدار کارانس، تلاشی برای توسعۀ نیمه‌خودکار پیکرۀ زبانی. مجموعه مقالات دومین همایش ملی زبان‌شناسی پیکره‌ای. تهران: نشر نویسه پارسی.

اطلاعات انتشار:

ناشر
شرکت کارانس ایرانیان
شرایط استفاده

برای دریافت داده یا کسب اطلاعات بیشتر با ناشر(ان) تماس حاصل فرمایید.

مجوز
نامشخص
تاریخ ثبت در پیکره‌گان
۱۳۹۶-۱۰-۰۶
تاریخ آخرین تغییر
۱۳۹۷-۱۲-۰۸
شناسه
p3961006a
آمار بازدید
۳۲۹۰

© ۲۰۱۸ CRCIS All Rights Reserved.‎