سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

پیکره واحدهای اسمی آرمان

معرفی: 

تشخیص واحدهای اسمی (یا تشخیص موجودیت‌های نامدار) یکی از موضوعات پردازش زبان طبیعی است که نیاز به پیکره دارد. پیکرهٔ واحدهای اسمی آرمان که توسط شرکت آرمان رایان شریف تولید شده است شامل ۴۰۰ هزار کلمه (۴۹۱۷ جمله برگرفته از پیکرهٔ بی‌جن‌خان) است و سه ردهٔ شخص (مثال: سید علی قاضی)، مکان (مثال: پارک آب و آتش) و سازمان (مثال: مجلس شورای اسلامی) در آن برچسب خورده است (با فرمت IOB). لازم به ذکر است که این پیکرۀ واحدهای اسمی فارسی، در حال توسعه به ۴ میلیون کلمه است و نسخهٔ جدید دارای برچسب‌های مربوط به ۶ رده (مکان، سازمان، شخص، محصول، امکانات و رویداد) خواهد بود.

*اطلاعات ارجاع: 

عبدوس، م.، مینایی بیدگلی، ب.، و قدمنان، ح. ر. (۱۳۹۴). تولید پیکرۀ واحدهای اسمی فارسی. مجموعه مقالات نخستین همایش ملی زبان‌شناسی پیکره‌ای. تهران: نشر نویسه پارسی.

اطلاعات انتشار:

ناشر
شرکت آرمان رایان شریف
شرایط استفاده

برای دریافت داده یا کسب اطلاعات بیشتر با ناشر(ان) تماس حاصل فرمایید.

مجوز
اختصاصی
تاریخ ثبت در پیکره‌گان
۱۳۹۴-۰۹-۱۷
تاریخ آخرین تغییر
۱۳۹۷-۱۱-۰۳
شناسه
D3940917a
آمار بازدید
۷۸۷۶

© ۲۰۱۸ CRCIS All Rights Reserved.‎