قیمت: نامشخص
Toggle dropdown دریافت داده
تشخیص واحدهای اسمی (یا تشخیص موجودیتهای نامدار) یکی از موضوعات پردازش زبان طبیعی است که نیاز به پیکره دارد. پیکرهٔ واحدهای اسمی آرمان که توسط شرکت آرمان رایان شریف تولید شده است شامل ۴۰۰ هزار کلمه (۴۹۱۷ جمله برگرفته از پیکرهٔ بیجنخان) است و سه ردهٔ شخص (مثال: سید علی قاضی)، مکان (مثال: پارک آب و آتش) و سازمان (مثال: مجلس شورای اسلامی) در آن برچسب خورده است (با فرمت IOB). لازم به ذکر است که این پیکرۀ واحدهای اسمی فارسی، در حال توسعه به ۴ میلیون کلمه است و نسخهٔ جدید دارای برچسبهای مربوط به ۶ رده (مکان، سازمان، شخص، محصول، امکانات و رویداد) خواهد بود.
عبدوس، م.، مینایی بیدگلی، ب.، و قدمنان، ح. ر. (۱۳۹۴). تولید پیکرۀ واحدهای اسمی فارسی. مجموعه مقالات نخستین همایش ملی زبانشناسی پیکرهای. تهران: نشر نویسه پارسی.
اطلاعات انتشار:
ناشر | |
---|---|
شرایط استفاده | برای دریافت داده یا کسب اطلاعات بیشتر با ناشر(ان) تماس حاصل فرمایید. |
مجوز | اختصاصی |
تاریخ ثبت در پیکرهگان | ۱۳۹۴-۰۹-۱۷ |
تاریخ آخرین تغییر | ۱۳۹۷-۱۱-۰۳ |
شناسه | D3940917a |
آمار بازدید | ۷۸۱۹ |