سبد خرید شما

اطلاعات داده

حجم: ۷.۶۳ MB
فرمت: txt
وضعیت دریافت: درون سازمانی

پیکره گزاره‌های معنایی زبان فارسی

معرفی: 

پیکرۀ گزاره‌های معنایی زبان فارسی با هدف تشخیص تنوع‌های معنایی که گزاره‌های نحوی یکسان دارند یا تنوعات نحوی که در واقع به لحاظ معنایی یکسان هستند، ایجاد شد؛ توضیح آنکه برچسب‌زنی صرفی و نحوی تا حدود زیادی یادگیری معنا را برای ماشین تسهیل می‌کند اما به دلیل تنوعات زبانی و پیچیدگی‌های آن برای تحلیل زبان کافی نیست. برای دستیابی به معنا نیاز است تا سطوح عینی وسیله‌ای قرار گیرند برای آنکه سطوح انتزاعی‌تر و نهایتاً معنا قابل دسترس شوند. این پیکره لایه‌ای از اطلاعات معنایی موضوع-محمول را بر روی پیکرۀ برچسب‌خوردۀ صرف و نحو دادگان زبان فارسی با حجمی حدود ۳۰ هزار جمله قرار داده است. پیکرۀ گزاره‌های معنایی توسط پژوهشگران گروه پیکره و دادگان مرکز تحقیقات کامپیوتری علوم اسلامی (نور) و با حمایت سازمان فناوری اطلاعات تولید شده است.

ویژگی‌ها: 
  • داده‌ای که برچسب‌گذاری معنایی روی آن صورت گرفته است، پیکره وابستگی نحوی زبان فارسی است.
  • حدود ۶۰۰۰ جمله به صورت دوبرچسبی برچسب‌گذاری شده است تا توافق میان برچسب‌زنان قابل بررسی باشد.
  • محمول‌هایی که در این پیکره برچسب‌گذاری شده‌اند شامل محمول‌های فعلی، اسمی و صفتی هستند.
تعداد کل جملات ۲۹۹۸۲
میانگین طول هر جمله  ۱۶/۶۱
تعداد کل افعال ۶۲۸۸۹
  تعداد فعل منحصربه‌فرد ۹۲۰۰
تعداد اسم‌های گزاره‌ای منحصربه‌فرد ۱۳۰۰
    تعداد صفات گزاره‌ای منحصربه‌فرد ۳۰۰ 
*اطلاعات ارجاع: 

Mirzaei, A.‎, and Moloodi, A.‎ S.‎ (2016)‎.‎ Persian Proposition Bank.‎ ۱۰th Language Resources and Evaluation Conference ‪(Lrec2016)‬, ۳۸۲۸-۳۸۳۵. (دریافت)

سایر مستندات: 

میرزائی، آ.، مولودی، ا. س. (۱۳۹۳). نخستین پیکرۀ نقش‌های معنایی زبان فارسی، علم زبان، ۲(۳)، ۴۸-۲۹. (دریافت)

اعضای پروژه: 

سرپرستی پروژه و پژوهش زبان‌شناسی (گزاره‌های معنایی فعلی)

  • آزاده میرزائی، دکترای زبان‌شناسی، دانشگاه علامه طباطبائی

 

پژوهش زبان‌شناسی (گزاره‌های معنایی اسمی)

  • امیرسعید مولودی، دانشجوی دکتری زبان‌شناسی، دانشگاه تهران

 

پژوهش رایانشی

  • فاطمه صدقی، کارشناس ارشد هوش مصنوعی، دانشگاه الزهرا

 

برچسب‌زنی زبان‌شناختی

  • ندا پورمرتضی خامنه، کارشناس ارشد زبان و ادبیات فارسی، دانشگاه آزاد اسلامی
  • پری‌ناز دادرس، دانشجوی کارشناسی ارشد زبان‌شناسی، دانشگاه تهران
  • مرتضی رضائی شریف‌آبادی، دانشجوی کارشناسی ارشد زبان‌شناسی رایانشی، دانشگاه صنعتی شریف
  • سلیمه زمانی، کارشناس ارشد زبان‌شناسی، دانشگاه آزاد اسلامی علوم و تحقیقات
  • اکرم شفیعی، کارشناس ارشد زبان‌شناسی، دانشگاه تهران
  • سعیده قدردوست نخچی، دانشجوی دکتری زبان‌شناسی ، دانشگاه تهران
  • منوچهر کوهستانی، دانشجوی دکتری زبان‌شناسی، دانشگاه تربیت مدرس
  • مصطفی مهدوی، دانشجوی دکتری زبان‌شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی

 

برنامه‌نویسی و ابزارسازی

  • فاطمه صدقی، کارشناس ارشد هوش مصنوعی، دانشگاه الزهرا
  • پگاه صفری، کارشناس ارشد هوش مصنوعی، دانشگاه الزهرا

اطلاعات انتشار:

ناشر
سازمان فناوری اطلاعات ایران
مجوز
تاریخ ثبت در پیکره‌گان
۱۳۹۶-۰۹-۲۵
تاریخ آخرین تغییر
۱۳۹۹-۰۶-۰۲
شناسه
P3960925a
آمار بازدید
۷۵۸۰

© ۲۰۱۸ CRCIS All Rights Reserved.‎