سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

فارس‌نت

معرفی: 

فارس‌نت نخستین، دقیق‌ترین و بزرگ‌ترین وردنت فارسی است که در آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی و با حمایت مرکز تحقیقات مخابرات ایران توسعه یافته است. برای هر مدخل حداقل یک معنی تعریف شده و هر معنی در یک و فقط یک مجموعه ترادف شرکت می کند. کلیه مجموعه‌های ترادف یا در سلسله‌مراتب شرکت می‌کنند و یا به عنوان سرگروه معرفی می‌شوند. درضمن هر مجموعه ترادف یا حداقل یکی از اعضای آن در حداقل یک رابطۀ غیرسلسله‌مراتبی شرکت نموده است. همچنین هر مجموعه ترادف در صورت امکان به مجموعه ترادف نظیر در وردنت ۳.۱ پرینستون نگاشت شده است. در این پروژه به روال‌های نیمه‌خودکار و انسانی و با نظارت بیش از ۹۸% داده‌ها، واژگان فارسی توسط فرد خبره در قالب دسته‌های هم‌معنا قرار گرفته و بین آنها روابط معنایی ایجاد شده و دسته‌های معنایی یا به وردنت پرینستون نگاشت شده یا غیرقابل نگاشت بودن آنها ثبت شده است. برای معناهای واژگان برخی اطلاعات نحوی با توجه به مقوله نحوی تکمیل شده و بین معانی روابطی برقرار شده است. تعداد واژگان در نسخه فارس‌نت ۳ بیش از ۱۰۰۰۰۰، تعداد معناها بیش از ۱۱۳۰۰۰ و تعداد سینست‌ها بیش از ۴۱۰۰۰ و روابط بین سینست بیش از ۱۰۰۰۰۰ و تعداد نگاشت به وردنت پرینستون بیش از ۳۲۰۰۰ و روابط بین معنا بیش از ۳۱۰۰۰ رابطه است.

ویژگی‌ها: 

- برای هر مدخل واژگانی در فارس‌نت اطلاعات زیر ذخیره می‌شود:

  • اطلاعات آوایی (شکل اصلی تلفظ و گونه‌های دیگر)
  • اطلاعات نوشتاری (صورت مصوب فرهنگستان و صورت‌های دیگر)
  • اطلاعات نوشتاری (صورت مصوب فرهنگستان و صورت‌های دیگر)
  • معانی مختلف مدخل

برای مداخل ترکیب صورت نوشتاری + صورت آوایی+ مقولۀ نحوی کلید است. هر معنی در یک مجموعه ترادف شرکت می کند.

 

- برای هر مجموعه ترادف اطلاعات زیر ذخیره می‌گردد:

  • توضیح مفهوم به زبان طبیعی
  • مثالی از کاربرد این مفهوم در متن
  • روابط این مجموعه با سایر مجموعه‌ها
  • روابط معنایی موجود در فارس‌نت ممکن است میان مجموعه‌های ترادف یا میان معانی برقرار باشند. روابط میان مجموعه‌های ترادف در دو دسته روابط میان مقوله‌ای (دوسر رابطه از یک مقوله نیستند) و روابط درون‌مقوله‌ای (دوسر رابطه از یک مقوله هستند) دسته‌بندی می‌شوند.

 

- انواع روابط تحت پوشش فارس‌نت عبارتند از:

       - روابطی که در وردنت انگلیسی هم برقرارند مانند:

  • شمول و زیرشمول (مثلاً رابطه اتومبیل و وسیلۀ نقلیه)
  • جزء‌واژگی و کل‌واژگی (مثلاً رابطۀ اتومبیل و چرخ)
  • علیت (مثلاً رابطۀ کشتن و به قتل رسیدن یا بستن و بسته شدن)
  • استلزام منطقی (مثلاً رابطۀ خرخر کردن و خوابیدن)
  • رابطۀ اشتقاقی میان مقوله‌های مختلف: (مثلاً رابطۀ کلماتی چون حاکم، محکوم، محاکمه، حکومت و ...)

        - روابط جدیدی که در فارس‌نت برقرار شده‌اند مانند:

  • رابطه میان صفت و اسم ویژگی: (مثلاً رابطه میان گرم و دما )
  • رابطه میان اسم و صفت برجسته یا بالقوه: (مثلاً رابطه میان خورشید و تابان یا میان نان و بیات )
  • رابطه میان فعل و آرگومان‌های آن: (مثلاً رابطه میان خوردن و خوراکی یا میان خوردن و قاشق )
  • رابطۀ بی‌نام: ( مثلاً رابطه باهم‌آیی یا هم‌‌نشینی میان شیر و یارانه یا اقتصاد و دلار در اسناد خبری)
  • و ...

 

نگاشت میان‌زبانی (معادل و نزدیک معادل) بین مجموعه‌های ترادف فارسی و انگلیسی در فارس‌نت برقرار است و در مواردی که مفهوم خاص زبان فارسی باشد غیرقابل نگاشت اعلام شده است.

*اطلاعات ارجاع: 

Shamsfard, M.‎, Hesabi, A.‎, Fadaei, H.‎, Mansoory, N.‎, Famian, A.‎, Bagherbeigi, S.‎, Fekri, E.‎ and et al.‎ (2010)‎.‎ Semi Automatic Development of Farsnet;‎ the Persian Wordnet.‎ Proceedings of 5th Global WordNet Conference (GWA2010).‎ Mumbai, India. (دریافت)

اطلاعات انتشار:

ناشر
دانشگاه شهید بهشتی
مجوز
اختصاصی
تاریخ ثبت در پیکره‌گان
۱۳۹۲-۰۱-۱۹
تاریخ آخرین تغییر
۱۳۹۸-۰۲-۲۲
شناسه
D3920119a
آمار بازدید
۲۲۰۴۲

© ۲۰۱۸ CRCIS All Rights Reserved.‎