پیکره گان | پایگاه انتشار و تولید داده‌های زبانی

پیکره تک‌زبانه فارسی ارزیابی سامانه‌های تشخیص دستبرد علمی

قیمت: رایگان

معرفی:

پیکرهٔ حاضر که با هدف ارزیابی سامانه‌های تقلب‌یاب تهیه شده است مشتمل بر بیش از ۱۵۰۰ سند فارسی از ویکی‌پدیا است که ۴۱۱ نمونه تقلب در آن‌ها گنجانده شده است. در قسمت‌های حاوی تقلب فرایندهایی چون جابجایی کلمات، حذف و اضافه نمودن کلمات و جایگزین نمودن کلمات با کلمات هم‌معنا اعمال شده است. این پیکره در سومین دوره مسابقات بین‌المللی هوش مصنوعی جام دانشگاه صنعتی امیرکبیر (AAIC 2015) جهت ارزیابی سامانه‌های کشف تقلب مورد استفاده قرار گرفته است. ناشر این پیکره پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی بوده و با حمایت مالی معاونت علمی و فناوری ریاست جمهوری تهیه شده است.

*اطلاعات ارجاع:

Khoshnavataher, K.‎, Zarrabi, V.‎, Mohtaj, S.‎, & Asghari, H.‎ (2015)‎.‎ Developing Monolingual Persian Corpus for Extrinsic Plagiarism Detection Using Artificial Obfuscation.‎ In The 13th Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse ‪(PAN15)‬.‎ (دریافت)

اطلاعات انتشار:

ناشر	جهاد دانشگاهی
مجوز	اختصاصی
تاریخ ثبت در پیکره‌گان	۱۳۹۴-۰۵-۳۱
تاریخ آخرین تغییر	۱۳۹۸-۰۱-۱۸
شناسه	D3940531a
آمار بازدید	۶۵۶۵

سبد خرید شما

اطلاعات داده

پیکره تک‌زبانه فارسی ارزیابی سامانه‌های تشخیص دستبرد علمی

اطلاعات انتشار:

دربارۀ ما

تماس با ما