قیمت: رایگان
دریافت داده
پیکرهٔ حاضر که با هدف ارزیابی سامانههای تقلبیاب تهیه شده است مشتمل بر بیش از ۱۵۰۰ سند فارسی از ویکیپدیا است که ۴۱۱ نمونه تقلب در آنها گنجانده شده است. در قسمتهای حاوی تقلب فرایندهایی چون جابجایی کلمات، حذف و اضافه نمودن کلمات و جایگزین نمودن کلمات با کلمات هممعنا اعمال شده است. این پیکره در سومین دوره مسابقات بینالمللی هوش مصنوعی جام دانشگاه صنعتی امیرکبیر (AAIC 2015) جهت ارزیابی سامانههای کشف تقلب مورد استفاده قرار گرفته است. ناشر این پیکره پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی بوده و با حمایت مالی معاونت علمی و فناوری ریاست جمهوری تهیه شده است.
Khoshnavataher, K., Zarrabi, V., Mohtaj, S., & Asghari, H. (2015). Developing Monolingual Persian Corpus for Extrinsic Plagiarism Detection Using Artificial Obfuscation. In The 13th Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse (PAN15). (دریافت)
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | اختصاصی |
تاریخ ثبت در پیکرهگان | ۱۳۹۴-۰۵-۳۱ |
تاریخ آخرین تغییر | ۱۳۹۸-۰۱-۱۸ |
شناسه | D3940531a |
آمار بازدید | ۶۰۵۸ |