قیمت: رایگان
معرفی:
پرسیکا پیکرهای است حاوی متون خبری برگرفته از خبرگزاری ایسنا. متون این پیکره در یازده طبقهٔ موضوعی شامل ورزشی، اقتصادی، فرهنگی، مذهبی، تاریخی، سیاسی، علمی، اجتماعی، آموزشی، حقوق قضایی و بهداشت طبقهبندی شدهاند و پیشپردازشهایی به منظور قابل استفاده بودن در کاربردهای مختلف پردازش زبان طبیعی و دادهکاوی بر روی آنها انجام گرفته است.
*اطلاعات ارجاع:
Eghbalzadeh, H., Hosseini, B., Khadivi, S., and Khodabakhsh, A. (2012, November). Persica: A Persian Corpus for Multipurpose Text Mining and Natural Language Processing. In Sixth International Symposium on Telecommunications (IST). IEEE. Tehran. (دریافت)
اطلاعات تکمیلی:
http://sourceforge.net/projects/persica
این مجموعه در دو قالب SQL و CVS برای دانلود موجود است.
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | |
تاریخ ثبت در پیکرهگان | ۱۳۹۲-۱۱-۱۵ |
تاریخ آخرین تغییر | ۱۳۹۷-۱۱-۰۳ |
شناسه | D3921115a |
آمار بازدید | ۱۲۳۴۴ |