سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

پرسیکا (پیکره متون خبری)

معرفی: 

پرسیکا پیکره‌ای است حاوی متون خبری برگرفته از خبرگزاری ایسنا. متون این پیکره در یازده طبقهٔ موضوعی شامل ورزشی، اقتصادی، فرهنگی، مذهبی، تاریخی، سیاسی، علمی، اجتماعی، آموزشی، حقوق قضایی و بهداشت طبقه‌بندی شده‌اند و پیش‌پردازش‌هایی به منظور قابل استفاده بودن در کاربردهای مختلف پردازش زبان طبیعی و داده‌کاوی بر روی آن‌ها انجام گرفته است.

*اطلاعات ارجاع: 

Eghbalzadeh, H.‎, Hosseini,  B.‎, Khadivi, S.‎, and Khodabakhsh,  A.‎ (2012, November).‎ Persica: A Persian Corpus for Multipurpose Text Mining and Natural Language Processing.‎ In Sixth International Symposium on Telecommunications ‪(IST)‬.‎ IEEE.‎ Tehran.‎ (دریافت)

اطلاعات تکمیلی: 

http://sourceforge.net/projects/persica

این مجموعه در دو قالب SQL و CVS برای دانلود موجود است.

اطلاعات انتشار:

ناشر
پژوهشگر(ان) طرح
مجوز
تاریخ ثبت در پیکره‌گان
۱۳۹۲-۱۱-۱۵
تاریخ آخرین تغییر
۱۳۹۷-۱۱-۰۳
شناسه
D3921115a
آمار بازدید
۱۲۳۴۴

© ۲۰۱۸ CRCIS All Rights Reserved.‎