سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

مجموعه داده استاندارد وبلاگ‌های ایران

معرفی: 

مجموعه داده استاندارد وبلاگ‌های ایران (irBlogs) جهت ایجاد بستری مناسب برای تحقیق و ارائهٔ الگوریتم در زمینهٔ شبکه‌های اجتماعی ایرانی تولید شده است. این مجموعه شامل متون برگرفته از بیش از ۶۰۰ هزار وبلاگ (نزدیک به ۵ میلیون پست) است و گراف روابط افراد نیز برای آن تهیه شده است. علاوه بر کاربردهای ذکر شده، می‌توان از این مجموعه داده برای اهداف دیگری در حوزه‌های بازیابی اطلاعات، پردازش زبان طبیعی و مطالعهٔ زبان فارسی استفاده کرد. ناشر این مجموعه داده گروه تحقیقاتی پایگاه داده دانشکده برق و کامپیوتر دانشگاه تهران است.

*اطلاعات ارجاع: 

AleAhmad, A.‎, Zahedi, M.‎, Rahgozar, M.‎, & Moshiri, B.‎ (2016)‎.‎ irBlogs: A standard collection for studying Persian bloggers.‎ Computers in Human Behavior, 57, ۱۹۵-۲۰۷.

اطلاعات انتشار:

ناشر
دانشگاه تهران
مجوز
اختصاصی
تاریخ ثبت در پیکره‌گان
۱۳۹۴-۱۰-۱۴
تاریخ آخرین تغییر
۱۳۹۷-۱۱-۰۳
شناسه
D3941014a
آمار بازدید
۷۵۸۴

© ۲۰۱۸ CRCIS All Rights Reserved.‎