قیمت: رایگان
دریافت داده
معرفی:
مجموعه داده استاندارد وبلاگهای ایران (irBlogs) جهت ایجاد بستری مناسب برای تحقیق و ارائهٔ الگوریتم در زمینهٔ شبکههای اجتماعی ایرانی تولید شده است. این مجموعه شامل متون برگرفته از بیش از ۶۰۰ هزار وبلاگ (نزدیک به ۵ میلیون پست) است و گراف روابط افراد نیز برای آن تهیه شده است. علاوه بر کاربردهای ذکر شده، میتوان از این مجموعه داده برای اهداف دیگری در حوزههای بازیابی اطلاعات، پردازش زبان طبیعی و مطالعهٔ زبان فارسی استفاده کرد. ناشر این مجموعه داده گروه تحقیقاتی پایگاه داده دانشکده برق و کامپیوتر دانشگاه تهران است.
*اطلاعات ارجاع:
AleAhmad, A., Zahedi, M., Rahgozar, M., & Moshiri, B. (2016). irBlogs: A standard collection for studying Persian bloggers. Computers in Human Behavior, 57, ۱۹۵-۲۰۷.
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | اختصاصی |
تاریخ ثبت در پیکرهگان | ۱۳۹۴-۱۰-۱۴ |
تاریخ آخرین تغییر | ۱۳۹۷-۱۱-۰۳ |
شناسه | D3941014a |
آمار بازدید | ۷۹۱۹ |