قیمت: رایگان
دریافت داده
معرفی:
پیکرۀ موازی انگلیسی-فارسی مستخرج از ویکیپدیا (PEPC - Parallel English-Persian Corpus Extracted from Wikipedia) مجموعهای از جملات انگلیسی و فارسی است که بر اساس روشی دوسویه از اسناد ویکیپدیا استخراج شده است. این پیکره حاوی حدود ۲۰۰ هزار جفت جمله است که بر اساس میزان شباهت محاسبهشده به صورت خودکار مرتبسازی شدهاند.
*اطلاعات ارجاع:
Karimi, A., Ansari, E., and Sadeghi Bigham, B. (2017). Extracting an English-Persian Parallel Corpus from Comparable Corpora. CoRR, abs/1711.00681. (دریافت)
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | بدون مجوز |
تاریخ ثبت در پیکرهگان | ۱۳۹۷-۰۳-۰۷ |
تاریخ آخرین تغییر | ۱۳۹۷-۱۲-۱۳ |
شناسه | P3970307c |
آمار بازدید | ۲۰۷۵ |