Skip to content

Latest commit

 

History

History
55 lines (37 loc) · 1.32 KB

README.md

File metadata and controls

55 lines (37 loc) · 1.32 KB

Persian News Dataset | دیتاست اخبار فارسی

Persian news dataset include more than 175,000 news crawled from 5 different News Agency.

‫ دیتاستی از اخبار فارسی شامل بیش از ۱۷۵ هزار خبر که از خبرگزاری‌های مختلف جمع آوری شده است.

Categories

‫ دسته بندی اخبار:

id name
1 یادداشت
2 سیاست
3 ورزش
4 بین‌الملل
5 اقتصادی
6 اجتماعی
7 فرهنگی
8 بازار
9 تکنولوژی

Websites

‫ تمامی اخبار از وبسایت خبرگزاری‌های زیر جمع آوری شده:

  • خبرگزاری تسنیم

  • خبرگزاری ایسنا

  • خبرگزاری فارس

  • دویچه وله فارسی

  • رادیوفردا

Usage

  1. clone repository:
git clone https://github.com/milad-4274/persian_news.git
  1. download categorized data. There is two way two download data:
  • run prepared script:
python download_data.py