Skip to content

Persian news dataset include more than 175,000 news crawled from 5 different News Agency.

Notifications You must be signed in to change notification settings

milad-4274/persian_news

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Persian News Dataset | دیتاست اخبار فارسی

Persian news dataset include more than 175,000 news crawled from 5 different News Agency.

‫ دیتاستی از اخبار فارسی شامل بیش از ۱۷۵ هزار خبر که از خبرگزاری‌های مختلف جمع آوری شده است.

Categories

‫ دسته بندی اخبار:

id name
1 یادداشت
2 سیاست
3 ورزش
4 بین‌الملل
5 اقتصادی
6 اجتماعی
7 فرهنگی
8 بازار
9 تکنولوژی

Websites

‫ تمامی اخبار از وبسایت خبرگزاری‌های زیر جمع آوری شده:

  • خبرگزاری تسنیم

  • خبرگزاری ایسنا

  • خبرگزاری فارس

  • دویچه وله فارسی

  • رادیوفردا

Usage

  1. clone repository:
git clone https://github.com/milad-4274/persian_news.git
  1. download categorized data. There is two way two download data:
  • run prepared script:
python download_data.py

About

Persian news dataset include more than 175,000 news crawled from 5 different News Agency.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages