存放了数据科学基础期末大作业的代码以及相关数据 数据文件说明: 201912,202001,202002,202003,202004,202005,202006为我们爬取下来的新闻,以标题,时间和内容存储在excel中 file201912,file202001,file202002,file202003,file202004,file202005,file202006为excel转成txt文件,方便处理,内容与上面excel文件相同 201912top10,202001top10等文件则是每个月出现次数最多的十个词及其出现次数 人民日报和央视新闻为爬下来的评论内容以及点赞数量 py文件说明: spider中的代码为爬取新闻以及分析新闻的代码 wordcloudest中的代码为数据可视化所用到的代码 Annalysis开头的和Extract开头的文件为评论中心态分析的代码
Congee01/DataScience-Homework
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|