一、数据说明:
数据来源:人民网留言板(http://liuyan.people.com.cn/threads/list?fid=541#state=4)
收集方式:python,手工整理
收集过程:首先爬虫对数据进行爬取,然后再通过python等对数据进行清洗。
数据量:2020年12月25日之前人民网留言板的370000多条数据。
数据格式:excel格式,及do文件。
变量:
`tid` int(6) NOT NULL COMMENT '用户id',
`userId` int(6) DEFAULT NULL,
`nickName` varchar(100) DEFAULT NULL COMMENT '用户昵称',
`ip` varchar(100) DEFAULT NULL COMMENT '用户的ip地址',
`threadsCheckTime` datetime DEFAULT NULL COMMENT '提问时间',
`dateline` datetime DEFAULT NULL COMMENT '该时间不清楚',
`domainName` varchar(50) DEFAULT NULL COMMENT '领域名称',
`domainId` int(6) DEFAULT NULL COMMENT '领域id',
`typeName` varchar(50) DEFAULT NULL COMMENT '类型名称',
`typeId` int(6) DEFAULT NULL COMMENT '类型id',
`sourceName` varchar(100) DEFAULT NULL COMMENT '来源',
`from` varchar(100) DEFAULT NULL COMMENT '用户来源',
`subject` text COMMENT '问题标题',
`content` text COMMENT '问题内容',
`stateInfo` varchar(100) DEFAULT NULL COMMENT '办理状态',
`traceInfo` varchar(100) DEFAULT NULL COMMENT '回复状态',
`processInfo` varchar(100) DEFAULT NULL COMMENT '交办状态',
`fid` int(6) DEFAULT NULL COMMENT '发送领导id',
`forumName` varchar(100) DEFAULT NULL COMMENT '发送领导名称',
`favNum` int(11) DEFAULT NULL COMMENT '点赞',
`answeruserName` varchar(100) DEFAULT NULL COMMENT '被回复人',
`answerContent` text COMMENT '回复内容',
`answerDateline` datetime DEFAULT NULL COMMENT '回复时间',
数据:
留言
大小:(76 Bytes)
只需: RMB 99元
马上下载
附件: