*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 数据收集 | URL、标题、日期、内容、作者、来源等 |
2 | 数据清洗 | HTML标签清除、空格去除、特殊字符处理、编码转换、前后空行删除等 |
3 | 数据过滤 | 关键词过滤、正则表达式过滤、停用词过滤、文本长度过滤、日期过滤等 |
4 | 数据转换 | 文本转HTML、HTML转文本、字符串提取、字符串替换、字符串拼接等 |
5 | 数据抽取 | 正文抽取、标题抽取、关键词抽取、命名实体抽取、代码抽取等 |
6 | 数据统计 | 词频统计、字数统计、文章数量统计、日期分布统计、作者统计等 |
7 | 数据分析 | 情感分析、主题分析、文本分类、相似度计算、关联分析等 |
8 | 数据可视化 | 词云图、柱状图、折线图、地图可视化、散点图等 |
9 | 数据存储 | 文件保存、数据库存储、CSV导出、Excel导入、API接口返回等 |
10 | 数据导出 | HTML导出、PDF导出、Word导出、图片导出等 |