在我们的GCCX项目中,创新性地使用了基于自然语言处理NLP以及数据可视化的手段针对大篇幅的英文文本进行可视化分析。然而在实际操作中我们发现其实困难重重。从环境的配置,到语料库的搭建,再到分析环境的部署,每一步都需要不小的毅力和决心。
因此我们对相关的核心代码进行了封装并制作了这个“人人都可使用”的《英文文本可视化分析工具》。您无需关注内部的实现,只需要选择要分析的txt/doc文件或粘贴您需要分析的文本,就可以没有任何阻碍地生成各种可交互图表。
- 1) 自动加载停用词(Stopwords),去除文本分析中没有实际意义的词汇,取其精华以分析。
- 2) 软件内完善的提示以及功能介绍。
- 3) 对于可视化结果通过Plotly生成动态、可交互的图表;可随意放大缩小,截取特定部分进行查看。
- 4) 丰富的自定义选项,从结果样本个数到背景颜色选择。
- 5) 可自定义的语料库。
- 6) 5种模式、10余种图表和可视化形式随意选择,从jpg词云图,html动态图表到Excel统计表,满足多种文本探索需求。
我们希望,如果您是英语/文学/翻译等涉及文字的相关行业从业者、教师或学生,在面对大段文本或您感兴趣的文本内容时,能通过我们开发的软件,探索出文本背后蕴含的更多信息。