数字人文中的文本挖掘研究
摘要概述数字人文的概念、研究内容和现状,指出文本挖掘方法是数字人文研究的一个研究热点与趋势。在综述文本挖掘在数字人文各个研究领域中的具体应用基础上,重点介绍欧美发达国家文本挖掘应用于数字人文研究的前沿实践,以期为我国人文学科研究方法与范式的转型提供借鉴。
关键词 文本挖掘 数字人文人文研究
1引言
近年来国内数字化的浪潮越来越猛,各种古籍数字化、文献数据库建设的项目层出不穷。计算机技术与网络技术已经逐步深入到人文研究的各个领域,有效提升了人文研究各个环节的效率。尽管数字技术与人文学科的结合让我们看到了数字技术在人文科学研究中的巨大价值,然而就目前的情况来看,人文研究中利用数字技术的手段还比较单一,大都停留在人文资源的简单组织、检索与利用,缺乏对现有资源的深度分析和挖掘。国外在数字技术与人文研究交叉结合的研究领域形成了一个新的学科:数字人文,所取得的成果值得重视。数字人文学科从一个新的理论高度看待数字技术与人文研究的关系及其带来的影响。它为人文研究者提供了新的工具和平台,对海量的数字资源进行组织、标引、检索、挖掘和分析利用。在这样的背景下,本文在简单介绍了数字人文学科的概念和现状后,论述了数字人文的一个重点研究趋势是对海量数据的分析,而新兴的文本挖掘方法由于其能有效处理海量文献,处理非结构化数据以及较高的研究品质而成为网络时代数字人文研究中很有前景的研究方法。文章接着重点分析了文本挖掘方法在数字人文研究中的典型应用,介绍了欧美发达国家把文本挖掘方法应用于人文学科的一些前沿的研究项目,以期加快我国人文学科研究范式的升级和转型,促进我国人文学科的飞跃发展。
2数字人文:概念、现状与趋势
2.1数字人文概述
数字人文(Digital Humanities),又称作人文计算(Humanities Computing),是一个将现代计算机和网络技术深入应用于传统的人文研究与教学的新型跨学科研究领域。其产生的背景主要是由于海量的图书、期刊、报纸、照片、绘本、音乐、视频等人文资料的数字化,尤其是数字图书馆的迅猛发展。面对海量的数字文本,研究者急需新的工具和平台对之进行组织、标引、检索、挖掘和分析利用。数字人文是一个典型的文理交叉领域,研究项目和研究团队常常既包括传统人文领域(哲学、历史学、文学、语言学、艺术学、人类学等)的研究者,还包括精通计算机技术和多媒体技术的专家学者。在这两类人员的协作...
== 试读已结束,如需继续阅读敬请充值会员 ==
|
本站文章均为原创投稿,仅供下载参考,付费用户可查看完整且有格式内容!
(费用标准:38元/2月,98元/2年,微信支付秒开通!) |
升级为会员即可查阅全文 。如需要查阅全文,请 免费注册 或 登录会员 |