2023年12月28日下午,邱伟云、严程等两位数字人文学者做客北京大学“中国网络文学发展史研究”课堂,以“数智时代的文学之旅:偕手探寻诗意的数字人文学”为题,为同学们展开了一场精彩的讲座。
邱伟云
(台湾政治大学文学博士、博士后,曾任职于山东大学历史文化学院,现任南京大学学衡研究院副教授。)
严程
(清华大学文艺学博士,历史系博士后,现任清华大学写作与沟通教学中心讲师。)
随着以ChatGPT等大语言模型为代表的人工智能技术的兴起,人文学领域对数字化研究方法的关注日益密切。在当下的时间点上,对经典的数字人文研究方法进行回顾显得尤为重要。数字人文通过数字化工具和技术高效地处理、分析大规模的人文学科数据,有很大的研究前景和潜力。作为深耕数字人文研究领域多年的学术伉俪,邱伟云与严程应北京大学中文系教授、北京大学文学讲习所副所长邵燕君教授的邀请,来到“中国网络文学发展史研究”课堂,借由数字人文研究的重要概念与典型范例,向对前沿方法有兴趣的同学们提供了一场丰富的“入门介绍”,启发同学们如何在数字时代拥抱文学与诗意。
邵燕君教授向同学们介绍邱伟云、严程这对学术伉俪——因共同志趣走到一起的“数字人文之花”
一
从“数字”到“数智”
讲座伊始,邱伟云大略回顾了数字人文研究在中国的发展历程,并指出中国的数字人文研究在经过十几年筚路蓝缕的探索后,以2019年专业学刊《数字人文》的创办为里程碑,已进入一个新的快速发展时期。邱伟云将数字人文的跨越式发展归结为三个要素:来自不同专业领域的学者在跨学科交融中形成的同行群体、鼓励交叉学科研究的友好学术环境、未来可期的发展前景。而数字人文研究质变的标志,就是人们对于“digital”这一概念的认识的深化。
邱伟云介绍道,在数字人文发展早期,学者对于“digital”的理解还停留在“数字化”(即借助数字采集记录技术,对古籍文献、遗迹、文物等物质文化遗产,以及民俗、技艺等非物质文化遗产进行采集和记录,形成多种形式的数字文献)和“数据化”(即通过信息抽取、分类、标引、著录等数据化处理过程,形成结构化的主数据和元数据资源)的层面。近年来,随着数字技术的发展与学术研究的深入,“digital”的概念已经推进为“智慧化”,即利用语义建模、关联标注、集成整合等手段,进一步对文化遗产数字资源中蕴含的概念实体、知识单元和文化基因进行细粒度编码表示和跨域链接,并借助知识图谱、关联数据、区块链等技术构建形成可信的、跨模态的、富语义的、可追溯的、可再利用的智慧数据。
在这种研究背景下,邱伟云借台湾大学数字人文研究中心主任项洁的定义进一步强调,数字人文研究的主要目的是研究前数字时代下“难以观察、无法想像、无法进行”的研究,希望带来概念上的跳跃,而非小规模的改善。如果某项学术研究其实不需要数字方法便可以完成,那么这项研究与数字人文的匹配度可能就相对较低。而如果数字人文找到了其适用的研究课题,就会呈现出独特的优势:一是能够在规模性、多模性、长时性、复杂性上解决过去受限于人工阅读限制的选择性偏差问题;二是能够在数据驱动性上解决过去受限于人工主观限制上的选择性洞见问题;三是能够在可视化与交互性上解决过去受限于人工分析限制的单一维度分析和探索问题。相较过去的人工式定性分析,数字人文具备加广、加深、加强的方法优势,能够挖掘出过去基于人工阅读视野中难以窥见的文学隐含之美。在这个意义上,网络文学因其大体量、数字化的文本形式,与数字人文又具有天然的适配性。
邱伟云老师向同学们介绍数字人文研究
二
数字人文与文学研究
接下来,严程选取数个以数字人文方法进行文学研究的典型案例,向同学们具体讲解如何通过数字方法去揭示文学的隐含之美。
首先,数字人文方法能够在“文学形式”这一向度上发掘文学之美。例如,对于《红楼梦》、金庸及古龙小说等经典文本的计量风格学分析,呈现了文学作品在语言表达风格上的数字化特征;《中国古典叙事文学的时空叙事数字模型研究——以〈李娃传〉为例》一文,通过时间层计算的方式发掘了《李娃传》在章节、段落、句子上的巧妙安排之形式美;而对唐诗、宋词的一系列定量化研究案例,或定量描述了唐代诗歌的节奏感和韵律变化,或揭示了唐诗与宋词间文字运用差异的创新与艺术性,以“新的形式”发掘、传达了文学形式的新感受、新特征,也拓展了人们对文学研究的想象。而在网络文学研究领域,严程认为,数字人文方法也可以借助自然语言处理工具等快速高效地处理文本数据,提取信息和特征,从而揭示网络文学形式变化的潜在规律和趋势,这在如今单部作品即动辄达到数百万甚至上千万体量的网文面前,将越来越成为某种“必需”。
其次,数字人文视角也能揭示文学的内容之美。从斯坦福大学莫莱蒂对1740年到1850年的七千部英国小说的标题研究,到中国社会科学院赵薇对李劼人小说的社会网络分析,再到安徽大学唐宸对古代诗歌星象的模拟还原统计,以及邱、严两位老师合作的对中唐诗人在空间方位词上的使用情况的研究,严程向同学们展现了数字人文方法在主题探索、故事情节、人物塑造、深度文化价值等方面对文学内容美的探究潜能。在内容层面,针对网络类型文的多样性与强变动性特征,严程同样认为,数字人文方法可以通过文本语言特征、情感色彩、社会关系等方面的分析法,帮助研究者厘清网络文学的分类、流派和发展脉络,并进一步探索其中的内在规律和创新特点。
最后,数字人文视角还可以在文本之外的文学社会学研究上发挥作用。严程老师继续介绍了数字人文方法在唐代诗人的活动空间、明清进士家族网络、清代女性诗人交游、美国废奴运动的女性编辑工作等课题中的运用实例,这些案例揭示了数字方法如何帮助研究者探究文学作品与社会议题、文化观念和社会变革之间的关联,解释围绕在文学作品周围的权力关系、身份认同等相对外部却十分重要的议题。将这一思路延展至网络文学研究领域,严程指出,研究者可以通过对网络文学与其他社会因素(如政治、经济、文化)间的互动关系的建模与分析,来揭示网络文学在社会变迁、文化传承等方面的作用和意义,为文学产业的发展提供科学依据和策略性指导。
严程老师为大家讲解数字人文研究案例
三
AI时代数字人文的未来
讲座的最后一个部分,关涉到对技术与人文关系的前沿式的展望。对此,邱伟云、严程认为,随着ChatGPT等大语言模型的兴起,AI技术或将为数字人文研究乃至文学研究带来飞跃性的改变。
严程(左)、邱伟云(右)伉俪在讲座上珠联璧合、相得益彰
鉴于大语言模型的主要突破在内容生成层面,两位老师认为,人工智能首先将对文学创作本身产生深远的影响。例如,借助人工智能的内容生成、编辑修订等功能,作家可以获得更多的写作素材支持与灵感资源,并对文章进行自动化评估与改进。在文学研究方面,AI辅助工具也可以帮助数字人文学者简化数字计算工作。情感分析、风格识别和故事结构分析等数字方法,过去需要研究者对自然语言处理和机器学习技术有一定掌握,但有了AI智能助手的帮助,技术门槛大大降低,人文学者的“跨界”难度也随之大幅减少。此外,在多媒介内容的前沿战场,人工智能强大的内容生成能力可能导向叙事与游戏的深度融合,从虚拟现实中衍生出新的文学形式、叙事方式和美学范式。
另一方面,AI时代的数字人文也面临着很多新的挑战。邱伟云特别提醒同学们,在数字人文研究中,首先要警惕的就是技术主义,数字技术只是工具,应该为人文研究服务,不能因过于强调数字技术而忽略了人文学科的核心问题与研究方法,只有具备批判性思维和人文学科的知识,才能正确理解和解读数据结果。此外,在应用数字技术的过程中,也要注意数据的收集和处理过程中可能存在的误导,避免数据性偏见。另外,还要注意批判性地反思和创新各种数字人文方法论,拒绝简单套用,加强自身将理论运用到实践中的能力。针对同学们不知道如何着手进入数字人文领域的问题,邱伟云建议:相比于先学数字工具、然后配合工具去找适配的人文研究议题这一入门方式,“先人文”的思路是更值得推荐的。由人文问题意识出发去寻找、甚至研发适合的计算工具,不仅能够让研究更“切题”,而且同样能够展现出技术上的创新性。
在讲座的最后,严程老师以一位学生的网文与“嗑cp”数字人文研究为例,启发大家思考如何用新方法面对新型的后现代文学、女性文学。网络女性向文学去中心化的、非线性的、即时交互的特征,或许会让数字人文方法有更大的用武之地。
讲座结束后,邱伟云、严程就如何建设网文研究的基础数据库、AI辅助写作评估等实践性问题与现场同学展开了亲切互动与交流。讲座主持人邵燕君教授高度评价了作为研究材料的网络文学与作为研究方法的数字人文的契合程度,并感谢两位老师为大家带来的精彩讲座。
同学向邱伟云老师、严程老师提问
邵燕君教授与邱伟云老师、严程老师合影留念
邵燕君教授、邱伟云老师、严程老师与在场同学合影留念
撰稿:陈晓彤
摄影:陈绚
编辑:雷宁