材料一:
“文学大数据”是指文学作品和文学研究文献在互联网、物联网和社交网传播过程中产生的文学数据,具有体量大、动态化、类型多、价值密度低和不易管理等特征。例如,一部文学作品在社交网络传播后,会产生关于此作品的海量评价,除了文字评价外,还包括图片、音乐、表情包、弹幕、点赞等多种数据。分析这些大数据,可以获取读者的年龄、职业和地域,读者是否喜欢这类作品,这部作品表达的思想情感与社会提倡的价值观念是否吻合等诸多内容。对这些海量数据的整理和分析单纯依靠人工难以完成,需要相关计算技术的支撑。因此,文学计算应运而生。
简单而言,文学计算是指利用计算机技术,以量化统计的方式研究文学,具有明显的跨学科性。文学计算的出现不仅是文学批评方法的转向,而且是文学批评思维的变革。
首先,是从主观理论建构到客观数据实证的变革。一般意义上,文学批评注重理论和审美建构,阐释对象以单篇或同一类型的作品为主,带有很强的个人主观性,这难免形成视域盲区,理论的有效性经常受到质疑。例如,文学批评在建构现实主义文学理论时,常以巴尔扎克的《人间喜剧》、托尔斯泰的《战争与和平》等作品为例。由此得出的观点可以适用西方19世纪现实主义文学,但对中国现实主义文学不一定适用。或者说,文学批评的理论和审美建构因缺乏大规模文学作品的支撑,提出的观点只契合小部分作品,无法真正构建普遍适用于“世界文学”的理论。
而计算技术提升了整理和分析大规模文学作品的能力,文学批评不再局限于小部分文学作品,可以把批评对象延伸到世界文学作品,让全球文学数据自己“说话”。在此基础上,可以得出更为客观和普遍有效的结论。
其次,是从确证因果关系到呈现相关关系的变革。确证因果关系是指批评者通过分析文学作品,证实文学作品与具体历史和现实事件之间的因果联系。这种批评思维对小部分文学作品有效,但面对大规模的文学作品则难以实践。例如,文学批评在阐释20世纪30年代乡土小说时,致力于确证乡土小说与日本侵华战争的因果关系。因此,解读重心就放在乡土小说反抗日本殖民统治和表现强烈民族意识上。这种批评思维可以适用于萧红的《生死场》和萧军的《八月的乡村》,却无法用来解读同时期沈从文的《边城》和师陀的《果园城记》等作品。
而文学相关关系是指文学作品与历史和现实事件之间的数值关系。当一部文学作品数值增加时,相关历史社会和现实事件也随之增加,意味着它们之间的相关关系强,反之则亦然。例如,在互联网搜索“乡土小说”时,出现的信息既包括鲁迅、彭家煌等作家作品,又包括五四运动、封建专制文化等历史事件和背景。当这些作家作品和历史事件共同且持续出现在不同的“乡土小说”词条中时,它们之间的相关关系就强。也就是说,文学计算不再需要主观确证文学与历史和现实之间的因果联系,只需通过分析文学数据之间的相关关系,就可以客观呈现这种因果联系,相对更客观且不受主观偏见的影响。
(摘编自杨丹丹《文学批评用数据“说话”的可能性》)
材料二:
文学研究的一个基本任务就是判定“影响”,即文学史上特定作品的影响力,解决这个问题可以借助数据分析。目前的方法是判别不同文本之间的相似度,由此断定一部作品到底与后世的哪些作品具有比较显著的形式重合。国外一位学者先统计歌德的《少年维特之烦恼》中出现的文体特征,比如作品中出现的比较独特的辞藻,再利用现成的电子文学数据库,用相关算法测量出数据库中同时代的欧洲小说和歌德作品在形式上的相似度,以此来考察传统阅读所无法勾勒的“散落”的文学影响。
用数据来分析“影响”问题不仅是为了追求更高的精确度,也是基于一种对“影响”的非人文主义理解。一般的人文主义者认为虽然“影响”是发生在两个文本之间的过程,作者只是发生这种影响过程的媒介,但作为媒介的作者主观上也感受到了这种影响,经常会使用防御和否定的对策来遮盖自己的文学渊源。而数据分析所认为的影响与作者的主观感受已全无关系。一个文本中大多数形式特征并不是作家有意识的选择,而是由文化无意识所决定的,文学形式的传承和演变遵循着任何个体都无法控制的路径,即使是天才作家的传世经典也建筑在大量的重复现成语料和语言规范的基础上。也就是说,虽然人脑并不是机器,但与机器有着相似特点,两者都会机械地模仿固有的语用习惯,而一个语言文学共同体也会在社会历史因素的影响下有规律地改变这些习惯。
(摘编自金雯《“大数据”分析与文学研究》)
1.下列对材料相关内容的理解和分析,不正确的一项是(3分)
A.因为文学大数据是在网络传播过程中产生的,所以需借助计算技术对其进行整理分析。
B.以《人间喜剧》为例得出的现实主义文学理论观点对中国现实主义文学未必有适用价值。
C.《生死场》是一部乡土小说,反映了中国人民对日本殖民统治的反抗和强烈的民族意识。
D.任何个体都无法控制文学形式的传承和演变,即使是天才作家的传世经典也不会例外。
2.根据材料内容,下列说法正确的一项是(3分)
A.文学计算背景下的文学批评注重分析文学数据,所得出的结论自然更为客观,这说明文学计算必然会促进文学批评的巨大进步。
B.因缺乏大规模文学作品的支撑,提出的观点不具备普遍性,所以以阐释单篇作品为主的文学批评已不适应时代发展,将逐渐走向没落。
C.确证因果关系和呈现相关关系是两种不同的文学批评思维,虽然二者可以适用于不同数量的文学作品,但是得出的结论是相同的。
D.通过数据分析,测量一部作品与后世作品在形式上的相似度,再借助传统阅读,可以更有助于分析判断这部作品在文学史上的影响力。
3.结合材料内容,下列选项中最能支持材料二观点的一项是(3分)
A.通过分析对比《布谷鸟的呼唤》与《哈利·波特》的语言相似度,推测这两部小说的作者是同一个人,最终作者承认了这一事实。
B.文学计算可以统计鲁迅《秋夜》中有两棵枣树,却无法呈现两颗枣树蕴含的孤独体验,这就需要批评主体赋予文学数据以价值导向。
C.为了研究中国古代文学典籍在西方现当代写作中留下的印记,可以统计某些主题在西方现当代文学作品中出现的频次和传播路径。
D.《人民的名义》原著中提及“钱”字多达170次,远远超过了“人民”一词的93次,说明这本书是一部与金钱有关的反腐小说。
4.材料一在论证方面有哪些突出特点?请简要说明。(4分)
5.有研究者计划运用数据分析,为唐诗做一个影响力排行榜。请你结合材料,就从哪些方面分析相关数据提出建议。(6分)
答
1.A(因果关系不成立)
2.D(A项,“必然会促进文学批评的巨大进步”表述不准确,原文“文学计算的出现不仅是文学批评方法的转向,而且是文学批评思维的变革”,而不是“巨大进步”。B项,“已不适应时代发展,将逐渐走向没落”表述于文无据。C项,“得出的结论是相同的”表述错误。确证因果关系的批评思维对小部分文学作品有效,得出的结论是针对小部分文学作品的;呈现相关关系的批评思维对大规模的文学作品有效,得出的结论是针对大规模文学作品的。因此,不能认为二者得出的结论相同)
3.C(材料二的观点:用数据分析既可以更精确地判定文学作品在文学史上的“影响”,也是基于对“影响”的非人文主义理解。A项说明通过数据分析可以准确断定文学作品的作者。B项反映了文学计算在文学批评方面的不足。D项说明通过数据分析可以推断文学作品的主要内容)
4. ①材料一采用总分结构,先阐述文学计算的产生背景,然后分别从两个方面论述受文学计算的影响,文学批评思维发生的变革;论证思路清晰严谨。②主要运用了举例、对比两种论证方法,对文学计算在文学批评思维变革中的作用阐述得更加具体,易于理解。(4分。每点2分,要点明确、意思相符即可)
5. ①分析唐诗作品在读者群体中是否受到欢迎、传播的频次等。②分析唐诗作品表达的思想情感对后人、后世社会在情感态度、价值观念等方面的影响。③分析唐诗作品的艺术技巧、语言风格等对后世诗歌创作的影响。④分析唐诗作品在中国文学、文化的传承与演变过程中所起的作用。(共6分。每点2分,答出其中任意三点即可)