由于上述转变

Unite professionals to advance email dataset knowledge globally.
Post Reply
Bappy11
Posts: 446
Joined: Sun Dec 22, 2024 9:33 am

由于上述转变

Post by Bappy11 »

2. 计算机语言学
数字人文在文学研究中的应用(也称为“计算语言学”)是指使用计算机作为文学分析工具的方法。很明显,有一件事是计算机无法做到的:它们无法理解文本。因此,我们不能指望它们能够自动提出并回答独立的问题。在文学研究中使用计算机作为工具意味着使用计算机来 识别和计算文本中的表面现象,以有助于回答经典文学研究问题。[11]这些表面现象包括词频、词分布等。基础始终是数字文本语料库,然后从中搜索这些特征。计算机辅助分析的功能和好处通常被看作是 文学假设的经验证实。

与传统工作相比,这种计算机辅助分析的优势当然在于可以快速找到匹配项:以前很容易成为论文素材的内容,现在可以在几分钟内找到——只要有适当准备的数据。[12]当然,语料库也可以更大。这被视为一种优势,因为,例如,如果你研究某一特定体裁的典型特征,你不仅可以选择非常有限的感兴趣文本,而且可能选择 所有小说、所有资产阶级悲剧等。其基本思想是,我们旧的临时“文学经典”总是人为地减少所考虑的文本材料,它扭曲了 对某一体裁特征的看法(正是因为从未包括所有文本),例如,我们现在可以确定这些体裁的实际特征:

»在文学史研究中,问题在于论点和指标通常仅基于极少量的文本而形成。例如,长期以来,人们对 18 世纪资产阶级悲剧类型的描述主要基于莱辛和席勒的少量经典文本。只有对所有类型文本进行全面的系统回顾和类型学描述,才能表明今天被尊为经典的文本在重要方面绝不是该类型的典型。[13]

现在,所有这些将计算机用于语言学目的的应用当然最初都是受到欢迎的。但是,我认为,如果从语言学方法论的角度来看待这些关系,就会出现一个问题:这里是用计算机来解决语言学问题的。这种方法隐含着两个可能有问题的假设:

首先,假设存在“语言学问题”本身,并且这些问题到底是什么也是清楚的。然而,考虑到语言学问题在解释学历史进程中发生了多大的变化,[14]我们有理由怀疑语言学问题本身是媒体文化的结果,换句话说,语言学实践对书籍有用,但对数字文本可能无用。将截然不同的段落置于一个尽管被认为是共同的框架内进行语境化的做法,是书籍文化的条件所要求的,这种做法延续了非常具体的假设、定理和问题,直到出现了一种相对特殊的话语,这种话语主要针对的是“一个人自己的智力发明” [15],而这种话语的意义现在往往被人们毫无疑问地接受。这并不意味着用计算语言学方法来解决传统问题从根本上来说毫无意义,但人们不应该简单地将其有用性视为其本身的目的,而应该首先从方法论上对其进行质疑。

上述方法暗含的第二个假设是:语言学问题是实实在在的问题,即:存在一些可以找出的东西(这里使用定量方法) 。再次回到上面提到的类型理论的案例:詹尼迪斯的观点是,“资产阶级悲剧”类型是作为一个类别建立在太小的语料库的基础上的,这个语料库并不能反映该类型的实际典型特征;然而,通过对文本的全面研究,该类型的这些实际特征变得显而易见。在这个论证的例子中,“文学体裁”是真实存在的,也就是说,它独立于我们的观察,也独立于我们的前辈(即经典)的观察,而前辈们由于资料来源不足而被指责为有误。对此的反对意见是,资产阶级悲剧主要不是一种自然现象,而只是在历史过程中才成为其本来面目,即通过一个构成性的与经典相关的过程,不断参考非常具体的文本以及只有这样才能出现的类别。我认为这适用于任何类型的作品;例如中篇小说,在 20 世纪人们仍然拼命地试图定义它。[16]然而,文学体裁概念的功能与动物学概念有着根本的不同(在动物学中,我们对属的分类是有缺陷的,因为我们在创造它们时了解的动物太少了,这种观点是有道理的)。 19 世纪中篇小说这一类型文学的历史离不开对它进行定义的尝试。相反,许多中篇小说的创作是为了反驳现有的类型理论,结果导致了理论的修改,进而引发了新的中篇小说的产生。因此,在更好的数据基础上修正体裁概念的想法绝不是不言而喻的,而是意味着非常具体的假设,以非常具体的方式构成对象›体裁‹。当然,这并不是说这样的分析毫无意义,只是应该进行更深入的思考,首先要问的是,这种分析究竟是在哪一个客体构成的基础上进行的。

3. 语义转换的四个特点
基于这些原因,我认为数字人文学科无法避免关于分析的解释学前提的讨论。我们所说的“解释学”并不是指理解文本的特定方法论(在这个意义上,这个术语经常被误解,并且与某些解释程序对立),而是指关于文本实际上是什么、通过分析文本可以发现什么以及如何去分析文本(这个问题只有从中推导出来才有意义)的根本性讨论。文学研究不应该简单地扩展其实践来考虑到文本现在也数字化的事实,还应该考虑到对象和我们的知识概念本身也在发生变化的事实。这种考虑假设,根据物体的“性质”,它是什么的问题并不是询问真实的事实,而是取决于历史地变化的、并且始终与社会结构相联系的归因。这样,对象的构成就会不断发生变化:即使语言学描述其对象的词语(“文本”、“艺术作品”等)保持不变,其语义也会随着时间而发生变化。因此,首先问一下,当主要存储和通信介质从印刷书籍转变为数字媒体时(假设是这种情况),实际上发生了什么变化是有用的。即使媒体转型过程尚未完成,因此无法做出最终评估,但至少可以注意到以下四个方面,它们最初仅仅是数字化表示的特征,但也可能引发文学主题的语义转变。现在列出的特点都不是全新的,只是由于媒体表现方式的改变而变得更加明显——我将在下一节中回顾这一点。

3.1 数据丰富性
我想提到的第一个特点是经常看到的,简单地说就是今天(在互联网上)有大量的文本可用,并且即使在这个领域简单的定位也代表着一个基本的挑战。其结果就是经常观察到的知识过剩(也称为“数据洪流”)以及随之而来的可访问性问题。如今,有太多的材料需要通过经典和教育来掌握。当这些传统的补偿知识数量的策略变得过时时,知识过剩就成为人文学科的一个方法论问题。问题在于人文学科是否以及如何能够继续履行其两项传统职能,即:第一,寻找特定的段落;第二,在丰富的文本中提供指导。

除了纯粹的可访问性之外,第二个问题是上下文的增加。长期以来,人文学科的一项关键能力就是了解和找到给定信息的背景。这样,任何属于最广泛意义上的西方教育经典的段落都可以被分类,并且可以说是可以说话的。由于数据和联系太多而无法将它们想象成一个整体,经典失去了其作为参考文献的限制功能,因此段落的语境化以及意义的归属都会变得有问题。如果人文学科想要保留其原有的能力,就必须制定策略来应对 不断变化和多元的背景,而不能让意义的归属成为任意而反复无常的事情。

3.2 动态
此外,“知识”本身的语义似乎也在发生转变。鉴于它的数字化表现,它是一种动态现象的事实变得显而易见。当然,这个描述已经过时了。然而,传统媒介的生产与接受条件始终掩盖了这一事实,使得知识的动态性始终是一种抽象的属性。印刷书籍的物质性恰恰表明了相反的观点——知识被赋予了“安全”、“可获得”、“有根据”、“不变”、“客观”、“真实”等属性。 “艺术作品”作为人文学科的核心对象类别,其说服力也来自于这种语义库存:它应该是“完成的”、“完美的”、“不可改变的”,正是这些属性决定了它的特殊地位,并使其科学研究合法化。[17]

虽然“书籍”和“图书馆”本身就是人类知识的令人信服的隐喻,但大量的数字文本给人的印象是,我们正在处理某种彻底变化的、偶然的和相对的东西。一方面,这涉及到知识内容的不断调整,由于媒体表现形式的改变,这种调整在今天比以往任何时候都更加明显:例如,修订后的知识不再普遍以旧版本的形式提供,而是经常简单地“消失”。[18] 知识不再需要经过多年才能成熟并发表,而是实时出现,即不断地发生变化。另一方面,它涉及知识的视角;数字知识存储的一个特点是可以同时存在矛盾的观点。知识的传统特征在于其纯粹的事实指涉(即,无论谁看它,它都保持不变),因此也具有永久的社会指涉。

3.3 包容性
也许最显著的特征是数字条件下文本的包容性。这意味着,原则上每个人都可以参与文本和知识的生产。这种情况在历史上是新的,因为在以前所有主流媒体的标准下,获取文本的渠道和参与文本制作的可能性都是高度排外的。从历史上看,除了识字和教育之外,直到 20 世纪还存在社会限制,因此印刷书籍的出版绝不是向所有人开放的。

如果今天,原则上任何人都可以就任何话题公开表达自己的观点,那么不仅存储的知识的数量会发生变化,其质量也可能发生变化:随着知识生产的历史条件变得有意识,诸如“心智”、“教育”、“深度/表面”、“智力”等概念以及形成我们标准的类似语义也会作为历史现象出现。一方面,它们确保一定的质量标准。另一方面,它们对某些话语的可及性起到了有效的社会限制作用。通过这样做,他们定义了我们评判“智力品质”之类的标准。因此,他们还定义了广义上的“经典”:那些其知识是理解讨论的先决条件的作品。这既包括人文学科的主要对象,也包括其研究的历史。因此可以想象,在知识更加包容的条件下,合法对象和遵守合法对象的方式也将发生根本性的变化。

就当今知识生产条件的可见性而言,我们思考和谈论知识的范畴不再作为自然实体出现,而是作为反映特定社会条件的历史构造出现。我认为这是一个中心点,特别是对于这个主题的科学讨论而言。我们经常听到文化悲观主义者抱怨精神的淡化、肤浅、教育的丧失、审美标准和集中注意力的能力等,而这种抱怨恰恰犯了这个错误:它认为类别是自然事实,而这些事实实际上是由精英们在谈论他们自己的精英产物时在历史上形成的。如果历史上第一次每个人都有机会发表文本,这将会改变标准。然而,将其描述为“琐碎化”本身不仅是高度主观的判断,而且还扭曲了对情况的看法,因此应该避免,尤其是科学家。[19]语文学应该只或主要处理那些按照某些西方历史价值标准而被认为是“好的”文本,这一点绝非不言而喻。[20]生物学也将单细胞生物视为高度复杂的生物。

然而,问题主要不在于值得注意的作品被排除在外。更为重要的是,文学研究思考题材的范畴正是在上述媒介条件下形成的,但这一事实乍看起来却并不明显。相反,在解释学讨论中,真正重要的决定通常是以潜伏期的方式做出的,因此看起来文本是什么总是很清楚,唯一的争议是如何解释它。但事实上,对于文本和艺术作品的‘本质’,存在着分歧。正是对文本是什么的看似自然的假设决定了我们可以对文本做进一步的讨论。事实上,现在已经出现了一个需要对这些思想类别进行不同评估的新学科领域,这应该引起人们对该学科先前的形象的重新思考。那么,数字人文学科的方法论潜力就不在于用新方法分析旧对象,而在于对旧文本提出新问题。最后但同样重要的一点是,我们可能会发现,我们似乎自然地对文本采取的态度也是特定历史状况的一种表达。

话语性虽然批判观点在启蒙传统中始终占主导地位,但修辞观点正日益成为一种选择。这意味着什么? “知识的话语性”这一术语旨在描述知识通过连续、共享的论述而形成的 亚美尼亚电报数据 特性。换句话说,我们所知道、所相信和所思考的不仅仅是世界的反映,而仅仅是交流的结果。这种标签由来已久,并且已经成为一段时间以来的普遍共识。[21]然而,对于如何评价这种话语性,人们的看法一直不同(并且仍然不同)。无需从历史角度定位这两个观点,我们就能区分出修辞模型和批判模型。

根据选择的视角不同,整个文本制作过程会呈现出截然不同的面貌:批判性视角假设存在客观真理,并且我们至少可以接近它。知识话语性的功能是通过批判错误的观点来使知识变得更好。从历史上看,这种(无疑较古老的)观点受到了印刷机的青睐。科学史是对经典著作不断阅读和批判的结果,因此每一次批判都可以看作是知识的进步——书架上每增加一米书,我们就离真理更近一步。

另一方面,修辞观点认为知识很大程度上是偶然的。如果所有知识都是交流的结果,那就意味着我们知道和思考我们所知道和思考的东西,因为它是出于某些原因而表达出来的。然而,从修辞学的角度来看,这些原因并不在于知识和思想的对象,而只在于交流本身。从这个角度来看,“知识”必须表现为某种根本不同的东西:不是对世界的被动反映,而是一种不需要共识的社会协商过程。诸如客观性、真实性、假设检验和方法等类别则作为语义产物出现,而诸如可信度、论证模式和有效性主张表达的社会方面等类别则更适合语言学分析。
数字人文作为方法论讨论的场所
当然,这些对文本和知识的归因并不是什么新鲜事。例如,在19世纪初,人们就已开始抱怨数据量过大,当时新的印刷技术突然导致书籍以前所未有的规模出现(这就是我们现在所说的琐碎文学)。[22]对此的反应是经典以及它对高雅、重要文学与仅仅是娱乐性文学之间的区分。我还将对知识话语性的洞察归功于早期浪漫主义,例如施莱尔马赫和弗里德里希施莱格尔(《交感神经》、《交感哲学》)等作家,当然还有柏拉图(《苏格拉底方法》)。我所说的知识的动力学可以在黑格尔的“辩证法”中找到,即知识构成历史的观点。最后,包容性可以看作(至少在纲领上)欧洲启蒙运动的优点,它拒绝权威,坚持运用理性 。
Post Reply