詞彙、句構與語料庫:語言中的社群網絡

02
2022.12
學術動態
詞彙、句構與語料庫:語言中的社群網絡

【本篇報導由英語學系 陳正賢副教授研究團隊提供】

在數位發達的時代,想必大家都對於「社群網絡」都不陌生,人與人之間的連結與互動,經常構成獨特的網絡,此網絡結構不僅透露整個社群的風格,同時網絡中每一個組成成員的個性,也都可以從每一個成員與網絡其他成員之間的互動關係,一窺端倪。更重要的是,透過社群網絡之連結,我們可以清楚看到每一個成員經常互動之夥伴成員有哪些,而透過這些夥伴成員的分析,我們甚至可以推論該成員的喜好、個性、以及其他重要特質,換言之,一個人的朋友連結與一個人的個性,息息相關。


本文就是以上述「社群網絡」的想法為基礎,研究語言中的「語法網絡關係」。其實,語言中的大大小小單位,從「詞彙」到文法「結構」,彼此之間都存在一種共現關係:一個詞彙經常會與某些詞彙一同出現、一個語法結構經常會與某些詞彙一同使用、一個語法結構經常會與某些語法結構一同使用。在我們日常生活語言行為間,我們身為一個語言的母語使用者,其實已為這個語言默默注入了屬於這個語言的「網絡關係」:它不是一個以人文本的社群網絡,它是一個以「各個語言單位為本」的語法網絡(Grammar Network)。換言之,每一個詞彙、每一個語法結構,就像是一個生命體,在每一個語言使用者的語言行為中流竄、茁壯、成長,透過母語使用者這個廣大群體常規化的語言行為,每一個詞彙或語法結構,慢慢形塑它們自己獨特的網絡關係,而這些網絡關係就像「社群網絡」一樣,透過每一個網絡成員(詞彙、句構)連結的系統性分析,我們可以看到這些成員的特質,在語言分析上,這就是語言的「意義」。

在這個研究中,研究者利用網絡分析方法,探究語言中詞彙與句構之間互動關係,透過網絡系統性的解構,探討語言網絡與語意理解的相連性。以「中文空間詞結構」為例,中文使用者表達空間方位經常使用結構有:「在+ NP + 上/下/前/後/內/外/中/裡」,透過空間詞,如「上/下/前/後/內/外/中/裡」以及一個名詞詞組「NP」作為參考點,即可描述某個人或物體的方位。倘若每一個空間詞結構就像是網絡中一個成員,而每一個使用者作為「參考點」的處所或物體是另一種類型的網絡成員,只需要從母語使用者的語言習慣中,尋找出成員之間的共現強度,即可建構一個迷你的「空間網絡」。「語料庫」就是一個可以讓我們迅速收集母語使用者習慣的一個大型語言使用資料庫,在這個研究中,我們擷取一個具有代表性的中文平衡料庫中,所有「空間詞構式」與其相關連之「處所詞」參考點,作為語法網絡之節點。透過量化語料庫方法,計算節點之間的連結強度,包括:構式與處所詞之連結、構式與構式間連結、及處所詞間連結。

我們可以從空間網絡獲得什麼訊息呢?這個問題或許可回到語言分析的本質來討論。語言學習與分析是我們成長過程中必經路程,其中最重要的任務就是釐清語言中的「意義」,如:這個詞彙是什麼意思?這個句型是什麼意思?這個句子是什麼意思?但何謂「意義」卻是一個在語言哲學上相當棘手的問題。這個複雜度就如同何謂一個人的「個性」,答案往往無法一言以蔽之。但大部分學者應該可以同意的是,一個人的個性,多半反映於與他/她經常互動的朋友關係(即:網絡)。同樣地,語言學理論中,有個類似的重要假說—以語用為本語法(Usage-based Grammar),也是以此直觀方式分析語言意義:一個語言單位的意義,多半反映於與它經常互動的單位關係(即:語法網絡)。因此,透過利用語料庫所建構的空間詞網絡,我們可以回答三個關鍵語意問題:(一)不同空間概念之典型意義為何?(二)每一個空間概念中,經常共同使用的處所詞有無語意共通性?(三)整個空間網絡裡,有無系統性之語意場產生?當建構完成空間詞網絡後,我們即可利用網絡分析量化方法,透過三個網絡層次的量化指標數值,尋求這些意義探索的實證。

原文出處:https://doi.org/10.1515/cllt-2020-0012

本文出處:研究發展處研究亮點

原始連結:https://rh.acad.ntnu.edu.tw/tw/article/content/180


陳正賢 副教授 | 英語學系國立臺灣師範大學英語系副教授。學術研究領域包括語料庫語言學、計算語言學、認知語言學和語言學習,透過量化語料庫語言學方法及自然語言處理相關技術應用,分析理論及應用語言學相關議題。