基于BCCWJ语料库的同义词研究———以日语的“キャンセル”“、解約”“、取り消し”为例

时间:2023-01-05 07:52:11 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
基于BCCWJ语料库的同义词研究———以日语的“キャンセル”“、解約”“、取り消し”为例

作者:董鑫,吴桐

来源:《教育教学论坛》 2018年第27



摘要:本文使用BCCWJ语料库“中纳言”,对“キャンセル”、“解約”、“取り消し”3个同义词的使用情况进行了调查。其结果,与母语者使用意向不同,在实际数据中,3词的频率顺序为「取り消し」>「キャンセル」>「解約」,另外也对3个词在各自不同微妙语境下的使用情况进行了考查。

关键词:语料库;同义词;母语者使用意向

中图分类号:H36 文献标志码:A 文章编号:1674-9324201827-0056-02

一、引言

日语词汇中存在和语、汉语、外来语等不同形式,词汇的多样性丰富了日语语言的同时,也给外语学习者带来了困境。特别是同时存在相同意义的和语、汉语、外来语时,到底哪个更常用,有怎样细微差别等,即便查字典或参考书,有时也很难从中得到答案。日本国立国语研究所基于大规模问卷调查的基础上,公开发表了「外来語に関する意識調査」(2004),其中调查了日语母语者对于同等意义的和语、汉语、外来语的使用心理。例如:关于“キャンセル”、“解約”、“取り消し”等一系列的同义词,从“最想用”“最新”“最容易理解”三个方面进行了调查,其结果如下。

从以上结果来看,在感觉“最新”方面,毋庸置疑外来语“キャンセル”占了绝对优势。一般来说,和语会更容易理解,使用频率会更高一些,但“最想用”方面,外来语“キャンセル”却占57.5%,远远高于“取消し”21.3%,这个结果有点令人意外。那么,在现代日语中,3个词汇的频率关系到底怎样?另外,3个词汇各自具有怎样的微妙不同?关于这点仅仅靠母语者的内省似乎还很难得出结论,还有待语料库进一步实证调查。

二、语料库检索

(一)检索的语料库及检索对象的确定

本研究使用「現代日本語書き言葉均衡コーパス」(Balanced Corpus of Contemporary Written Japanese,以下简称BCCWJ)。BCCWJ无论从规模还是学术方面都是目前最具代表性的语料库,不仅包含了书籍、报纸、杂志、小说等,而且还广泛收集了教材、诗歌、法律、国会会议记录、网页、Yahoo博客等各种题材共13种数据,高达1亿词汇量,因此可以说检索

BCCWJ,能够得出比较准确的信息。本研究以BCCWJ整体作为检索对象,不区分数据题材,即具有书籍(约占65%)网页(约占20%)的特性(李等2012)。

虽然调查对象是“キャンセル”、“解約”、“取り消し”这三个词,但每个词同时存在一定的变体,比如「キャンセル率」「解約書」「取消届」等复合词,「取消し」「取消」等不同表记,在此均不加区别,都包含在调查范围中。而为了与对象词语保持严密一致,Cancel」「かいやく(改訳)」则不包含在调查范围中。




(二)频率调查

一般可以通过“少纳言”、“中纳言”或“DVD版”三种方式使用BCCWJ,而“中纳言”是网络版不仅使用方便,而且将文本进行了特殊处理,分割成最小单位“词素”,能够准确地检索出目标词语,比如可以清晰区分出名词しか(鹿)和副助词しか,另外可以通过不同检索方式灵活选择是否包括一个词的各种不同表记形式。因此本文决定使用“中纳言”进行检索。

为了对等进行比较,有必要将三个词的动词形式区分出去进行统计,本文只考查其名词形式。由于“キャンセル”和“解約”没有其他表记形式,因此用“書字形出現形”(与检索词表记一致)进行检索。检索出的结果即包含名词形式又包含动词形式,目视一条一条区分费时费力,「後文脈」格中有▲▼标记,可以通过点击▲,升序排列「後文脈」,如「される」?「し」,紧接在“キャンセル”后面的假名就会按50音图顺序排列,这样就能轻松将サ变动词各种活用形一次全部提取出来。“取り消し”因为有「取消し」「取消」等其他表记,所以用“語彙素”(包含各种不同表记)进行检索,并以同样方式提取サ变动词的各种活用形。

(三)用例调查

为了调查3个词的微妙区别,以「の~」的形式通过“文字列”重新检索,各自得出12989142个例句,一个一个目视验证,考查出现在「の~」前面的高频名词,在同等条件下,比较3个词的词语搭配倾向。

三、结果分析

(一)频率调查的结果

如前所述,通过母语者意识调查,得出的使用意向,3个词呈现「キャンセル」>「取り消し」>「解約」这样的关系,而有趣的是,通过BCCWJ语料库检索如图2所示,得出的结果却是「取り消し」>「キャンセル」>「解約」,并且「取り消し」远远超过其他两个词。至少在书面语中,关于「取り消し」和「キャンセル」母语者的使用意向和实际使用状态之间,显示出了巨大差异,「キャンセル」的频率仅仅相当于「取り消し」的3分之1多一点,可以看出母语者即便想使用,但在日语文章中实际书写的机会却非常有限。

(二)用例调查的结果

落札者·出品者都合/結婚式/旅行/お客/面接/取引/旅館… のキャンセル

賃貸借/保険/取引/契約/預金/口座/協約/保証人/会社… の解約

入札/オークション/出品/登録/免許/許可/失効/契約… の取り消し

以「の~」进行检索,与其搭配的名词按其频率高低排列如上。与3个词的搭配中,虽然也有重复,但还是各自呈现出了特有倾向。比如「キャンセル」前的修饰词,如「結婚式」「旅行」等日常生活相关的词占了多半,考查用例发现大多出于「Yahoo!知恵袋」,一般用在比较随意的语境中。

与此相对,「解約」前面出现的如「保険」「取引」「契約」「預金」等,显而易见基本都是保险、金融等特定词汇,考查用例,发现大多出于法律文书、国会会议记录等,一般用于比较正式而生硬的语境中。


而「取り消し」的高频词配大多是「登録」「許可」这样行政指令等相对较生硬的汉字词汇。可以看出大多用于日常生活或经济生活中相对比较正式的场合,查看出处可以发现「Yahoo!知恵袋」和「国会会議録」几乎各占一半左右,一般用于相对正式的语境中。

四、结语

本文使用“中纳言”,对“キャンセル”、“解約”、“取り消し”这3个同义词的使用情况进行了调查。其结果,与母语者使用意向不同,在实际数据中,3个词的频率顺序为「取り消し」>「キャンセル」>「解約」,另外也对3个词在各自不同微妙语境下的使用情况进行了考查。得知「キャンセル」比较随意更加口语化;「解約」一般用于金融法律等特定场合;而「取り消し」则相对郑重,应用更加广泛,像这样3个词各自呈现出了在不同语境下的使用倾向,即便对于缺乏内省的非母语学习者来说,通过语料库的检索,也可准确把握同义词的微妙差异。

参考文献:

[1]「現代日本語書き言葉均衡コーパス」中納言

[EB/OL].https://chunagon.ninjal.ac.jp/bccwj-nt/search

[2] 国立国語研究所

https://www.ninjal.ac.jp/archives/genzai/ishiki/kekka/3index/3-1/

[3]李在鎬,石川慎一郎,砂川有里子.日本語教育のためのコーパス調査入門[M].くろしお出版社,2012.


本文来源:https://www.wddqw.com/doc/3725986c1dd9ad51f01dc281e53a580216fc504c.html