@article{oai:doshisha.repo.nii.ac.jp:00026013, author = {鄭, 弯弯 and Zheng, Wanwan and Jin, Mingzhe and 金, 明哲}, issue = {4}, journal = {同志社大学ハリス理化学研究報告, The Harris science review of Doshisha University}, month = {Jan}, note = {語彙の豊富さを表す指標は多く提案されているものの、その中から文長に依存しない指標を選出するための評価法がまだ確立されていない。既存の評価方法として、各指標の元データもしくは標準化したデータの遷移曲線を用いた考察が一般的である。この方法は目視による判断がほとんどであり、指標の変化をとらえきれない欠点がある。本研究では先行研究の問題点を踏まえて、変動係数を用いた語彙の豊富さ指標の比較評価方法を提案する。また、提案手法を用いてTTR、K、R、S、Uber、C、s、LN、k、M、mの計11個の語彙の豊富さ指標について比較評価実験を行う。さらに語彙の豊富さを表す指標は言語に依存するかを明らかにするため、日本語、中国語と英語のコーパスを用いて検証する。その結果、文長と言語から、最も小さな影響を受けている指標はsである。, Although numerous lexical richness measures have been proposed, a positive evaluation method has not been established to select measures independent of text length. As an existing evaluation method, it is common to view the transition curves of the measure's original data or standardized data. However, this method is mostly judged visually and cannot sufficiently capture the change of measures. In other words, this method cannot compare and evaluate lexical richness measures directly by viewing transition curves of either original data or standardized data. In this paper, evaluation statistic CV (coefficient of variation) is proposed as a possible method to evaluate lexical richness measures. CV overcomes the drawback of previous research and make it possible to compare the stability of measures by visual observation. A total of 11 measures of TTR, K, R, S, Uber, C, s, LN, k, M and m are compared and evaluated using CV. Meanwhile, Japanese, Chinese, and English corpora are used to avoid the possible influence of the languages. Analysis results indicate that s is the measure with the smallest influence of text length and language., application/pdf}, pages = {230--241}, title = {変動係数を用いた語彙の豊富さ指標の比較評価}, volume = {58}, year = {2018}, yomi = {テイ, ワンワン and キン, メイテツ} }