文章の読みやすさを評価する数式が存在する

日本語の「読みやすさ」を、数式を使って数量的に評価しようという試みがあります。限界もありますが、文章を客観的に評価し作文のクセに気づくための有効な手法となりえるでしょう。

- スポンサードリンク -

数値による評価

英文に関してはその読みやすさ(リーダビリティ)を数値的に評価する試みが昔から行われています。その結果たくさんの評価式や指標が発表されてきました。

そのうち、Flesch Reading Ease ScoreとかFlesch-Kincaid Grade Levelの二つは、かのMicrosoft Wordでも利用できるようになっています。

msword-readability.png

では日本語では? 英語のそれと比べるとマイナーな印象が拭えませんが、研究例はあるようです。

読みやすい日本語の条件とは?

漢字の比率と文の長さ

日本語の読みやすさを左右する重要かつ解りやすい要素として、「文の長さ」と「文中の漢字数の割合」を挙げることができます。これらに着目して日本語の読みやすさを数値化しようと試みがあります。

「日本語の読みやすさの評価式」(建石、小野、山田、1988 情報処理学会研究報告ヒューマンコンピュータインタラクション 25:1-8

という論文には、その具体例が紹介されています。それによれば、

  • 森岡(1958)の指標: 文の長さ平均60文字以上「難しい」35字以下「やさしい」、漢字の割合35%以上「難しい」、20%以下「やさしい」
  • 安本(1983)の指標: 文の長さ51字以上「長い」35字以下「短い」、漢字比率40.5%以上「漢字が多い」29.9%以下「漢字が少ない」

しかし、漢字比率と文の長さを独立に指標化したのでは、矛盾した結果を得る可能性があります。極端な話、漢字をすべてひらがなに置き換えてしまえば漢字の比率は下がりますが文は長くなってしまいます。

これらとは異なる観点で文章の読みやすさを評価しようとする例の一つが、次に紹介する「リーダビリティー・リサーチ・ラボ」の研究です。

述語数・文節数も加え、総合的な評価を試みる

「リーダビリティー・リサーチ・ラボ」では、以下のような数式を提案しています。これによって評価対象の文章が学校の何学年のレベルにあるかを示そうというものです。

Y=-0.148X1+1.585X2-0.117X3-0.126X4+15.581
Y=学年   X1=文章中の平仮名の割合   X2=1文の平均述語数
X3=1文の平均文字数   X4=1文の平均文節数

同サイトではユーザーから入力された文章を上記評価式に沿って評価してくれるウェブサービスも提供されています。

ただし、利用にあたっては次のことを理解しておく必要があります。

  • ここでいう学年は「小学1年生から中学3年生まで」に限定されている。それ以上の数値が出てきたときの信頼性に保証はない。
  • 解析結果が表しているのは、「評価対象がどの学年用に作成されたテキストと似た傾向を持っているか」である。その学年の子供全てに理解できる文章だという意図ではない。

数値による評価には限界もあるが......

ただ、このような計算は自分で行うのはちょっと面倒でもあります。

また、いうまでもなくこの評価法は文脈とかTPOとかいったものを全く考慮しません。ですから、ここで「悪い数値」が出たからといって直ちに要改善とはなりません。逆に「よい数値」が出たからといって「改善必要なし」ともなりません。

とはいえ、自分の作文の癖を客観的にみるという点で、ここで紹介したような数量化は有効だと思います。また、どこかの段落でのみ極端に悪い数値が出た場合、高い確率で「こなれていない」文が見つかるのも確かです。

このような評価を簡単にやってくれるwebサイトも存在するようなので、いずれ紹介していきたいと思います。

このエントリーをはてなブックマークに追加
執筆xyz公式ツイッターアカウント@tsuzurikataにてコメント/フォロー受け付けています。

- スポンサードリンク -