MS-IME対google日本語入力(2):長文変換の実力を比べる(1)

小説・報告書などを対象とした長文入力効率を比較してみました。MS-IMEも結構がんばっていると思わせる結果が出ました。

- スポンサードリンク -

「MS-IME対google日本語入力」シリーズ第2回です。前回は、人名を対象とした単語単位での変換能率を二つのIMEで比較しました。結果はgoogle圧勝といえました。

しかし、実際の日本語入力では単語単位での変換ではなく文単位での変換の効率こそが重要でしょう。そこで今回は長文の例文をいくつか用意し、かな漢字変換をどれくらい適切に行なってくれるか比較してみました。

方法

  1. サンプルテキストを用意。
  2. google日本語入力を用いて同様にエディタ上にサンプルテキストを入力。
  3. MS-IMEを用いてエディタ上にサンプルテキストを入力。
    • かな入力は文単位で行う。つまり「。」が出てくるまで変換キーは押さない。ただし自動変換は妨げない。
    • 文節切り直しや再変換を行わない。つまり変換キーを押して出てくる最初の候補をそのまま確定させる。

結果

以下に変換結果を掲載します。赤字が正しい変換結果、黒字が誤変換を示しています。なお、ここで「正しい」とは日本語の文法・書法・語意の上で間違っていないという意味で、原文を忠実に再現していることを意味しているわけではありません。

報告書

まずは、経産省のKnowledge Connectorで公開されている平成27年度商店街実態調査報告書の冒頭部分です。

MS-IMEが一発でパーフェクト変換を達成。googleも頑張ってはいますがやや残念な結果を返してきました。「商店街」など、最初は正しく変換しているのに、二回目は「賞典外」。ちょっと考えすぎとも思えます。

google

近年の商店街を取り巻く環境は、大型商業施設の進出やインターネット販売などによる購買機械の多様化、しょウシ科による人口減少などの構造的な要因により、より厳しい状況が続いています。
商店街実態調査は、こうした状況を踏まえ、賞典外の最近の契経や空き店舗の状況、商店街が抱える課題など商店街の実態をアンケート調査により明らかにし、今後の商店街活性化施策の基礎資料とすることを目的として実施しています。
調査は、昭和45年に開始され、今回の調査が12回めの実施になります。

MS-IME

近年の商店街を取り巻く環境は、大型商業施設の進出やインターネット販売などによる購買機会の多様化、少子化による人口減少などの構造的な要因により、より厳しい状況が続いています。
商店街実態調査は、こうした状況を踏まえ、商店街の最近の景況や空き店舗の状況、商店街が抱える課題など商店街の実態をアンケート調査により明らかにし、今後の商店街活性化施策の基礎資料とすることを目的として実施しています。
当調査は、昭和45年に開始され、今回の調査が12回目の実施になります。

小説

次にテストサンプルに用いたのは、川端康成の小説「雪国」の一節です。

日本語のお手本としてしばしば取り上げられる題材であり、長々説明する必要もないでしょう。テストに使ったのは物語の開始まもなくの箇所で、列車内の情景が描写されています。

google

陽子は窓を閉めて、赤らんだ頬に両手を当てた。
ラッセルを参内備えて雪を待つ、国境の山であった。トンネルの南北から、電力による雪崩放置線が通じた。除雪妊婦延べ人員ご鮮明に加えて消防組青年団の延べ人員に鮮明出勤の手配がもう整っていた。

MS-IME

洋子は窓を閉めて、赤らんだ頬に両手を当てた。
ラッセルを三台備えて雪を待つ、国境の山であった。トンネルの南北から、電力によるなだれ放置線が通じた。除雪妊婦延べ人員五千名に加えて消防組み青年団の延べ人員に鮮明出勤の手配がもう整っていた。

小説(ラノベ)

もう少し最近のテキストを試してみましょう。2004年に発表された涼宮ハルヒシリーズの第4作『涼宮ハルヒの消失』(谷川流著)の一節です。

現代の平均的な口調による会話文が挟まっています。

google

、谷口」
たまにはこっちから肩をたたいてやるのもいいだろう、と思ってそうしてやったのだが、
「......、キョンか」
声がやけにくぐもっているのも当然で、谷口は白いマスクを装着していた。
「どうした? 風邪か?」
「ああ......?」谷口はダルそうに、「見ての通り風邪状態だ。本当は休みたかったんだが、オヤジが五月蝿くてな」
機能まで元気いっぱいだったのに、突然の会ったもんだ。

MS-IME

、谷口」
たまにはこっちから肩をたたいてやるのもいいだろう、と思ってそうしてやったのだが、
「......無、居ん花」
「声がやけにくぐもっているのも当然で、谷口は白いマスクを装着していた。
「どうした? か?」
「ああ......?」谷口はだるそうに、「見てのとおり状態だ。本当は休みたかったんだが、親父がうるさくてな」
機能まで元気いっぱいだったのに、突然のがあったもんだ。

次回に続きます

正直に言って、予想とはだいぶん違う結果でした。適当なところで総括しようと思っていたのですが、もう少し実験を続けてみることにします。

このエントリーをはてなブックマークに追加
執筆xyz公式ツイッターアカウント@tsuzurikataにてコメント/フォロー受け付けています。

- スポンサードリンク -