人工知能と翻訳技術の未来

以下はおそらくtoeflとは何の関係もないし、単なる素人考えの頭の整理である。
文献等で確認もしておらず、頭の中で考えただけなので、正しいかも保証できない。

最近、新聞を読んでいると、毎日のように「人工知能」の記事が出てくる。
人工知能の宝庫といえば、インターネットだ。
Googleが設立された1998年、お世辞にもグーグルの検索機能は優れたものではなかった。
自分もグーグルの検索力がひどいので、検索時はYahooを使っていた。
しかし、最近のグーグルの検索力は本当にすごい。15年前との違いは本当に驚くばかりで、最近、インターネットを始めた人は、この違いを知らないわけで、ある意味かわいそうとも思う。

こうした技術の鍵となっているのが、「ディープラーニング」と呼ばれる人工知能分野で起こったブレイクスルーだ。
自分の理解では、これまでのプログラミングは、Aを入力したらBと回答する、といったパターンを一つ一つ起こしていた。一方、ディープラーニングでは、A,B,C,D,といったさまざまな回答を元に、おおまかな概念を構築し、その概念を元にして回答を作り出す。これは人間の思考にとても似ていると思う。例えば、形がおかしくても、これはリンゴだ、と理解できるのは、これまでたくさんのリンゴを見てきて、リンゴという概念を自分が持っているからであり、これと同様のことを機械がしている、と理解している。画像認識なんかはディープラーニングを活用しているに違いない。

そして、人工知能が発達すれば、当然、英語も簡単に翻訳ができるようになるはずだから、英語を学ぶ必要はないんじゃ?という発想が出てくる。
自分もこれは一面、正しいと思う。

松尾豊さんの「人工知能は人間を超えるか」(2015)によれば、機械翻訳というのは、人工知能の中では非常に難易度が高い技術のようだ。
理由は、たとえば「He saw a woman in the garden with a telescope.」という文があったときに、前置詞の関係性が一意に定まらず、主客の関係が機械で判断しにくい。そのため、庭にいたのが女性ではなく「彼」だと機械が解釈してしまう。こういう問題が無数の文で起こる。だから機械翻訳は難しい、とのことだ。

それでも本書では機械翻訳が実用レベルに達する年を2025年頃と予測している。つまり、今年生まれた子供は、もはや時間をかけて英語や中国語を学校で学ぶ必要はなくなっているかもしれない。。

自分の予想では、機械翻訳の実用レベル化の難易度を見たとき、英語はかなり難しい部類に入る。もっといえば、インド・ヨーロッパ語族の諸言語の中では、まず最初に古代ギリシア語が実用レベルに達し、ラテン語→フランス・イタリア語→英語、の順に実用レベルに達するのではないか、と予想する。

なぜか。
まず、ラテン語は、ギリシャ語と古代トスカナの言語の混合物だ。
フランス語はラテン語と古代フランク語との複合言語、イタリア語はラテン語と古代ロンバルディア人の言語との複合言語だ。
そして、英語はフランス語と古代サクソン人の言語の合成物だ。

言語はどのように進化していったか、ということを考えるうえで、鍵は「構文は複雑化」「格変化は単純化」にあると思っている。

つまり、自分の理解では、昔の人の言葉というのは、前置詞や形容詞があまり使われなかった。
前置詞というのは、物と物の関係性を表す言葉だから、抽象度が高い。これは、かなりの抽象化・一般化能力がないと生み出せなかったはずだ。
言葉が生まれるときは、おそらく直接目にすることができ、簡単に表せる名詞や動詞が先にできたと思われる。
もっといえば、KenとかTomとかはすぐにできただろうが、IとかHeとかは一般化されているので、もっと後にできただろう。
要するに、言語は具体化→一般化の順番にできていったと考えるのが自然だ。
前置詞の「of」なんて、めちゃくちゃ抽象度が高く、当時相当頭が良い人間でないと概念を理解できなかったのではなかろうか。

古代ギリシア語やラテン語でも、今の英語であれば、助動詞などを使って表現していたのを一語で表現していたりする。
アダムスミスの「道徳感情論」によれば、
ローマ人が一言でamavissem[私は愛していたはずだ]と表現していたものを、イギリス人は四つの異なった単語を用いて、I should have loved[私は愛していたはずだ]と表現している、とのことだ。

古代ギリシア人の言葉は、名詞や動詞の格変化が多いので、単語が非常にややこしくなる。
しかし、それとは引き換えに、前置詞のような抽象・一般化の言葉が少ないので、例えば、語順がバラバラでも、意味が同じだったりする。先の例でいえば、「He saw a woman in the garden with a telescope.」のHeとWomanの位置を逆にしても、古代ギリシア語では、同じ意味になった、ということが予想される。

これは、機械翻訳との関係でいえば、大きなメリットだと思う。順番が変わっても、格変化の言葉さえわかれば、意味を導き出せるからだ。だから、インドヨーロッパ系の言語に限って言えば、ギリシア語・ラテン語など昔からある「格変化が複雑で、構文が単純」な言語の方が、英語などの「格変化が単純・構文が複雑」である相対的に新しい言語よりも、翻訳しやすいと思う。

佐藤優さんは、よく、ビジネスパーソンの教養として、ギリシア語とラテン語は必須、と言っているし、確かに個人的にもギリシア語は最低限単語くらいは覚えることは意義があると考える。(自分の場合、数学の用語や学名等が、ギリシア語・ラテン語を使っているから、という理由くらいしか思い浮かばないが)

しかし、上記の予想が確かならば、古代ギリシア語を読めるレベルにまで達する必要はないだろう。
予想では、最も早く機械翻訳が実用レベルに達する言語は、古代ギリシア語である。
英語の翻訳がビジネスレベルで実用化したとき、それは、すべてのインドヨーロッパ諸言語が実用レベルに達した時なのではないだろうか。
ロシア語とかはよく知らないが。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中