数理的手法を使いやすくするためのソフトウェア開発

科学技術計算とデータサイエンスについて

ニューラル機械翻訳は複数の形容詞を正しく並べられるか?

英文法のオンライン講座で、11種類の形容詞を並べるときの語順

  • (number) (opinion) (size) (shape) (condition) (age) (color) (pattern) (origin) (material) (purpose)

を習いました。具体的には、形容詞で名詞を修飾するときに、

  • 20 cute petite long clean new red lacy French silk wedding dresses

  • three attractive tall women

のような順序で並べるべきであるという規則です。

すると、この文法規則をニューラル機械翻訳に学習させることができているのかが、気になります。そこで、グーグル翻訳で試してみました。

  • [日本語の入力] 20のシルクのフランスのかわいい小柄な長くクリーンな新しい赤いレースのウェディングドレス

    • [英語の出力] 20 Silk French Cute Petite Long Clean New Red Lace Wedding Dress
  • [日本語の入力] 3人の背の高い魅力的な女性

    • [英語の出力] Three tall attractive women

出力された語順は、入力したときのままで、文法規則に沿って並べ替えられることはありませんでした。

日本語を英語に翻訳するとき、ニューラル機械翻訳が、主語・動詞・目的語などを正しい語順に並べ替えることができるのは、大量のデータでニューラルネットワークモデルを訓練したためなのだと思います。 にもかかわらず、形容詞の語順を学習させることができていないのは、訓練データのなかに、正確な形容詞の並べ替えについての十分な例が含まれていないからなのでしょうか。