Bag-of-Words(BOW) とは
- Bag-of-Words とは、「文章」をその中に含まれている単語の 1-of-K ベクトルを足し合わせたもので表現する方法
- 画像の例では、「あの」に対しては、文のベクトルの0番目の値を1にするというルールが適応されている
例
「私は君が好きだ。」をBOWで表現すると
BOW | 1 | 1 | 0 | 1 | 1 | 1 | 1 | 1 |
---|---|---|---|---|---|---|---|---|
私 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
は | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
君 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
が | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
好き | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
だ | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 |
。 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
各単語のone-hotベクトルを足し上げたものが、文のBOWとなる