2018-10-09 【自然言語処理】Tokenizationを行う3つの方法 自然言語処理 研究編 境界を同定する方法 文中のスペースやコンマなどの区切り文字を手がかりに、分割を行う方法 語を同定する方法 文の先頭から1文字ずつ読み込み、特定の単語と合致した箇所で分割を行う方法 分類機を使う方法 分割を行うパターンを、前後の文字などから学習させた分類機を用いる方法