5.2 タグ コーパス の 導入。 単語 と タグ の タプル として 、 が 格納 さ れ て いる 。tagged_words () メソッド イテレート できる。
Tagged_sents () なら 、 [[(Word, Tag), (Word, Tag), ...], [...], ...]
として 文 に イテレート できる。。
Python 3.6 +.1.1 では 、 с.198 の プロット サンプル で エラー が 出る。 。freqdict の に 「pp $」 の よう に に に に に $ が 入っ て て 、 この $ を パース でき ない ようだ。 で 根本 原因 を 解決 する の 本来 の 目的 ではない 、 適当 に せる。。。。
import nltk tagged_words = nltk.corpus.brown.tagged_words(categories="news") dist = nltk.FreqDist(tag.replace("$", "") for (word, tag) in tagged_words) dist.plot()
Оригинал: “https://dev.to/torufurukawa/-pp195-198-47im”