Рубрики
Без рубрики

入門 自然 言語 処理 стр.195-198

5.2 タグ コーパス の 導入。 単語 と タグ の タプル として 、 が 格納 さ れ て いる 。tagged_words () メソッド イテレート できる。 Tagged_sents () なら 、 [[(слово, … Tagged with NLP, Python, чтение.

5.2 タグ コーパス の 導入。 単語 と タグ の タプル として 、 が 格納 さ れ て いる 。tagged_words () メソッド イテレート できる。

Tagged_sents () なら 、 [[(Word, Tag), (Word, Tag), ...], [...], ...] として 文 に イテレート できる。。

Python 3.6 +.1.1 では 、 с.198 の プロット サンプル で エラー が 出る。 。freqdict の に 「pp $」 の よう に に に に に $ が 入っ て て 、 この $ を パース でき ない ようだ。 で 根本 原因 を 解決 する の 本来 の 目的 ではない 、 適当 に せる。。。。

import nltk
tagged_words = nltk.corpus.brown.tagged_words(categories="news")
dist = nltk.FreqDist(tag.replace("$", "") for (word, tag) in tagged_words)
dist.plot()

Оригинал: “https://dev.to/torufurukawa/-pp195-198-47im”