3.2.
import nltk from nltk.corpus import gutenberg, nps_chat moby = nltk.Text(gutenberg.words("melville-moby_dick.txt")) moby.findall(r" (<.*>)") chat = nltk.Text(nps_chat.words()) chat.findall(r"<.*> <.*> ") chat.findall(r" {3,}")
3.6 は 化 、 ステミング。。
Оригинал: “https://dev.to/torufurukawa/-pp86-117-1j64”