Автор оригинала: FreeCodeCapm Team.
Кавита Ганесан
Около года назад я выглядел высоко и низко для библиотеки облачной группы Python Word, которую я мог бы использовать из моей ноутбуки Jupyter. Мне нужно было достаточно гибким, чтобы использовать считается
или TFIDF
При необходимости или просто принять набор слов и соответствующих весов.
Я был немного удивлен, что что-то вроде этого еще не существовало в библиотеках, таких как Сюжер
Отказ Все, что я хотел сделать, было быстрое понимание моих текстовых данных и векторов слов. Я думал, что это, вероятно, не слишком много, чтобы спросить …
Здесь я год спустя, используя свой собственный Word_Cloud Библиотека визуализации. Это не самая красивая или самая сложная, но это работает для большинства случаев. Я решил поделиться этим, чтобы другие могли использовать его. После Установка Вот несколько способов использовать его.
Генерировать слово облака с одним текстовым документом
В этом примере показаны примеры того, как вы можете генерировать слово облака только одним документом. В то время как цвета могут быть рандомизированы в этом примере, цвета основаны на настройках цвета по умолчанию.
По умолчанию слова взвешены с помощью Word Counts, если вы явно не просите взвешивание TFIDF. Взвешений TFIDF имеет смысл только в том случае, если у вас есть много документов для начала.
Создать слово облака из нескольких документов
Допустим, у вас есть 100 документов из одной категории новостей, и вы просто хотите увидеть, что являются общими упоминаниями.
Генерировать слово облака из существующих весов
Допустим, у вас есть набор слов с соответствующими весами, и вы просто хотите визуализировать его. Все, что вам нужно сделать, это убедиться, что вес нормализуется между [0 – 1].
Надеюсь, вы найдете это полезным! Пожалуйста, не стесняйтесь предлагать изменения, чтобы претеннуть на вывод – просто откройте запрос на потяжение с вашими изменениями.