Рубрики
Без рубрики

Простой способ сделать слово облака для данных ученых

Автор оригинала: FreeCodeCapm Team.

Кавита Ганесан

Около года назад я выглядел высоко и низко для библиотеки облачной группы Python Word, которую я мог бы использовать из моей ноутбуки Jupyter. Мне нужно было достаточно гибким, чтобы использовать считается или TFIDF При необходимости или просто принять набор слов и соответствующих весов.

Я был немного удивлен, что что-то вроде этого еще не существовало в библиотеках, таких как Сюжер Отказ Все, что я хотел сделать, было быстрое понимание моих текстовых данных и векторов слов. Я думал, что это, вероятно, не слишком много, чтобы спросить …

Здесь я год спустя, используя свой собственный Word_Cloud Библиотека визуализации. Это не самая красивая или самая сложная, но это работает для большинства случаев. Я решил поделиться этим, чтобы другие могли использовать его. После Установка Вот несколько способов использовать его.

Генерировать слово облака с одним текстовым документом

В этом примере показаны примеры того, как вы можете генерировать слово облака только одним документом. В то время как цвета могут быть рандомизированы в этом примере, цвета основаны на настройках цвета по умолчанию.

По умолчанию слова взвешены с помощью Word Counts, если вы явно не просите взвешивание TFIDF. Взвешений TFIDF имеет смысл только в том случае, если у вас есть много документов для начала.

Создать слово облака из нескольких документов

Допустим, у вас есть 100 документов из одной категории новостей, и вы просто хотите увидеть, что являются общими упоминаниями.

Генерировать слово облака из существующих весов

Допустим, у вас есть набор слов с соответствующими весами, и вы просто хотите визуализировать его. Все, что вам нужно сделать, это убедиться, что вес нормализуется между [0 – 1].

Надеюсь, вы найдете это полезным! Пожалуйста, не стесняйтесь предлагать изменения, чтобы претеннуть на вывод – просто откройте запрос на потяжение с вашими изменениями.

Ссылки