Рубрики
Без рубрики

Визуализация основных дебатов

Последние пару дней в США демократы обсуждают, кто должен столкнуться против … Tagged с DataViz, ShowDev, Python, NLP.

Последние пару дней в США демократы обсуждали, кто должен бежать против Трампа. Стенограммы казались забавным предметом для DataViz.

Весь код для этих визуализаций размещены здесь в различных коммитах.

Во -первых, я подумал, что было бы полезно получить простой бар, показывающий, сколько кандидатов говорили.

Примечание: как вы увидите, я не потратил время, чтобы обеспечить идеальное очищение данных. Есть некоторые артефакты и ошибки, которые будут очевидны в словом облака.

Я также был удивлен, обнаружив, что если вы создадите матрицу расстояния на основе TF-IDF …

… Выступающие прекрасно разбираются. Самый низкий человек, которого я видел, описанный как T1,-это мэр Пит, и шаблон содержит, считаете ли вы его T1.

Это что -то значит? Я так не думаю, по крайней мере, не все само по себе.

Наконец, вот несколько слов облаков:

В целом, я думаю, что это было забавное маленькое упражнение, но я не подозреваю, что это слишком много говорит о гонке.

Дайте мне знать, что вы думаете! Особенно, если вы заметите ошибку.

Оригинал: “https://dev.to/charlesdlandau/visualizing-the-primary-debates-4ff6”