Последние пару дней в США демократы обсуждали, кто должен бежать против Трампа. Стенограммы казались забавным предметом для DataViz.
Весь код для этих визуализаций размещены здесь в различных коммитах.
Во -первых, я подумал, что было бы полезно получить простой бар, показывающий, сколько кандидатов говорили.
Примечание: как вы увидите, я не потратил время, чтобы обеспечить идеальное очищение данных. Есть некоторые артефакты и ошибки, которые будут очевидны в словом облака.
Я также был удивлен, обнаружив, что если вы создадите матрицу расстояния на основе TF-IDF …
… Выступающие прекрасно разбираются. Самый низкий человек, которого я видел, описанный как T1,-это мэр Пит, и шаблон содержит, считаете ли вы его T1.
Это что -то значит? Я так не думаю, по крайней мере, не все само по себе.
Наконец, вот несколько слов облаков:
В целом, я думаю, что это было забавное маленькое упражнение, но я не подозреваю, что это слишком много говорит о гонке.
Дайте мне знать, что вы думаете! Особенно, если вы заметите ошибку.
Оригинал: “https://dev.to/charlesdlandau/visualizing-the-primary-debates-4ff6”