Рубрики
Без рубрики

Создайте WordCloud новостей заголовков в Python!

Сегодня я покажу вам простой способ сделать заголовки WordCloud новостей в … Помечено Python, программирование, начинающие, боковые продукты.

Сегодня я покажу вам простой способ сделать WordCloud новостей заголовков в Python!

Если вы еще не прочитали этот учебник, объясняя, как соскребать заголовки новостей в Python, убедитесь, что вы делаете. Таким образом, вот код для соскобы заголовков новостей в Python:

import requests
from bs4 import BeautifulSoup

url='https://www.bbc.com/news'
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')
headlines = soup.find('body').find_all('h3')
for x in headlines:
    print(x.text.strip())

Чтобы создать WordCloud из этих новостей заголовков, сначала импортируйте эти 2 библиотеки рядом с библиотеками, необходимыми для Scrape нашего источника новостей:

import requests
from bs4 import BeautifulSoup
from wordcloud import WordCloud #add wordcloud
import matplotlib.pyplot as plt #add pyplot from matplotlib

Следующий , заменять

for x in headlines:
    print(x.text.strip())

с участием

h3text = ''
for x in el:
    h3text = h3text + ' ' + x.text.strip()
  • Это сначала определяет строку «H3Text», а затем добавьте все новости заголовки на строку и отделите их с пробелами.

Прежде чем сделать WordCloud, вы можете проверить заголовки новостей с помощью Печать (H3Text)

Чтобы сделать WordCloud, добавьте эти строки кода до конца сценария:

wordcloud = WordCloud(width=500, height=500, margin=0).generate(soup.get_text(h3text))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.margins(x=0, y=0)
plt.show()

Позволь мне объяснить…

  • Сначала создайте WordCloud (ну больше похоже на коробку в этом случае) размером 500 на 500.
  • Далее наш WordCloud будет создан с помощью «PLT.IMShow ()» ( Интерполяция = «Билинеар» Просто облегчает слова слова в WordCloud для чтения).
  • PLT.AXIS («ВЫКЛ») а также plt.margins (x = 0,) Убедитесь, что наш WordCloud не отображается как график.
  • Наконец, наш WordCloud отображается с использованием «PLT.Show ()».

Если вы запустите свой код, ваш WordCloud должен выглядеть что-то подобное:

Конечно, ваш WordCloud, вероятно, будет совсем по-разному, так как заголовки новостей меняются все время.

Вот и это для этого учебника/мини-проекта!

Если вы начинающий, кто любит открывать новые вещи о Python, попробуйте моя еженедельная рассылка Python

Byeeeee👋.

Оригинал: “https://dev.to/code_jedi/create-a-wordcloud-of-news-headlines-in-python-5549”