Сегодня я покажу вам простой способ сделать WordCloud новостей заголовков в Python!
Если вы еще не прочитали этот учебник, объясняя, как соскребать заголовки новостей в Python, убедитесь, что вы делаете. Таким образом, вот код для соскобы заголовков новостей в Python:
import requests from bs4 import BeautifulSoup url='https://www.bbc.com/news' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') headlines = soup.find('body').find_all('h3') for x in headlines: print(x.text.strip())
Чтобы создать WordCloud из этих новостей заголовков, сначала импортируйте эти 2 библиотеки рядом с библиотеками, необходимыми для Scrape нашего источника новостей:
import requests from bs4 import BeautifulSoup from wordcloud import WordCloud #add wordcloud import matplotlib.pyplot as plt #add pyplot from matplotlib
Следующий , заменять
for x in headlines: print(x.text.strip())
с участием
h3text = '' for x in el: h3text = h3text + ' ' + x.text.strip()
- Это сначала определяет строку «H3Text», а затем добавьте все новости заголовки на строку и отделите их с пробелами.
Прежде чем сделать WordCloud, вы можете проверить заголовки новостей с помощью Печать (H3Text)
Чтобы сделать WordCloud, добавьте эти строки кода до конца сценария:
wordcloud = WordCloud(width=500, height=500, margin=0).generate(soup.get_text(h3text)) plt.imshow(wordcloud, interpolation='bilinear') plt.axis("off") plt.margins(x=0, y=0) plt.show()
Позволь мне объяснить…
- Сначала создайте WordCloud (ну больше похоже на коробку в этом случае) размером 500 на 500.
- Далее наш WordCloud будет создан с помощью «PLT.IMShow ()» (
Интерполяция = «Билинеар»
Просто облегчает слова слова в WordCloud для чтения). PLT.AXIS («ВЫКЛ»)
а такжеplt.margins (x = 0,)
Убедитесь, что наш WordCloud не отображается как график.- Наконец, наш WordCloud отображается с использованием «PLT.Show ()».
Если вы запустите свой код, ваш WordCloud должен выглядеть что-то подобное:
Конечно, ваш WordCloud, вероятно, будет совсем по-разному, так как заголовки новостей меняются все время.
Вот и это для этого учебника/мини-проекта!
Если вы начинающий, кто любит открывать новые вещи о Python, попробуйте моя еженедельная рассылка Python
Byeeeee👋.
Оригинал: “https://dev.to/code_jedi/create-a-wordcloud-of-news-headlines-in-python-5549”