Рубрики
Без рубрики

Извлечение твитов из Twitter с помощью API с Python

Здравствуйте, читатели, в этой статье я буду представлять вас в API Twitter а именно Tweepy, который используется для извлечения твитов с помощью Python. надеюсь вам понравится

Автор оригинала: Pankaj Kumar.

Извлечение твитов из Twitter с помощью API с Python

Здравствуйте, читатели, в этой статье я буду представлять вас в API Twitter а именно Tweepy, который используется для извлечения твитов с помощью Python. Я надеюсь, что вам понравится читать эту статью.

Оглавление

  • Требования к извлечению твитов из Twitter с помощью Python
    • 1. Учетная запись Developer Twitter
    • 2. Программное обеспечение для съемки
  • Код для извлечения твитов из Twitter
    • 1. Импорт необходимых библиотек и настроить токены OAUTH
    • 2. Авторизуйтесь с Tweepy’s Oauthhandler
    • 3. Извлечение конкретных твитов из Twitter
    • 4. Вытащивание метаданных твитов
    • 5. Полный код для извлечения твитов из Twitter с помощью Python и Tweepy
  • Заключение

Требования к извлечению твитов из Twitter с помощью Python

Давайте перейдем на то, что нам нужно, чтобы начать здесь.

1. Учетная запись Developer Twitter

Чтобы получить доступ к Tweepy API, вам важно создать учетную запись разработчика, и эта учетная запись должна быть одобрена из Twitter. Так любезно убедитесь, что вы предоставили правильные детали и правильную причину использовать Tweepy.

Вот как вы можете создать учетную запись разработчика.

  • Посетите сайт разработчика Twitter в dev.twitter.com Отказ
  • Создайте учетную запись на сайте разработчика, нажав кнопку «Войти» в верхнем правом углу.
Разработчик Twitter
  • После входа нажмите на ссылку разработчика на Nav-Bar.
  • Нажмите на свою учетную запись и выберите «Приложения» из раскрывающегося меню, которое появляется.
Изображение 7.
  • Нажмите на кнопку «Создать приложение» и заполните детали для вашего приложения.
  • Создайте свой токен доступа для приложения. Скопируйте этот токен доступа в файл и сохраните его в безопасности.
  • Как только вы сделали это, сделайте записку ваших настроек OAUTH, которые включают в себя – Потребительский ключ, Потребительский секрет, токен AAuth Access, Token Token Oauth Access.

2. Программное обеспечение для съемки

Вам понадобится программное обеспечение, которое может читать распределительный лист, такой как Microsoft Excel или LibreOffice Reader.

Код для извлечения твитов из Twitter

В этом примере кодирования мы выделим данные из Twitter.com, используя Tweepy.

1. Импорт необходимых библиотек и настроить токены OAUTH

Так что начать с, импортируйте необходимые библиотеки, такие как Tweepy и Pandas, а также объявляют токен ОАУТ, который получен во время создания вашего приложения на приборной панели Twitter Developer.

from tweepy import *

import pandas as pd
import csv
import re 
import string
import preprocessor as p

consumer_key = 
consumer_secret = 
access_key= 
access_secret = 

2. Авторизуйтесь с Tweepy’s Oauthhandler

Теперь, когда мы определили ключи, мы приступим к разрешению самим собой с Tweepy’s Oauthhandler. Мы пройдем ключи, как показано ниже.

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)

Теперь мы передам эти детали авторизации в Tweepey, как показано ниже.

api = tweepy.API(auth,wait_on_rate_limit=True)

3. Извлечение конкретных твитов из Twitter

Вы можете определить переменную по имени search_words и укажите слово, о котором вы хотели бы получить твиты.

Tweepy проверяет все твиты для этого конкретного ключевого слова и извлекает содержимое. Это может быть хэштеги, @ доменные или даже нормальные слова.

Иногда даже ретветы являются экстрактами и избежать того, чтобы мы фильтровали ретветы.

search_words = "#"      #enter your words
new_search = search_words + " -filter:retweets"

Теперь для каждого твита в Tweepy Cursor мы ищем слова и передаем его, как показано ниже. Затем мы пишем содержимое в файл CSV, как показано после кодировки UTF-8.

4. Вытащивание метаданных твитов

В приведенном ниже фрагменте кода я хочу получить только время создания Tweet, текста Tweet, имя пользователя и местоположение.

for tweet in tweepy.Cursor(api.search,q=new_search,count=100,
                           lang="en",
                           since_id=0).items():
    csvWriter.writerow([tweet.created_at, tweet.text.encode('utf-8'),tweet.user.screen_name.encode('utf-8'), tweet.user.location.encode('utf-8')])

Теперь мы откроем файл CSV в режиме Append и запись содержимого из Twitter в этот файл.

csvFile = open('file-name', 'a')
csvWriter = csv.writer(csvFile)

5. Полный код для извлечения твитов из Twitter с помощью Python и Tweepy

Весь код выглядит как показано ниже. Вы можете выполнить это и найти файл CSV со всеми вами нужными данными в одном рабочем каталоге, что и ваш файл Python.

from tweepy import *

import pandas as pd
import csv
import re 
import string
import preprocessor as p

consumer_key = 
consumer_secret = 
access_key= 
access_secret = 

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)

api = tweepy.API(auth,wait_on_rate_limit=True)

csvFile = open('file-name', 'a')
csvWriter = csv.writer(csvFile)

search_words = "#"      # enter your words
new_search = search_words + " -filter:retweets"

for tweet in tweepy.Cursor(api.search,q=new_search,count=100,
                           lang="en",
                           since_id=0).items():
    csvWriter.writerow([tweet.created_at, tweet.text.encode('utf-8'),tweet.user.screen_name.encode('utf-8'), tweet.user.location.encode('utf-8')])

Выход вышеуказанного кода представляет собой файл CSV, который выглядит следующим образом:

Изображение 22.

Пожалуйста, обратите внимание, вывод будет варьироваться в зависимости от ключевых слов поиска.

Заключение

Таким образом, мы пришли к концу этой статьи и попытались извлечь некоторую информацию из Tweepey. Надеюсь, тебе нравится делать это! Дайте нам знать ваши отзывы в разделе комментариев ниже.