Рубрики
Без рубрики

Scrape Facebook публичные страницы без ключа API или ограничения

API Facebook действительно трудно установить и иметь ограничение скорости. Почему бы не получать публику да … Теги с Facebook, Python, Scraping, Selenium.

API Facebook действительно трудно установить и иметь ограничение скорости. Почему бы не получать публичные данные с некоторыми автоматизацией? Вот библиотека Python, которая делает работу.

Установите его с помощью pypi:

Пип Установите Facebook-Page-Scraper

Или установите его из источника: скачать его с помощью Git:

Git Clone https://github.com/shaikhsajid1111/facebook_page_scraper.git.git.

И открыть терминал внутри папки и введите команду:

python3 setup.py установить Отказ

Как это использовать? Ну, это просто!, Просто класс импорта из пакета, инстанции и начните соскабливание.

Предположим, я хочу посты из Facebook Ai,

from facebook_page_scraper import Facebook_scraper

#instantiate the Facebook_scraper class

page_name = "facebookai"
posts_count = 10
browser = "firefox"

facebook_ai = Facebook_scraper(page_name,posts_count,browser)

Выше была экземплярная часть, предположим, что вы хотите, чтобы данные в формате JSON, чем просто позвонить в scrap_to_json () метод. Нравиться:

json_data = facebook_ai.scrap_to_json()
print(json_data)

И вы получите выход JSON:

{
    "1730063790503900": {
        "name": "Facebook AI",
        "shares": 65,
        "reactions": {
            "likes": 305,
            "loves": 31,
            "wow": 7,
            "cares": 0,
            "sad": 0,
            "angry": 0,
            "haha": 0
        },
        "reaction_count": 343,
        "comments": 11,
        "content": "We\u2019re training computer vision models that leverage Transformers, a deep neural network architecture. Data-efficient image Transformers (DeiT) use less data and computing resources to produce high-performance image classification AI models.  We hope to advance the field of computer vision by sharing this work with the broader community, making large-scale systems that train AI models more accessible to researchers and engineers.",
        "posted_on": "2020-12-24T04:05:27",
        "video": "",
        "image": [
            "https://scontent-bom1-2.xx.fbcdn.net/v/t39.2365-6/p540x282/131570013_988138305044034_3894567585410559092_n.png?_nc_cat=109&ccb=2&_nc_sid=eaa83b&_nc_ohc=mAeDelparrEAX-3Mk7E&_nc_ht=scontent-bom1-2.xx&_nc_tp=30&oh=3fedb0e3cea6ad6f934ca20f77bec624&oe=600CB4C9"
        ],
        "post_url": "https://www.facebook.com/facebookai/posts/1730063790503900"
    },    ...

}

Если вы хотите сохранить данные в файл CSV напрямую, просто позвоните в SCRAP_TO_CSV () метод.

Нравиться:

filename = "data_file"  #file name without CSV extension,where data will be saved
directory = "E:\data" #directory where CSV file will be saved
facebook_ai.scrap_to_csv(filename,directory)

Выход:

Источник

Оригинал: “https://dev.to/shaikhsajid1111/scrape-facebook-public-pages-without-an-api-key-or-limitations-43d4”