Рубрики
Без рубрики

Проверенная структура для экспорта ваших подписчиков средних

Вы когда-нибудь хотели экспортировать свой список средних последователей, но отчаяние на то, насколько важна эта задача благодаря вашему большому списку? Не страха нет, вот простой способ использовать экспортировать свои подписчики средних средств в файл CSV.

Автор оригинала: Laszlo L. Mari.

Среда подвергается множеству изменений, это действительно развивается в наши дни. Я люблю писать на гладкий интерфейс, и я люблю настроить носитель. Может быть, больше, чем писать на нем.

Итак, у одного из моих друзей была проблема, которая была золотой: она хотела экспортировать свой список последователей из среды до CSV. Вручную это сделало бы ее возраст около 2000 подписчиков.

Я еще не осмотрел страницу последователей (на самом деле я даже не знал, что есть возможность увидеть, кто следит за вами), так что это было совершенно новое поле для меня. К счастью, она знает о HTML, и она могла легко узнать, что элементы имеют одинаковые классы. Это точка, которую я мог бы использовать, поэтому я начал кодировать решение в Python сразу. Это было хорошее упражнение для меня, потому что я изучаю Python, и я узнал, как в два раза больше от этой задачи, чем от таких первых 100 страниц книги, которую я прочитал и из видео, которые я видел.

TL; доктор

Да, я дам вам код в секунду. Просто позвольте мне дать вам некоторые инструкции. Прежде всего, вам нужно прокрутить до конца вашего списка последователей, нажав на «Показать больше» много раз (это зависит от того, сколько у вас есть подписчиков). Во-вторых, вам необходимо сохранить страницу после прокрутки. Это самый простой, если вы щелкните правой кнопкой мыши и нажмите «Сохранить как ..» или что-то в этом роде. Если вы не можете найти это таким образом, вы можете просто ударить Ctrl-S или CMD-S на случай, если вы используете Mac. Во всяком случае, попробуйте сохранить его в отдельную папку. Теперь вы сделали около половины работы. Поздравляю!

После сохранения файлов вы увидите файл и папку. Если вы выбрали «index.html» как имя файла, откройте этот файл в текстовом редакторе. Важно, потому что если вы просто дважды щелкните его, он откроется в вашем браузере (если вы не настроили его, чтобы открыть где-то еще, но в этом случае, я думаю, вы программисты, и вы уже знаете, что происходит). Скопируйте содержимое файла. Самый простой способ – Ctrl-A, а затем Ctrl-C. В Mac измените Ctrl в CMD.

Вот идет сложная часть! Я закодировал эту вещь в Python, и для среднего пользователя трудно создать среду разработки Python. К счастью, это мертв просто (Хэллоуин предназначен) с помощью редактора бесплатного облака под названием Cloud9 Отказ Просто зарегистрируйтесь и создайте новую коробку с этим URL: https://c9.io/new Отказ Очень важно выбрать Django в качестве шаблона, чтобы у вас уже есть Python поставляется.

Введите описание изображения здесь

После того, как вы создали свою удивительную виртуальную машину, вы увидите, что редактор кода появляется. ЗДОРОВО!

Здесь создайте файл с именем «Main.py», щелкнув правой кнопкой мыши на папку слева, имеет то же имя, что и имя вашего проекта, когда вы его создали. (В моем случае это «вашему-модно-экспортеру имя» от изображения выше.

Прямо сейчас приходит супер забавная часть! Вставьте этот код в main.py :

import bs4
import re


txt = open("index.html")
def read1k():
    return txt.read(65443553)



for data in iter(read1k, ''):
    soup = bs4.BeautifulSoup(data, "html5lib")
    links = [a.attrs.get('href') for a in soup.select('div.list-itemDescription > a')];
    names = [a for a in soup.select('div.list-itemDescription > a')];
    
    
    
    
    descriptions = [p for p in soup.select('p.list-itemDescription')];

    
    i = 0
    length = len(descriptions)
    
    while(i < len(links)):
        ez = links[i] + "\t" + re.sub(' +',' ',names[i].text).replace('\n', '\t').replace('\r', '').encode('ascii', 'ignore').decode('ascii') + "\n"
        with open("output.csv", "a") as myfile:
            myfile.write(ez)
        i+= 1
        
    print("The function finished with %d found followers. You can download 'output.csv' now")%(len(links))

На данный момент, если вы могли бы следовать, я должен сказать, что ты рок!

Поэтому к следующему шагу: скучная установка зависимостей. Вставьте эту команду в терминал в нижней части страницы:

sudo pip install beautifulsoup4

Прямо сейчас перед запуском кода необходимо вставить свой средний HTML-контент в новый файл, называемый «index.html» так же, как вы создали main.py. Проблема с этим является то, что она неформатирована, и скрипт имеет проблемы, выбрасывающие данные из него в текущем этапе. Поэтому прямо сейчас вы должны отформатировать его, нажав на форматирование в редактировании> Форматирование кода> HTML, пока ваш файл index.html открыт в редакторе.

И вот приходит волшебство!

Просто вставить

python main.py

в терминал и прямо сейчас у вас есть «вывод .CSV» в вашем файле слева! Ура! Это ваши данные CSV! Вау, ты сделал это так далеко! Теперь вы можете просто щелкнуть правой кнопкой мыши к этому CSV и загрузить его в раскрывающемся меню. Это оно!

Это была представленная статья на среднем, вот почему я также показал вам это на кода-то, если вы хотите увидеть мой код или использовать его!