Автор оригинала: Laszlo L. Mari.
Среда подвергается множеству изменений, это действительно развивается в наши дни. Я люблю писать на гладкий интерфейс, и я люблю настроить носитель. Может быть, больше, чем писать на нем.
Итак, у одного из моих друзей была проблема, которая была золотой: она хотела экспортировать свой список последователей из среды до CSV. Вручную это сделало бы ее возраст около 2000 подписчиков.
Я еще не осмотрел страницу последователей (на самом деле я даже не знал, что есть возможность увидеть, кто следит за вами), так что это было совершенно новое поле для меня. К счастью, она знает о HTML, и она могла легко узнать, что элементы имеют одинаковые классы. Это точка, которую я мог бы использовать, поэтому я начал кодировать решение в Python сразу. Это было хорошее упражнение для меня, потому что я изучаю Python, и я узнал, как в два раза больше от этой задачи, чем от таких первых 100 страниц книги, которую я прочитал и из видео, которые я видел.
TL; доктор
Да, я дам вам код в секунду. Просто позвольте мне дать вам некоторые инструкции. Прежде всего, вам нужно прокрутить до конца вашего списка последователей, нажав на «Показать больше» много раз (это зависит от того, сколько у вас есть подписчиков). Во-вторых, вам необходимо сохранить страницу после прокрутки. Это самый простой, если вы щелкните правой кнопкой мыши и нажмите «Сохранить как ..» или что-то в этом роде. Если вы не можете найти это таким образом, вы можете просто ударить Ctrl-S или CMD-S на случай, если вы используете Mac. Во всяком случае, попробуйте сохранить его в отдельную папку. Теперь вы сделали около половины работы. Поздравляю!
После сохранения файлов вы увидите файл и папку. Если вы выбрали «index.html» как имя файла, откройте этот файл в текстовом редакторе. Важно, потому что если вы просто дважды щелкните его, он откроется в вашем браузере (если вы не настроили его, чтобы открыть где-то еще, но в этом случае, я думаю, вы программисты, и вы уже знаете, что происходит). Скопируйте содержимое файла. Самый простой способ – Ctrl-A, а затем Ctrl-C. В Mac измените Ctrl в CMD.
Вот идет сложная часть! Я закодировал эту вещь в Python, и для среднего пользователя трудно создать среду разработки Python. К счастью, это мертв просто (Хэллоуин предназначен) с помощью редактора бесплатного облака под названием Cloud9 Отказ Просто зарегистрируйтесь и создайте новую коробку с этим URL: https://c9.io/new Отказ Очень важно выбрать Django в качестве шаблона, чтобы у вас уже есть Python поставляется.
После того, как вы создали свою удивительную виртуальную машину, вы увидите, что редактор кода появляется. ЗДОРОВО!
Здесь создайте файл с именем «Main.py», щелкнув правой кнопкой мыши на папку слева, имеет то же имя, что и имя вашего проекта, когда вы его создали. (В моем случае это «вашему-модно-экспортеру имя» от изображения выше.
Прямо сейчас приходит супер забавная часть! Вставьте этот код в main.py
:
import bs4 import re txt = open("index.html") def read1k(): return txt.read(65443553) for data in iter(read1k, ''): soup = bs4.BeautifulSoup(data, "html5lib") links = [a.attrs.get('href') for a in soup.select('div.list-itemDescription > a')]; names = [a for a in soup.select('div.list-itemDescription > a')]; descriptions = [p for p in soup.select('p.list-itemDescription')]; i = 0 length = len(descriptions) while(i < len(links)): ez = links[i] + "\t" + re.sub(' +',' ',names[i].text).replace('\n', '\t').replace('\r', '').encode('ascii', 'ignore').decode('ascii') + "\n" with open("output.csv", "a") as myfile: myfile.write(ez) i+= 1 print("The function finished with %d found followers. You can download 'output.csv' now")%(len(links))
На данный момент, если вы могли бы следовать, я должен сказать, что ты рок!
Поэтому к следующему шагу: скучная установка зависимостей. Вставьте эту команду в терминал в нижней части страницы:
sudo pip install beautifulsoup4
Прямо сейчас перед запуском кода необходимо вставить свой средний HTML-контент в новый файл, называемый «index.html» так же, как вы создали main.py. Проблема с этим является то, что она неформатирована, и скрипт имеет проблемы, выбрасывающие данные из него в текущем этапе. Поэтому прямо сейчас вы должны отформатировать его, нажав на форматирование в редактировании> Форматирование кода> HTML, пока ваш файл index.html открыт в редакторе.
И вот приходит волшебство!
Просто вставить
python main.py
в терминал и прямо сейчас у вас есть «вывод .CSV» в вашем файле слева! Ура! Это ваши данные CSV! Вау, ты сделал это так далеко! Теперь вы можете просто щелкнуть правой кнопкой мыши к этому CSV и загрузить его в раскрывающемся меню. Это оно!
Это была представленная статья на среднем, вот почему я также показал вам это на кода-то, если вы хотите увидеть мой код или использовать его!