Рубрики
Без рубрики

Google лето аналитики кода

Что такое Google лето кода? Если вы читаете этот пост, вы, вероятно, имеете какую-то идею … Помечено Python, Selenium, GSOC, Analytics.

Что такое Google лето кода?

Если вы читаете этот пост, вы, вероятно, имеете некоторое представление о Google летом кода. В любом случае, чтобы дать вам краткий обзор, лето Google Code (GSOC) – это международная программа, которая поощряет развитие OpenSource. По той же причине GSOC не является стажировкой, и вы не работаете в Google. В конце весны и начала лета вы должны связаться с несколькими сотнями партнерских организаций GSOC. Затем Организация поставит вас в свой список приоритетов и запрашивайте слот от Google в его программе GSOC для вас. Если вам повезло, чтобы получить слот, вы находитесь на прогулке для плодотворного лета кодирования с помощью полезных наставников. Кроме того, вы также получите стипендию, которая составляет от 3000 до 6000 долларов в зависимости от того, в какой стране вы живете. Если вы заинтересованы в том, чтобы узнать больше о том, как участвовать, я предлагаю вам проверить GSOC Guide знать больше.

Выбор вашей организации

Мы говорили о необходимости подключения к партнерским организациям для того, чтобы мы участвуем. Но хорошо, каковы некоторые параметры, которые вы можете рассмотреть, прежде чем выбрать организацию? Это наиболее часто задаваемый вопрос после вопросов, касающихся самого оперативной организации.

Мой анализ направлен на то, чтобы принести вам лучшие способы выбрать вашу организацию. Хотя Веб-сайт GSOC Предоставляет вам множество информации относительно организации, позволяющей выфильтровать их в соответствии с категориями концентрации, одностороннего языка программирования или вариантами темы. Я нашел, что все еще не хватает некоторых важных параметров, касающихся того, как можно было пойти по выбору организации.

Сначала я начну с моих наблюдений, используя данные, которые я выскабливался. Тогда я покажу вам, как вы можете пойти в соскоб и анализ данных организации самостоятельно.

Наиболее распространенные языки и типы организаций

Зная, что это может быть крайне важно для тех новых для программирования. Глядя на эти чрезвычайно продвинутые проекты, вы хотите сосредоточиться, сохраняя вашу выбор разнообразным.

Мы видим, что самые распространенные языки в GSOC являются:

  • Питон
  • C++
  • C
  • JavaScript
  • Джава

C ++ и C, являющийся в списке, не удивительно, учитывая тот факт, что большинство проектов на GSOC включают в себя какое-то развитие. Точно так же наиболее распространенные организационные типы являются:

  • Языки программирования и инструменты развития
  • Наука и медицина
  • Виртуальная реальность и СМИ
  • Конечные пользовательские приложения

Среди прочего … это дает нам четкое представление о том, что организации GSOC могут искать в целом.

Количество студентов в организации

Понимание этого также имеет решающее значение, учитывая, что я продолжаю получать советы, что в первый раз, когда Gsocers гораздо больше приветствуются в более крупные организации, а не меньшие. Имеет смысл, потому что эти организации часто участвуют в GSOC с момента своего создания и знают, как все ходят.

Мы видим, что только 7% всех организаций 200+ принимают более 15 студентов.

Большие организации

Хотя мое намерение не отговаривать вас от посещения меньших организаций, на самом деле, если у вас действительно есть интерес к нишу и знаете, что вы хотите сделать, то вы могли бы также пойти на меньшую организацию. Но было бы неполным, если я не упомяну о «крупных» организациях. Вот организации с 15+ участниками без особого порядка прямой формы моего терминала:

CERN-HSF
Oppia Foundation
KDE Community
The Honeynet Project
INCF
The R Project for Statistical Computing
Rocket.Chat
GNOME Foundation
Free and Open Source Silicon Foundation
OSGeo - Open Source Geospatial Foundation
Zulip
Red Hen Lab
Digital Impact Alliance (DIAL) at UN Foundation
Processing Foundation
OWASP Foundation
International Catrobat Association
SCoRe Lab
OpenCV
The Apache Software Foundation
NumFOCUS
The LLVM Compiler Infrastructure
TensorFlow
The Linux Foundation
Liquid Galaxy project
CNCF
Python Software Foundation
National Resource for Network Biology (NRNB)
OpenMRS
Machine Learning for Science (ML4SCI) Umbrella Organization
The Julia Language
AOSSIE

Не удивительно, что список содержит много известных влиятельных проектов.

Технология

Я использовал Python 3 с библиотеками Selenium и BeautifulSoup4. Мой Проект Не использует функцию Click вместо этого захватывает идентификатор организации, образующую внутреннюю HTML.

Затем мы замечаем, что URL для настраиваемых страниц Организации могут быть получены из ID организации. Сначала сохраняйте этот список идентификаторов организации в переменной, а затем, используя его для перевозок по поводу остальных URL-адресов, сохраняет вычислительное время США и делает наш код эффективным.

Inkingering

Это код, и вы можете поставить с ним понравиться. Я сохранил несколько файлов .dat, чтобы вы могли играть.

Игра с существующими данными

Если вы хотите отфильтровать свою организацию в соответствии с интересами (которая была четко не имеет возможности для этой статьи). Вы можете сделать это с файлом data_read в разделе кода. Я положил пару примеров, с которыми вы могли бы играть. Шаги, которые вам нужно для последующего

  1. Клон весь репозиторий
  2. Измените время Delta I.e. дни = Количество дневной разницы с папкой .dat файлов в нашем случае, в нашем случае код \ orgs-2021-10-05
direct = f"./code/orgs-{date.today() - timedelta(days = 7)}/"  

Структура данных

Каждый файл .dat хранит словарь. Словары ключей:

'name', 'tech', 'org_type', 'org_topics', 'num_students', 'students'

Объекты, хранящиеся в этих клавишах, имеют типы:

, , , , , 

Кроме того, последний список содержит список списков со студентами, проектом, URL в том же порядке. Таким образом, вы можете напрямую просмотреть проекты, которые звучат интересно напрямую от вашего IDE.

Данные в течение многих лет, кроме 2021

Как представлен веб-сайт GSOC, скорее всего, останется одинаковым и остается одинаковой за пару лет. Это очень хорошие новости, потому что вы, вероятно, можете сделать аналогичный анализ на прочие годы. Вам просто нужно внести незначительные изменения в этом файле I.E. /code/main.py Изменение параметра URL для:

https://summerofcode.withgoogle.com/archive/2020/organizations/

или к одному из следующих действий:

https://summerofcode.withgoogle.com/archive/2019/organizations/
https://summerofcode.withgoogle.com/archive/2018/organizations/
https://summerofcode.withgoogle.com/archive/2017/organizations/
https://summerofcode.withgoogle.com/archive/2016/organizations/

Довольно круто, а!

Теперь вы можете сделать многоанализировать а также Да, это переполнение для тех, кто выбрал организацию.

Заключительные замечания

Надеюсь, что эта статья помогла вам сделать лучшее решение относительно выбора организации GSOC. Удачи с вашими предложениями!

Если вы используете мой проект, я был бы признателен, если вы его ссылаетесь.

Хотите подключиться? LinkedIn Twitter Гадость

Оригинал: “https://dev.to/sarkarghya/google-summer-of-code-analytics-ne5”