Рубрики
Без рубрики

Переходу в науку на науке Python!

Привет, ребята! Как вы знаете моими предыдущими сообщениями (в португальском блоге), я делал мини-курс … Теги от науки о данных, Python, курс, удемии.

Привет, ребята!

Как вы знаете мои предыдущие посты (в португальском блоге), я делал Мини-курс в Удемии о визуализации данных в Python. Этот курс был рекомендован, чтобы помочь мне изучить Python, поэтому я могу присоединиться к лаборатории AI в моем университете как можно скорее.

Во-первых, я был официально представлен matplotlib.pyplot С командой импорта: Импорт matplotlib.pyplot как mpl или как PLT.

Далее я встретил Платформа Google Colab , который является ноутбуком Python, и много помогло мне, так как я не могу загрузить Python IDE на компьютере, который в настоящее время использую.

Я сделал линейный график, со следующим кодом (попробуйте, это был милый опыт):

import matplotlib.pyplot as plt 

x = [1, 2] #giving x and y some values so I can plot something
y = [2, 3]

plt.plot(x, y) #plotting the graph
plt.show() #show the graph when I hit "Run"

После создания моего первого графика я сделал легенду, поэтому я мог определить вещи внутри того, что я создал.

import matplotlib.pyplot as plt 

x = [1, 2, 5] #I added one more value in each variable 
y = [2, 3, 7]

plt.title("My first graph") #this is a title for my graph
plt.xlabel("Axis X") #creating labels for each axis
plt.ylabel("Axis Y")

plt.plot(x, y) 
plt.show()

Теперь, когда мы узнали, как делать линейные графики, мы будем делать гистограммы?

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5] #now, x represents each one of the bars
y = [2, 3, 7, 1, 0] #and y, their sizes

titulo = "Bar graph"
eixox = "Axis X"               #creating variables for the legends
eixoy = "Axis Y"

plt.title(titulo)
plt.xlabel(eixox)
plt.ylabel(eixoy)

plt.bar(x, y) #plotting the bar graph
plt.show()

Теперь мы с знаниями мы получили об этих двух типах графиков, могут сделать по крайней мере две вещи: сравните графики и/или объединить их!

import matplotlib.pyplot as plt

x1 = [1, 3, 5, 7, 9] #odd numbers for the bars!
y1 = [2, 3, 7, 1, 0] #random numbers for their sizes: unaltered

x2 = [2, 4, 6, 8, 10] #even numbers for other bars
y2 = [5, 1, 3, 7, 4] #more random numbers, but they weren't here before

titulo = "Bar graphs"
eixox = "Axis X" #"eixo" is Portuguese for "axis"
eixoy = "Axis Y"
                             #this part you already know
plt.title(titulo)
plt.xlabel(eixox)
plt.ylabel(eixoy)

plt.bar(x1, y1)
plt.bar(x2, y2) #one and then another, but are shown together!

plt.show()

Мы также можем объединить типы графиков! Вы можете ввести PLT.PLOT (X, Y) В баре-кодах графики, например. Но у нас есть еще один тип графика: разброс, или дисперсионный график. Назовите это по plt.scatter (x, y) Отказ

Быстрая записка для этой английской версии: в португальском языке я показал несколько изображений графиков, которые я сделал, вы можете увидеть, как это, если вы не можете получить доступ к Google Colab сейчас. Поэтому я написал, думая о изображениях, которые можно увидеть, и теперь я адаптируюсь к Dev.

Возможно, вы видели, что в сравнительных графах цвета меняются цвета. На самом деле, это цвета по умолчанию, но вы можете изменить их в любом хотите (используя в основном цветные коды PLT, которые вы можете найти здесь ), с цветным тегом, как в plt.scatter (x, y,) Где я изменяю цвет точек в красный. Вы также можете использовать тег на этикетку, чтобы сделать подписи для графика, как в plt.plot (x, y,) , но используя plt.legend () После этого нагрузка может отображаться на изображении.

Вы можете сохранить свои фигуры с PLT.SAVEFIG («FIGURENAME.PNG») Быть тем, что «PNG» можно изменить на «PDF», если мы хотим веционное изображение, поэтому он имеет (действительно) хорошее качество печати. У нас есть тег DPI, который можно использовать для определения качества изображения. Хорошее значение DPI, по-видимому, 300 и такому так – это на 72. Вы можете использовать PLT.SAVEFIG («FIGURENAME.PNG»,) Отказ

Курс имеет небольшое дело с информацией с 1980 по 2016 год о росте бразильской популяции, а затем мы представлены в BoxPlot. Boxplots – это складки коробок, которые представляют собой изменение данных на квартилю. Это моя текущая тема по вероятности и статистике, поэтому я был очень заинтересован.

В основном, если вы введете код, как этот:

import matplotlib.pyplot as plt
import random #a Python library for generating random numbers!

vetor = [] #a small vector to put values on
for i in range(100): #for a i value from (I guess) 0 to 99...
    numAleatorio = random.randint(0, 50) #random number ("número aleatório") is somewhere between 0 and 50
    vetor.append(numAleatorio) #vector receives this number so we can create the boxplot

plt.boxplot(vetor) #and then he plots the boxplot with the vector value
plt.show()

…и Затем нажмите Run, он генерирует другое изображение, но он не похож на другие графики, поэтому позвольте мне объяснить, что я знаю об этом.

Если было что-то сверху (эта строка), это будет представлять значения, которые очень отличаются от того, что было задано. Вышеуказанная линия представляет собой максимум, что это число может быть (50). Говоря о 50, основной прямоугольник на рисунке представляет 50% полученных данных. Нижняя строка – минимум, ноль.

Но где в этом статистика? См.: Кредили – это дроби данного величины, которое было разделено на 4. Таким образом, прямоугольник содержит два квартиля, с%. Первая строка составляет 0%. Второе (когда прямоугольник «начинается») составляет 25% (1-й квартиль). Средняя (красная линия) представляет собой 50% (2-й квартиль). Вышеуказанная линия представляет собой 75% (3-й квартиль). Максимум, 100%, это четвертый квартиль.

Чтобы завершить курс, произошло исследование относительно биоинформатики, но по какой-то причине Я до сих пор не выяснил полностью Мой код привел к многим ошибкам. Я поставил код на StackoverFlow, и я надеюсь, что кто-то когда-нибудь поможет мне найти ошибку. Также, если бы вы могли даже посмотреть на него, я был бы очень благодарен. Редактировать: я подумал это как-то. Ссылка теперь деактивирована.

Я рекомендую этот курс для людей, которые, как и я, начинают изучать Python и Data науки. Если вы попробовали, пожалуйста, оставьте свой отзыв в комментариях:)

Оригинал: “https://dev.to/linasdias/going-into-a-data-science-python-course-1hg3”