Рубрики
Без рубрики

Основы Python для науки о данных

Автор оригинала: Harshit Tyagi.

Новички в области науки о данных, которые не знакомы с программированием, часто испытывают трудное время, если они должны начать.

С сотнями вопросов о том, как начать с Python для DS На различных форумах этот пост (и видео серия) – моя попытка урегулировать все эти вопросы.

Я Евангелист Python, который начал как полный разработчик Python Stack Python, прежде чем перейти к данным в области техники, а затем науки о данных. Мой предыдущий опыт работы с Python и достойный понять математику помог сделать коммутатор на науку для меня удобнее.

Итак, вот основные основы помогают вам с программированием в Python.

Прежде чем мы возьмем глубокий погружение в основы, убедитесь, что у вас есть Настройте свою среду Python И знать, как использовать Jupyter Notebook (необязательно).

Базовая учебная программа Python может быть разбита в 4 основных тем, которые включают в себя:

  1. Типы данных (INT, FLOAT, Строки)
  2. Составные структуры данных (списки, кортежи и словари)
  3. Условные, петли и функции
  4. Объектно-ориентированное программирование и использование внешних библиотек

Давайте перейдем на каждого и посмотрите, какие основы вы должны учиться.

1. Типы данных и структуры

Самый первый шаг – понять, как Python интерпретирует данные.

Начиная с широко используемых типов данных, вы должны быть знакомы с целыми числами (INT), плавающими (поплавками), строками (ул.) И логическими (BOOL). Вот что вы должны практиковать.

Тип, типости и функции ввода/вывода:

  • Узнайте тип данных, используя Тип () метод.
type('Harshit')

# output: str
  • Хранение значений в переменные и функции ввода-выходных ( A.67 )
  • TypeSeact – преобразование определенного типа переменной/данных в другой тип, если это возможно. Например, преобразование строки целых чисел в целое число:
astring = "55"
print(type(astring))

# output: 
astring = int(astring)
print(type(astring))

# output: 

Но если вы попытаетесь преобразовать буквенно-цифровую или алфавитную строку в целое число, он бросит ошибку:

Как только вы знакомы с основными типами данных и их использованием, вы должны узнать о Арифметические операторы и оценки экспрессии (DMAS) И как вы можете хранить результат в переменной для дальнейшего использования.

answer = 43 + 56 / 14 - 9 * 2
print(answer)

# output: 29.0

Строки:

Зная, как иметь дело с текстовыми данными, и их операторы пригодятся пригодны при работе со строковым типом данных. Практикуйте эти концепции:

  • Согласительные струны с использованием +.
  • Разделение и присоединение к стриме с помощью Сплит () и Присоединяйтесь () метод
  • Изменение случая строки с использованием ниже () и Верхний () методы
  • Работа с подстроками строки

Вот ноутбук что охватывает все обсуждаемые очки.

2. Составные структуры данных (списки, кортежи и словари)

Списки и кортежи (комплексные типы данных):

Одним из наиболее часто используемых и важных структур данных в Python являются спискими. Список представляет собой набор элементов, а коллекция может быть одинаковых или разнообразных типов данных.

Понимание списков в конечном итоге проложит путь для вычисления алгебраических уравнений и статистических моделей в вашем массиве данных.

Вот концепции, с которыми вы должны быть знакомы:

  • Как несколько типов данных могут быть сохранены в списке Python.
  • Индексирование и нарезка Для доступа к определенному элементу или подписи списка.
  • Методы помощника для Сортировка, реверсировка, удаление элементов, копирование и добавление Отказ
  • Вложенные списки – списки, содержащие списки. Например, [1,2,3, [10,11]] Отказ
  • Дополнение в списке.
alist + alist

# output: ['harshit', 2, 5.5, 10, [1, 2, 3], 'harshit', 2, 5.5, 10, [1, 2, 3]]

Умножая список со скалярным:

alist * 2

# output: ['harshit', 2, 5.5, 10, [1, 2, 3], 'harshit', 2, 5.5, 10, [1, 2, 3]]

Кортежи являются неизменными упорядоченными последовательностью предметов. Они похожи на списки, но Ключевое отличие в том, что кортежи неизменны, тогда как списки измеряются.

Концепции, чтобы сосредоточиться на:

  • Индексирование и нарезка (аналогично спискам).
  • Вложенные кортежи.
  • Добавление кортежей и помощников методов, таких как count () и Индекс () Отказ

Словари

Это еще один тип коллекции в Python. В то время как списки целочисленные индексированные, словари больше похожи на адреса. Словари есть пары ключа-значений, а ключи аналогичны индексам в списках.

Чтобы получить доступ к элементу, вам необходимо пройти ключ в квадратных скобках.

Концепции, чтобы сосредоточиться на:

  • Итализация через словарь (также покрыто петлями).
  • Использование помощников методов, таких как Получить () , POP () , Предметы () , Клавиши () , Обновление () , и так далее.

Ноутбук для вышеупомянутых тем можно найти здесь Отказ

3. Условные, петли и функции

Условия и ветвление

Python использует эти логические переменные для оценки условий. Всякий раз, когда существует сравнение или оценка, логические значения являются результирующим решением.

x = True

ptint(type(x))

# output: 
print(1 == 2)

# output: False

Сравнение на изображении необходимо внимательно наблюдать, как люди сбивают оператора присваивания ( = ) с оператором сравнения ( == ).

Логические операторы (или, а не)

Они используются для оценки комплексных утверждений вместе.

  • или – Один из многих сравнений должен быть правдой для всего условия, чтобы быть правдой.
  • и – Все сравнения должны быть правдой для всего условия, чтобы быть правдой.
  • не – проверки на противоположность указанному сравнению.
score = 76
percentile = 83

if score > 75 or percentile > 90:
    print("Admission successful!")
else:
    print("Try again next year")
    
# output: Try again next year

Концепции, чтобы узнать:

  • Если , еще и Элиф утверждения для построения вашего состояния.
  • Создание сложных сравнений в одном состоянии.
  • Держите вмятину в разуме при написании вложенных Если / еще заявления.
  • Использование логика, в , это и не операторы.

Петли

Часто вам нужно сделать повторяющуюся задачу, а петли будут вашим лучшим другом, чтобы устранить накладные расходы избыточнения кода. Вам часто нужно повторять каждый элемент списка или словаря, а петли пригодятся для этого. в то время как и для два типа петель.

Сосредоточиться на:

  • Диапазон () Функция и итерация через последовательность, используя для петли.
  • в то время как петли
age = [12,43,45,10]
i = 0
while i < len(age):
    if age[i] >= 18:
        print("Adult")
    else:
        print("Juvenile")
    i += 1

# output: 
# Juvenile
# Adult
# Adult
# Juvenile
  • Итализация через списки и присоединение (или любая другая задача со элементами списка) элементы в определенном порядке
cubes = []
for i in range(1,10):
    cubes.append(i ** 3)
print(cubes)

#output: [1, 8, 27, 64, 125, 216, 343, 512, 729]
  • Использование Перерыв , пройти и Продолжить ключевые слова.

Список понимания

Сложный и сжатый способ создания списка, использующего и, по желанию, а затем для пункт.

Например, вы можете создать список из 9 кубиков, как показано в примере выше, используя понимание списка.

# list comprehension
cubes = [n** 3 for n in range(1,10)]
print(cubes)

# output: [1, 8, 27, 64, 125, 216, 343, 512, 729]

Функции

Работая над большим проектом, поддержание кода становится настоящей рудой. Если ваш код много раз выполняет подобные задачи, удобный способ управления вашим кодом с использованием функций.

Функция – это блок код, который выполняет некоторые операции на входных данных и дает вам желаемый выход.

Использование функций делает код более читаемым, уменьшает резервирование, делает код многоразовым и экономит время.

Python использует отступ для создания блоков кода. Это пример функции:

def add_two_numbers(a, b):
    sum = a + b
    return sum

Мы определяем функцию, используя def Ключевое слово, за которым следуют название функции и аргументов (входных) в скобках, а затем толстой кишки.

Тело функции – это код кода с отступом, а выход возвращается с помощью Возвращение ключевое слово.

Вы называете функцию, указав имя и передаю аргументы в скобках в соответствии с определением.

Больше примеров и деталей здесь Отказ

4. Объектно-ориентированное программирование и использование внешних библиотек

Мы использовали методы помощника для списков, словарей и других типов данных, но откуда они идут?

Когда мы говорим список или Dict, мы фактически взаимодействуем со объектом класса списка или объектом класса Dict. Печать тип A Словарь Объект покажет вам, что это объект класса Dict.

Это все заранее определенные классы на языке Python, и они делают наши задачи очень легко и удобны.

Объекты являются экземпляром класса и определяются как инкапсуляция переменных (данных) и функционирует в одном объекте. У них есть доступ к переменным (атрибутам) и методам (функциям) от классов.

Теперь вопрос в том, мы можем создать наши собственные пользовательские классы и объекты? Ответ да.

Вот как вы определяете класс и объект этого:

class Rectangle:
    
    def __init__(self, height, width):
        self.height = height
        self.width = width
    
    def area(self):
        area = self.height * self.width
        return area

rect1 = Rectangle(12, 10)

print(type(rect1))

# output: 

Затем вы можете получить доступ к атрибутам и методам, используя оператора DOT (.).

Использование внешних библиотек/модулей

Одна из главных причин использования Python для науки о данных – это удивительное сообщество, которое развивает высококачественные пакеты для разных доменов и проблем. Использование внешних библиотек и модулей является неотъемлемой частью работы над проектами в Python.

Эти библиотеки и модули имеют определенные классы, атрибуты и методы, которые мы можем использовать для достижения наших задач. Например, Математика Библиотека содержит множество математических функций, которые мы можем использовать для выполнения наших расчетов. Библиотеки – .py файлы.

Вы должны научиться:

  • Импорт библиотек в вашем рабочем пространстве
  • Используя Помогите функция, чтобы узнать о библиотеке или функции
  • Импорт необходимой функции напрямую.
  • Как прочитать документацию известных пакетов, таких как Pandas, Numpy и Sklearn и использовать их в ваших проектах

Заворачивать

Это должно охватывать основы Python и начать работу с науки о данных.

Существует несколько других функций, функциональных возможностей и типов данных, с которыми вы будете знакомы со временем, когда вы работаете над другими и другими проектами.

Вы можете пройти эти концепции в Github Repo, где вы найдете упражнение ноутбуки, а также :

Вот 3-частный видео сериал на основе этого поста для того, чтобы вы следили с:

Наука данных с Гершитом

Вы можете подключиться со мной на LinkedIn , Twitter , Instagram и проверить мой YouTube Channel Для более глубоких учебных пособий и интервью.