Автор оригинала: Harshit Tyagi.
Новички в области науки о данных, которые не знакомы с программированием, часто испытывают трудное время, если они должны начать.
С сотнями вопросов о том, как начать с Python для DS На различных форумах этот пост (и видео серия) – моя попытка урегулировать все эти вопросы.
Я Евангелист Python, который начал как полный разработчик Python Stack Python, прежде чем перейти к данным в области техники, а затем науки о данных. Мой предыдущий опыт работы с Python и достойный понять математику помог сделать коммутатор на науку для меня удобнее.
Итак, вот основные основы помогают вам с программированием в Python.
Прежде чем мы возьмем глубокий погружение в основы, убедитесь, что у вас есть Настройте свою среду Python И знать, как использовать Jupyter Notebook (необязательно).
Базовая учебная программа Python может быть разбита в 4 основных тем, которые включают в себя:
- Типы данных (INT, FLOAT, Строки)
- Составные структуры данных (списки, кортежи и словари)
- Условные, петли и функции
- Объектно-ориентированное программирование и использование внешних библиотек
Давайте перейдем на каждого и посмотрите, какие основы вы должны учиться.
1. Типы данных и структуры
Самый первый шаг – понять, как Python интерпретирует данные.
Начиная с широко используемых типов данных, вы должны быть знакомы с целыми числами (INT), плавающими (поплавками), строками (ул.) И логическими (BOOL). Вот что вы должны практиковать.
Тип, типости и функции ввода/вывода:
- Узнайте тип данных, используя
Тип ()
метод.
type('Harshit') # output: str
- Хранение значений в переменные и функции ввода-выходных (
A.67
) - TypeSeact – преобразование определенного типа переменной/данных в другой тип, если это возможно. Например, преобразование строки целых чисел в целое число:
astring = "55" print(type(astring)) # output:
astring = int(astring) print(type(astring)) # output:
Но если вы попытаетесь преобразовать буквенно-цифровую или алфавитную строку в целое число, он бросит ошибку:
Как только вы знакомы с основными типами данных и их использованием, вы должны узнать о Арифметические операторы и оценки экспрессии (DMAS) И как вы можете хранить результат в переменной для дальнейшего использования.
answer = 43 + 56 / 14 - 9 * 2 print(answer) # output: 29.0
Строки:
Зная, как иметь дело с текстовыми данными, и их операторы пригодятся пригодны при работе со строковым типом данных. Практикуйте эти концепции:
- Согласительные струны с использованием
+.
- Разделение и присоединение к стриме с помощью
Сплит ()
иПрисоединяйтесь ()
метод - Изменение случая строки с использованием
ниже ()
иВерхний ()
методы - Работа с подстроками строки
Вот ноутбук что охватывает все обсуждаемые очки.
2. Составные структуры данных (списки, кортежи и словари)
Списки и кортежи (комплексные типы данных):
Одним из наиболее часто используемых и важных структур данных в Python являются спискими. Список представляет собой набор элементов, а коллекция может быть одинаковых или разнообразных типов данных.
Понимание списков в конечном итоге проложит путь для вычисления алгебраических уравнений и статистических моделей в вашем массиве данных.
Вот концепции, с которыми вы должны быть знакомы:
- Как несколько типов данных могут быть сохранены в списке Python.
- Индексирование и нарезка Для доступа к определенному элементу или подписи списка.
- Методы помощника для Сортировка, реверсировка, удаление элементов, копирование и добавление Отказ
- Вложенные списки – списки, содержащие списки. Например,
[1,2,3, [10,11]]
Отказ - Дополнение в списке.
alist + alist # output: ['harshit', 2, 5.5, 10, [1, 2, 3], 'harshit', 2, 5.5, 10, [1, 2, 3]]
Умножая список со скалярным:
alist * 2 # output: ['harshit', 2, 5.5, 10, [1, 2, 3], 'harshit', 2, 5.5, 10, [1, 2, 3]]
Кортежи являются неизменными упорядоченными последовательностью предметов. Они похожи на списки, но Ключевое отличие в том, что кортежи неизменны, тогда как списки измеряются.
Концепции, чтобы сосредоточиться на:
- Индексирование и нарезка (аналогично спискам).
- Вложенные кортежи.
- Добавление кортежей и помощников методов, таких как
count ()
иИндекс ()
Отказ
Словари
Это еще один тип коллекции в Python. В то время как списки целочисленные индексированные, словари больше похожи на адреса. Словари есть пары ключа-значений, а ключи аналогичны индексам в списках.
Чтобы получить доступ к элементу, вам необходимо пройти ключ в квадратных скобках.
Концепции, чтобы сосредоточиться на:
- Итализация через словарь (также покрыто петлями).
- Использование помощников методов, таких как
Получить ()
,POP ()
,Предметы ()
,Клавиши ()
,Обновление ()
, и так далее.
Ноутбук для вышеупомянутых тем можно найти здесь Отказ
3. Условные, петли и функции
Условия и ветвление
Python использует эти логические переменные для оценки условий. Всякий раз, когда существует сравнение или оценка, логические значения являются результирующим решением.
x = True ptint(type(x)) # output:
print(1 == 2) # output: False
Сравнение на изображении необходимо внимательно наблюдать, как люди сбивают оператора присваивания ( =
) с оператором сравнения ( ==
).
Логические операторы (или, а не)
Они используются для оценки комплексных утверждений вместе.
или
– Один из многих сравнений должен быть правдой для всего условия, чтобы быть правдой.и
– Все сравнения должны быть правдой для всего условия, чтобы быть правдой.не
– проверки на противоположность указанному сравнению.
score = 76 percentile = 83 if score > 75 or percentile > 90: print("Admission successful!") else: print("Try again next year") # output: Try again next year
Концепции, чтобы узнать:
Если
,еще
иЭлиф
утверждения для построения вашего состояния.- Создание сложных сравнений в одном состоянии.
- Держите вмятину в разуме при написании вложенных
Если
/еще
заявления. - Использование логика,
в
,это
ине
операторы.
Петли
Часто вам нужно сделать повторяющуюся задачу, а петли будут вашим лучшим другом, чтобы устранить накладные расходы избыточнения кода. Вам часто нужно повторять каждый элемент списка или словаря, а петли пригодятся для этого. в то время как
и для
два типа петель.
Сосредоточиться на:
-
Диапазон ()
Функция и итерация через последовательность, используядля
петли. в то время как
петли
age = [12,43,45,10] i = 0 while i < len(age): if age[i] >= 18: print("Adult") else: print("Juvenile") i += 1 # output: # Juvenile # Adult # Adult # Juvenile
- Итализация через списки и присоединение (или любая другая задача со элементами списка) элементы в определенном порядке
cubes = [] for i in range(1,10): cubes.append(i ** 3) print(cubes) #output: [1, 8, 27, 64, 125, 216, 343, 512, 729]
- Использование
Перерыв
,пройти
иПродолжить
ключевые слова.
Список понимания
Сложный и сжатый способ создания списка, использующего и, по желанию, а затем для
пункт.
Например, вы можете создать список из 9 кубиков, как показано в примере выше, используя понимание списка.
# list comprehension cubes = [n** 3 for n in range(1,10)] print(cubes) # output: [1, 8, 27, 64, 125, 216, 343, 512, 729]
Функции
Работая над большим проектом, поддержание кода становится настоящей рудой. Если ваш код много раз выполняет подобные задачи, удобный способ управления вашим кодом с использованием функций.
Функция – это блок код, который выполняет некоторые операции на входных данных и дает вам желаемый выход.
Использование функций делает код более читаемым, уменьшает резервирование, делает код многоразовым и экономит время.
Python использует отступ для создания блоков кода. Это пример функции:
def add_two_numbers(a, b): sum = a + b return sum
Мы определяем функцию, используя def
Ключевое слово, за которым следуют название функции и аргументов (входных) в скобках, а затем толстой кишки.
Тело функции – это код кода с отступом, а выход возвращается с помощью Возвращение
ключевое слово.
Вы называете функцию, указав имя и передаю аргументы в скобках в соответствии с определением.
Больше примеров и деталей здесь Отказ
4. Объектно-ориентированное программирование и использование внешних библиотек
Мы использовали методы помощника для списков, словарей и других типов данных, но откуда они идут?
Когда мы говорим список или Dict, мы фактически взаимодействуем со объектом класса списка или объектом класса Dict. Печать тип A Словарь Объект покажет вам, что это объект класса Dict.
Это все заранее определенные классы на языке Python, и они делают наши задачи очень легко и удобны.
Объекты являются экземпляром класса и определяются как инкапсуляция переменных (данных) и функционирует в одном объекте. У них есть доступ к переменным (атрибутам) и методам (функциям) от классов.
Теперь вопрос в том, мы можем создать наши собственные пользовательские классы и объекты? Ответ да.
Вот как вы определяете класс и объект этого:
class Rectangle: def __init__(self, height, width): self.height = height self.width = width def area(self): area = self.height * self.width return area rect1 = Rectangle(12, 10) print(type(rect1)) # output:
Затем вы можете получить доступ к атрибутам и методам, используя оператора DOT (.).
Использование внешних библиотек/модулей
Одна из главных причин использования Python для науки о данных – это удивительное сообщество, которое развивает высококачественные пакеты для разных доменов и проблем. Использование внешних библиотек и модулей является неотъемлемой частью работы над проектами в Python.
Эти библиотеки и модули имеют определенные классы, атрибуты и методы, которые мы можем использовать для достижения наших задач. Например, Математика
Библиотека содержит множество математических функций, которые мы можем использовать для выполнения наших расчетов. Библиотеки – .py
файлы.
Вы должны научиться:
- Импорт библиотек в вашем рабочем пространстве
- Используя
Помогите
функция, чтобы узнать о библиотеке или функции
- Импорт необходимой функции напрямую.
- Как прочитать документацию известных пакетов, таких как Pandas, Numpy и Sklearn и использовать их в ваших проектах
Заворачивать
Это должно охватывать основы Python и начать работу с науки о данных.
Существует несколько других функций, функциональных возможностей и типов данных, с которыми вы будете знакомы со временем, когда вы работаете над другими и другими проектами.
Вы можете пройти эти концепции в Github Repo, где вы найдете упражнение ноутбуки, а также :
Вот 3-частный видео сериал на основе этого поста для того, чтобы вы следили с:
Наука данных с Гершитом
Вы можете подключиться со мной на LinkedIn , Twitter , Instagram и проверить мой YouTube Channel Для более глубоких учебных пособий и интервью.