Автор: Michael

Понимание графиков коробок

Автор записи Автор: Michael
Дата записи 05.05.2021

Изображение выше представляет собой прямоугольник. Прямоугольная диаграмма-это стандартизированный способ отображения распределения данных на основе сводки из пяти чисел (“минимум”, первый квартиль (Q1), медиана, третий квартиль (Q3) и “максимум”). Он может рассказать вам о ваших выбросах и о том, каковы их ценности. Он также может сообщить вам, симметричны ли ваши данные, насколько плотно ваши данные сгруппированы, и если и как ваши данные искажены. Этот учебник будет включать в себя: Что такое boxplot? Понимание анатомии бокс-графика путем сравнения бокс-графика с функцией плотности вероятности для нормального распределения. Как вы создаете и интерпретируете бокс-графики с помощью Python?

Метки boxplot, data, distribution

Без рубрики

PCA с использованием Python (scikit-learn, pandas)

Автор записи Автор: Michael
Дата записи 03.05.2021

Чтобы понять ценность использования PCA для визуализации данных, в первой части этого учебного поста рассматривается базовая визуализация набора данных IRIS после применения PCA. Во второй части используется PCA для ускорения алгоритма машинного обучения (логистическая регрессия) в наборе данных MNIST.

Метки machine, pca, python, scikit, visualization

Без рубрики

Интервью на Python: Простые числа

Автор записи Автор: Michael
Дата записи 01.05.2021

Напишите программу, чтобы составить список всех простых чисел меньше 20. Перед началом важно отметить, что такое простое число. Простое число должно быть положительным целым числом, делящимся ровно на 2 целых числа (1 и само по себе) 1 не является простым числом, хотя существует множество различных способов решения этой проблемы, вот несколько различных подходов.

Метки approach, interview, number, program, python

Без рубрики

Python Hello World и манипуляции со строками

Автор записи Автор: Michael
Дата записи 30.04.2021

Это базовый учебник по строкам python и манипуляциям со строками. Строки – это особый тип класса python. В качестве объектов в классе вы можете вызывать методы для строковых объектов, используя нотацию .method Name (). Класс string доступен по умолчанию в python, поэтому вам не нужен оператор импорта, чтобы использовать интерфейс объекта для строк.

Метки python, string, world

Без рубрики

Как создать портфолио по науке о данных

Автор записи Автор: Michael
Дата записи 29.04.2021

Как вы получаете работу в области науки о данных? Знание достаточной статистики, машинного обучения, программирования и т. Д., Чтобы получить работу, трудно. В последнее время я обнаружил, что у многих людей могут быть необходимые навыки, чтобы получить работу, но нет портфолио. В то время как резюме имеет значение, наличие портфолио публичных доказательств ваших навыков в области науки о данных может творить чудеса для ваших потенциальных кандидатов на работу. Даже если у вас есть направление, важно показать потенциальным работодателям, что вы можете сделать, а не просто сказать им, что вы можете что-то сделать.

Метки data, job, science

Без рубрики

Веб-скребок в Python с использованием Scrapy

Автор записи Автор: Michael
Дата записи 29.04.2021

Когда я впервые начал работать в промышленности, одна из вещей, которую я быстро понял, заключается в том, что иногда вам приходится собирать, организовывать и очищать свои собственные данные. Для этого урока мы соберем данные с сайта краудфандинга под названием FundRazr. Как и многие веб-сайты, сайт имеет свою собственную структуру, форму и множество доступных полезных данных, но получить данные с сайта трудно, так как у него нет структурированного API. В результате мы очистим веб-сайт, чтобы получить эти неструктурированные данные веб-сайта и поместить их в упорядоченную форму для создания нашего собственного набора данных.

Метки campaign, scraping, scrapy, site, web, website

Без рубрики

Словарь Python и методы словаря

Автор записи Автор: Michael
Дата записи 26.04.2021

Словари-это неупорядоченные структуры данных, которые сопоставляют уникальные ключи со значениями. Словарь websters Dict использовал строки в качестве ключей в словаре, но ключи словаря могут быть любым неизменяемым типом данных (числа, строки, кортежи и т. Д.). Значения словаря могут быть практически любыми (int, списки, функции, строки и т. Д.).

Метки data, dictionary, method, python, webstersdict

Без рубрики

Делать свой первый классификатор машинного обучения в Scikit-Suart (Python)

Автор записи Автор: Michael
Дата записи 19.04.2021

Одна из самых удивительных вещей о библиотеке Scikit-Scikit-Scikit-Scikit – это то, что имеет 4-ти шаг моделирования моделирования, который позволяет легкокомировать классификатор машинного обучения. Хотя этот учебник использует классификатор, называемый логистической регрессией, процесс кодирования в этом руководстве применяется к другим классификаторам в Sklearn (дерево решений, к-ближайшие соседи и т. Д.). В этом руководстве мы используем логистическую регрессию для прогнозирования цифровых меток на основе изображений. Изображение выше показывает кучу тренировочных цифр (наблюдения) от набора данных Mnist, членство категории которого известна (этикетки 0-9). После тренировки модели с логистикой регрессией ее можно использовать для прогнозирования этикетки изображения (этикетки 0-9), учитывая изображение.

Метки classifier, dataset, machine, model, regression, tutorial