Рубрики
Без рубрики

Введение в науку о данных

Большинство людей находятся под неправильным представлением о том, что наука о данных – это алгории машинного обучения … Помечено наукой о данных, машинном обучении, питоне, новичках.

Большинство людей находятся под неправильным представлением о том, что наука о данных – это алгоритмы машинного обучения. Это неправда. Наука данных – это комбинация математики, информатики и машинного обучения.

Наука данных – это исследование данных, где вы поддерживаете Datsets и получаете информацию из набора данных. Data Science использует разные части, упомянутые в шаблоне ниже, чтобы решить проблемы.

Восприятие – Попробуйте определить шаблоны с помощью планирования данных – включает в себя два шага:

  1. Поиск всех возможных решений
  2. Поиск наилучшего возможного решения среди всех решений

Что вам нужно знать, чтобы быть успешным ученым данных?

  1. Знание программирования
  2. Моделирование и оценка данных
  3. Визуализация и отчетность данных
  4. вероятность и статистика
  5. Методы машинного обучения
  6. Знание реляционной базы данных

Начнем с некоторой основной терминологии, используемой в науке о данных:

  1. Наблюдения – точки данных в вашем наборе данных (строки)
  2. Особенности – переменные в вашем наборе данных (столбцы)
  3. Целевая переменная – которую вы пытаетесь предсказать
  4. Данные поезда – данные, из которых ваш алгоритм изучает
  5. Данные тестирования – данные для оценки производительности вашей модели
  6. Модель – набор шаблонов, извлеченных из данных
  7. Алгоритм – конкретный процесс машинного обучения, используемый для обучения вашей модели

Оригинал: “https://dev.to/sreepotluri/introduction-to-data-science-227b”