«Цель состоит в том, чтобы превратить данные в информацию и информацию в Insight». – Карли Фиорина
Выберите свое оружие первым: Здесь я имею в виду выбрать правильный язык для изучения науки о данных, вы можете пойти с R или Python, вы также можете выбрать Java для изучения науки о данных, но я не буду рекомендовать науку научной информации с Java.
Однако самым привлекательным фактором Python является то, что он легко учиться. По сравнению с другими данными Научные языки, такие как R, Python предоставляет простой для понимания синтаксиса. Если вы решили пойти с Python, разрабатывайте хорошие практические ноутбуки Jupyter и различные библиотеки, такие как Pandas, Numpy, Meanborn, Scipy, Xgboost и многое другое.
Три основные основные темы математики
- Исчисление
- Линейная алгебра
- Вероятность и статистика
Некоторые теории: –
- Дискретная математика
- Графическая теория
- Теория информации
Забавный факт: – Если вы боитесь математики или не готовы посмотреть уравнение, вам не будет много веселья как ученый данных. Тем не менее, вы, если взяли математику на уровне средней школы и готовы инвестировать некоторое время, чтобы улучшить ваше знакомство с вероятностью и статистикой и изучать принципы, лежащие в основе исчисления и линейной алгебры, математика не придет в свой способ стать профессиональным ученым.
Есть несколько действительно хороших курсов, чтобы начать работу с наукой о данных, обратите внимание, что здесь делать курсы разные вещи, а игра с реальными мировыми данными – это другая вещь после вот несколько примеров качества курсов для начинающих
Сделайте несколько онлайн-курсов как:
Datacamp Курсы Kaggle Coursera
Бизнес-лидеры прошлого поколения, провидцы нынешнего, а исследовательское сообщество – ключи !!! Как я уже сказал выше, делая курсы, это другое, и играет с реальными мировыми данными – это другое, что после того, как испытывает много разных типов обучения, я обнаружил, что обучение, выполняя реальные мировые проекты, является наиболее эффективным способом быстрого изучения вещей. Делаясь курсы – это другое, и игра с реальными мировыми данными – это другое.
Вот несколько источников, где вы можете найти некоторые наборы данных с открытым исходным кодом Real-World для практики и создания проектов
uci-ml-repo
Кашельство
Google публичные наборы данных
Fivethirtyeight.
- Python для анализа данных WES Mckinney
- Автоматизировать скучные вещи с Python
- Машина обучения с Python Cookbook
- Python Cookbook
- Руки на машине обучение с Scikit-Suart & Tensorflow
В первой части попробуйте изучить некоторые алгоритмы, задавайте вопросы своими данными, ищите несколько хороших проектов на Kaggle и Github и сделайте свой анализ того, что делают люди с их ноутбуком Jupyter.
Узнайте различные алгоритмы и понять математику за кулисами. Не волнуйтесь, математика за ними легко, не боясь, услышав их имена.
- Линейная регрессия
- K-средства (k-nn)
- k-означает и больше …
После некоторой практики вы сможете решить продвинутые проблемы науки о данных. Попробуйте собирать данные, чтобы сделать ваш проект, практиковать процессы Life Life Cycle.
Надеюсь, этот блог даст вам четкий путь к тому, как навигаться в этом поле. Мне потребовалось годы, чтобы правильно понять науки и концепции жизни данных, и я все еще учусь каждый день! Большое спасибо за чтение и удачи в вашем путешествии по науке о данных !! Как всегда, я приветствую обратную связь, конструктивную критику и слушаю о ваших проектах. Я могу добраться до LinkedIn , а также на мой сайт Отказ
Оригинал: “https://dev.to/vivekcodes/data-science-zero-to-hero-protips-420”