Рубрики
Без рубрики

Как резать ай, чтобы стать машинным обучением инженера

Автор оригинала: Roger Huang.

Я уверен, что вы слышали о невероятных приложениях искусственного интеллекта – из программ, которые могут побить лучшие игроки в мире, чтобы автомобили самостоятельно.

Проблема в том, что большинство людей попадают в шумиху AI, смешивая технические дискуссии с философскими.

Если вы хотите прорезать ай, и работайте с практически реализованными моделями данных, поездите по направлению к инженеру данных или позиции инженера машинного обучения.

Не ищите интересные приложения AI в статьях AI. Ищите их в технике данных или учебных пособиях.

Это шаги, которые я взял, чтобы построить Этот забавный маленький скребок, который я построен для анализа Гендерное разнообразие в разных кодировках bootcamps. Это путь, который я сделал, чтобы провести исследование для трамплина Новый AI/ML онлайн Bootcamp с гарантией работы.

Вот пошаговая руководство по попаданию в мероприятие машинного обучения с критическим набором ресурсов, прикрепленных к каждому.

1. Начните чистить на практике вашего Python и программного обеспечения

Вы захотите начать, обнимая Python, язык выбора для большинства инженеров машинного обучения.

Удобный язык сценариев – это инструмент выбора для большинства инженеров данных и ученых данных. Большинство инструментов для данных были встроены в Python или создали доступ API для Easy Python Access.

К счастью, синтаксис Python относительно легко забрать. Язык имеет тонны документации и обучения ресурсов. Он также включает в себя поддержку всех видов парадигми программирования из функционального программирования к объектно-ориентированному программированию.

Одно, что может быть немного сложно, это забрать табуляцию и интервал, необходимые для организации и активации вашего кода. В Python пробел действительно имеет значение.

В качестве машинного обучения инженер, вы бы работаете в команде, чтобы построить комплекс, часто критически важные приложения. Итак, сейчас самое время обновить прослушивание программного обеспечения для лучших практик.

Научитесь использовать совместные инструменты, такие как GitHub. Получите привычку написать тесты на тщательную единицу для вашего кода с помощью структуры тестирования, такие как нос. Проверьте свои API, используя такие инструменты, как почтальон. Используйте системы CI, такие как Jenkins, чтобы убедиться, что ваш код не нарушает. Разработайте хорошие навыки проверки кода, чтобы лучше работать с вашими будущими техническими коллегами.

Одна вещь, чтобы прочитать : Какой лучший Python IDE для науки о данных? Пройдите быстрое чтение, чтобы вы могли понять, какой набор инструментов вы хотите работать, чтобы реализовать Python на DataSets.

Я использую Jupyter ноутбук Сам, поскольку он поставляется предварительно установлен с большинством важных библиотек науки, которые вы будете использовать. Он поставляется с легким чистым интерактивным интерфейсом, который позволяет редактировать свой код на лету.

Jupyter Notebook также поставляется с расширениями, которые позволяют вам легко поделиться своими результатами с миром в целом. Сгенерированные файлы также очень легко работать с GitHub.

Одна вещь, чтобы сделать : Pandas Cookbook Позволяет вилку в живых примерах Pandas Framework, одного из самых мощных библиотек данных манипуляций. Вы можете быстро работать через пример того, как играть с набором данных через него.

2. Посмотрите в машиноводные рамки и теорию

Как только вы играете с Python и практикуете с ним, пришло время начать смотреть на теорию обучения машины.

Вы узнаете, какие алгоритмы использовать. Наличие базового знания теории за изучением машины, позволит вам легко реализовывать модели.

Одна вещь, чтобы прочитать : Экскурсия по десяти алгоритмам для машины обучения новичкам поможет вам начать с основы. Вы узнаете, что нет «бесплатного обеда». Нет алгоритма, который даст вам оптимальный результат для каждой настройки, поэтому вам придется погружаться в каждый алгоритм.

Одна вещь, чтобы сделать : Играйте с интерактивными Бесплатное обучение машины в курсе Python – Развивайте свои навыки Python и начните реализацию алгоритмов.

3. Начните работать с наборами набора данных и экспериментировать

У вас есть инструменты и теория под вашим поясом. Вы должны подумать о том, чтобы делать мало мини-проектов, которые могут помочь вам уточнить ваши навыки.

Одна вещь, чтобы прочитать : Посмотрите на 19 Бесплатные общедоступные наборы данных для вашего первого проекта науки о данных И начните смотреть, где вы можете найти разные наборы данных в Интернете, чтобы играть с.

Одна вещь, чтобы сделать : CAGGLE DataSets Позвольте вам работать с множеством общедоступных наборов данных. Что круто об этой коллекции, вы можете увидеть, насколько популярны определенные наборы наборов данных. Вы также можете посмотреть, какие другие проекты были построены с одинаковым набором данных.

4. Масштабировать свои навыки данных с Hadoop или Spark

Теперь, когда вы практикуете в меньших наборах наборах, вы захотите узнать, как работать с Hadoop или Spark. Инженеры-инженеры работают с потоковыми данными уровня производства в реальном времени в Terabyte и иногда шкале петабайта. Умение, изучая свой путь через большую структуру данных.

Одна вещь, чтобы прочитать : Эта короткая статья Как укладывается Hadoop и Spark? Поможет вам пройти как Hadoop и Spark и как они сравнивают и контрастируют друг с другом.

Одна вещь, чтобы сделать : Если вы хотите начать работать с большой структурой данных сразу, Spark Jupyter Notebooks, размещенные на Databricks Предлагает внедрение уровня учебника в рамки и заставит вас практиковать с примерами кода на уровне производства.

5. Работа с глубокой структурой обучения, как Tensorflow

Вы закончили изучение алгоритмов обучения машин и работают с различными большим инструментами данных.

Теперь пришло время взять на себя то мощное укрепление, которое было сосредоточено в центре новых достижений. Узнайте Framework Tensorflow, и вы будете на режущей кромке машинного обучения.

Одна вещь, чтобы прочитать : Читать Что такое Tensorflow? И понять, что происходит на нижнем вытяжении, когда дело доходит до этой мощной глубокой структуры обучения.

Одна вещь, чтобы сделать : Tensorflow и глубокое обучение без доктора филоса Это интерактивный курс, построенный Google, который сочетает в себе теорию, помещенную в слайды с практическими лабораториями с кодом.

6. Начните работать с большим набором наборах продукции

Теперь, когда вы работали с глубокими рамками обучения, вы можете начать работать над большим набором данных производства.

В качестве инженера-инженера машинного обучения вы будете делать сложные инженерные решения о управлении большим количеством данных и развертыванием ваших систем.

Это будет включать сбор данных из API и веб-соскабливания, базы данных SQL + NOSQL и когда вы используете их, использование фреймворков трубопроводов, таких как luigi или воздушный поток.

Когда вы развертываете свои приложения, вы можете использовать контейнерные системы, такие как Docker для масштабируемости и надежности, а также такие инструменты, как Flask для создания API для вашего приложения.

Одна вещь, чтобы прочитать : 7 способов обработки больших файлов данных для машинного обучения Это хорошее теоретическое упражнение в том, как вы будете обрабатывать большие наборы данных, и могут служить удобным контрольным списком тактики для использования.

Одна вещь, чтобы сделать : Публично доступные большие наборы данных это список мест, где вы можете получить очень большие наборы данных – готов практиковать свои новые навыки инженерных данных.

7. Практика, практика, практика, построение в портфолио, а затем на работу

Наконец, вы получите точку, где вы можете строить рабочие модели обучения машины. Следующим шагом к продвижению вашей машины обучения карьере является поиск работы с компанией, которая содержит эти большие наборы данных, поэтому вы можете применить свои навыки каждый день в реструктуру проблему обучения машине.

Одна вещь, чтобы прочитать : 41 Вопросы собеседования на важных машинах (с ответами) поможет вам попрактиковаться знаниям, которым вам нужно интервью на машине.

Одна вещь, чтобы сделать : Выйдите и найдите встречи, которые предназначены для машинного обучения или технической техники на Встреча – Это отличный способ встретиться со сверстниками в пространстве и потенциальных менеджеров найма.

Надеюсь, этот учебник помог прорезать шумиху вокруг AI к чему-то практическому и адаптуру, что вы можете использовать. Если вы чувствуете, что вам нужно немного больше, компания я работаю, трамплина, предлагает карьерную дорожку BootCamp, посвященное обучению AI и машины с гарантией работы и 1: 1 наставничество от экспертов по обучению машин.