Курс сбоя машинного обучения Google - 43 Правила машинного обучения (резюме)

В конце этой статьи вы поймете базовые знания в области машинного обучения и получите пользу от лучших практик Google в области машинного обучения:

Этот подход будет хорошо работать в течение долгого времени. Отказся от этого подхода только тогда, когда нет более простых трюков, чтобы у вас все дальше.

Правило № 1: Не бойтесь запустить продукт без машинного обучения

Правило № 2: Во -первых, проектирование и реализацию метрик.

Правило № 3: Выберите машинное обучение над сложной эвристикой.

Правило № 4: Держите первую модель простой и получите правильную инфраструктуру.

Правило № 5: Проверьте инфраструктуру независимо от машинного обучения.

Правило № 6: Будьте осторожны с падающими данными при копировании трубопроводов.

Правило № 7: Включите эвристику в функции или обрабатывайте их внешне.

Правило № 8: Знайте требования свежести вашей системы.

Правило № 9: Обнаружение проблем перед экспортом моделей.

Правило № 10: Следите за безмолвными неудачами.

Правило № 11: Дайте владельцам колонн и документацию.

Правило № 12: Не задумывайте, какую цель вы решите напрямую оптимизировать.

Правило № 13: Выберите простую, наблюдаемую и апирационную метрику для вашей первой цели.

Правило № 14: Начиная с интерпретируемой модели облегчает отладку.

Правило № 15: Отдельная фильтрация спама и рейтинг качества на политическом уровне.

Правило № 16: Планируйте запустить и итерацию.

Правило № 17: Начните с непосредственных наблюдаемых и сообщенных особенностей, в отличие от изученных особенностей.

Правило № 18: Исследуйте с функциями контента, которые обобщаются в разных контекстах.

Правило № 19: Используйте очень конкретные функции, когда можете.

Правило № 20: Объедините и изменяйте существующие функции, чтобы создавать новые функции человеком-понимаемыми способами.

Правило № 21: Количество весов функций, которые вы можете выучить в линейной модели, примерно пропорционально количеству данных, которые у вас есть.

Правило № 22: Очистите функции, которые вы больше не используете.

Правило № 23: Вы не типичный конечный пользователь.

Правило № 24: Измерьте дельту между моделями.

Правило № 25: При выборе моделей утилитарная производительность превосходит прогнозирующую силу.

Правило № 26: Ищите шаблоны в измеренных ошибках и создайте новые функции.

Правило № 27: Попробуйте количественно оценить наблюдаемое нежелательное поведение.

Правило № 28: Имейте в виду, что идентичное краткосрочное поведение не подразумевает идентичное долгосрочное поведение.

Правило № 29: Лучший способ убедиться, что вы тренируетесь, как вы, – это сохранить набор функций, используемых во время подачи, а затем поднять эти функции в журнал, чтобы использовать их во время обучения.

Правило № 30: Выбранные данные о важности, не произвольно бросайте их! Правило № 31: Остерегайтесь того, что если вы присоединяетесь к данным из таблицы при обучении и времени обслуживания, данные в таблице могут измениться.

Правило № 32: Повторно используйте код между вашим тренировочным конвейером и вашим конвейером, когда это возможно.

Правило № 33: Если вы создаете модель на основе данных до 5 января, проверьте модель на данных с 6 января и после.

Правило № 34: В бинарной классификации для фильтрации (например, обнаружение спама или определение интересных электронных писем) принесите небольшие краткосрочные жертвы в производительности для очень чистых данных.

Правило № 35: Остерегайтесь неотъемлемого перекоса в рейтинге.

Правило № 36: Избегайте петель обратной связи с позиционными функциями.

Правило № 37: Измерение обучения/перекоса.

Правило № 38: Не тратьте время на новые функции, если не выдвинутые цели стали проблемой.

Правило № 39: Решения о запуске являются прокси для долгосрочных целей продукта.

Правило № 40: Держите ансамбли простыми.

Правило № 41: Когда Performance Plateaus ищите качественно новые источники информации, чтобы добавить, а не уточнить существующие сигналы.

Правило № 42: Не ожидайте, что разнообразие, персонализация или актуальность будут такими же коррелированными с популярностью, как вы думаете.

Правило № 43: Ваши друзья, как правило, одинаковы для разных продуктов. Ваши интересы, как правило, не являются.

Оригинал: “https://dev.to/steminstructor/google-s-machine-learning-crash-course-43-rules-of-machine-learning-summary-2f0p”

Читайте ещё по теме: