Во-первых, я разработчик веб-разработчика, который недавно начал изучать домен обучения машины.
Поэтому я ищу некоторую помощь/начало/руководящие принципы о том, как реализовать отсканированного документа на основе машинного обучения, который прогнозирует, что предсказывает документ в одну из 29 категорий.
Документы являются в основном буквы, заметки и отчеты (имеющие табличные данные). Пока что я нашел Tesseract OCR и OpenCV, который, я думаю, будет инструменты, необходимые для этой задачи. Я также думаю, что мне нужно будет использовать типовые методы NLP для извлечения значения и лучшего прогнозирования. Тем не менее, будет здорово, если кто-то может ошеломнуть это для меня стратегию и маршрут, чтобы взять на себя. Каковы некоторые из конкретных методов/навыков/инструментов/пакетов, которые мне нужно учиться? Поскольку отсканированные изображения имеют различное качество, какие методы обработки изображений я могу использовать, чтобы получить лучшие результаты.
Оригинал: “https://dev.to/zeeshaanahmad/scanned-documents-classification-using-machine-learning-pld”