Именованное распознавание объекта (NER) состоит из извлечения «сущностей» из текста – то, что мы имеем в виду под данным предложение:
” Apple достигла все время высокой цены на 143 доллара в январе.
Мы могли бы захотеть извлечь ключевые произведения информации или «объектов» – и классифицировать каждую из этих объектов. Вот так:
- Apple: Организация
- 143 доллара: Стоимость в денежном выражении
- Это январь: дата
Для нас люди, это легко. Но как мы можем научить машину отличить бабушку Smith Apple и яблоко, которое мы торгуем на NASDAQ?
(Нет, мы не можем положиться на буквам «А» …)
Это где NER приходит – используя NER, мы можем извлечь ключевые слова, такие как Apple, и определить, что это, на самом деле, организация – не фрукт.
Библиотека Go-to для NER в Spacy, что невероятно. Но что, если мы добавили трансформаторы в Spacy? Даже лучше – мы накроем именно в этом видео.
Оригинал: “https://dev.to/jamescalam/ner-with-transformers-and-spacy-python-2f3i”