Рубрики
Без рубрики

Нер с трансформаторами и Spacy (Python)

Именованное распознавание объекта (NER) состоит из извлечения «сущностей» из текста – то, что мы подразумеваем под этим … Помечено Python, глубокое обучение, машинное обучение, наука о данных.

Именованное распознавание объекта (NER) состоит из извлечения «сущностей» из текста – то, что мы имеем в виду под данным предложение:

” Apple достигла все время высокой цены на 143 доллара в январе.

Мы могли бы захотеть извлечь ключевые произведения информации или «объектов» – и классифицировать каждую из этих объектов. Вот так:

  • Apple: Организация
  • 143 доллара: Стоимость в денежном выражении
  • Это январь: дата

Для нас люди, это легко. Но как мы можем научить машину отличить бабушку Smith Apple и яблоко, которое мы торгуем на NASDAQ?

(Нет, мы не можем положиться на буквам «А» …)

Это где NER приходит – используя NER, мы можем извлечь ключевые слова, такие как Apple, и определить, что это, на самом деле, организация – не фрукт.

Библиотека Go-to для NER в Spacy, что невероятно. Но что, если мы добавили трансформаторы в Spacy? Даже лучше – мы накроем именно в этом видео.

Оригинал: “https://dev.to/jamescalam/ner-with-transformers-and-spacy-python-2f3i”