Рубрики
Без рубрики

Классификация текста с помощью BERT Tokenizer и TF 2.0 в Python

BERT-это техника представления текста, похожая на встраивание слов. В этой статье мы будем использовать BERT и TensorFlow 2.0 для классификации текста.

Рубрики
Без рубрики

Python для НЛП: Начало работы с библиотекой Stanford CoreNLP

Автор оригинала: Usman Malik. Это девятая статья в моей серии статей по Python для НЛП. В предыдущей статье мы видели , как библиотека шаблонов Python может использоваться для выполнения различных задач НЛП, начиная от токенизации и заканчивая POS-тегированием, а также классификацией текста и анализом настроений. До этого мы исследовали библиотеку TextBlob для выполнения аналогичных задач […]

Рубрики
Без рубрики

Чтение и запись файлов MS Word на Python с помощью модуля Python-Docx

В статье объясняется, как читать и писать файлы MS Word с помощью модуля Python-Docx с помощью различных примеров.

Рубрики
Без рубрики

Применение методов обертки в Python для выбора объектов

Автор оригинала: Usman Malik. Вступление В предыдущей статье мы изучали , как можно использовать методы фильтрации для выбора признаков для алгоритмов машинного обучения. Методы фильтрации удобны, когда вы хотите выбрать общий набор функций для всех моделей машинного обучения. Однако в некоторых сценариях может потребоваться использовать определенный алгоритм машинного обучения для обучения модели. В таких случаях […]

Рубрики
Без рубрики

Реализация PCA в Python с помощью Scikit-Learn

Автор оригинала: Usman Malik. При наличии высокопроизводительных процессоров и графических процессоров практически возможно решить все регрессионные, классификационные, кластерные и другие связанные с ними проблемы с помощью моделей машинного обучения и глубокого обучения. Однако при разработке таких моделей все еще существуют различные факторы, вызывающие узкие места в производительности. Большое количество объектов в наборе данных является одним […]

Рубрики
Без рубрики

Python для НЛП: Работа с библиотекой Gensim (Часть 1)

Автор оригинала: Usman Malik. Это 10-я статья в моей серии статей по Python для НЛП. В моей предыдущей статье я объяснил , как библиотека Stanford CoreNLP может использоваться для выполнения различных задач НЛП. В этой статье мы рассмотрим библиотеку Gensim , которая является еще одной чрезвычайно полезной библиотекой НЛП для Python. Gensim был в первую […]

Рубрики
Без рубрики

Библиотека Pandas для визуализации данных в Python

Автор оригинала: Usman Malik. В моей предыдущей статье я объяснил , как библиотека Seaborn может быть использована для расширенной визуализации данных в Python. Сиборн-отличная библиотека, и я всегда предпочитаю работать с ней, однако это немного продвинутая библиотека, и ей нужно немного времени и практики, чтобы привыкнуть. В этой статье мы увидим, как Pandas, которая является […]