Архитектура seq2seq-это тип моделирования последовательностей “многие ко многим”. В этой статье мы создадим модель машинного перевода на Python с помощью Keras.
Автор: Usman Malik
Автор оригинала: Usman Malik. В предыдущей статье мы начали обсуждение того , как обрабатывать естественный язык с помощью Python. Мы видели, как читать и писать текстовые и PDF-файлы. В этой статье мы начнем работать с библиотекой space для выполнения еще нескольких базовых задач НЛП, таких как токенизация , стемминг и лемматизация . Введение в космос […]
Автор оригинала: Usman Malik. Это 12-я статья в моей серии статей по Python для НЛП. В предыдущей статье я кратко объяснил различные функциональные возможности библиотеки Python Gensim . До сих пор в этой серии мы рассматривали почти все наиболее часто используемые библиотеки НЛП, такие как NLTK, Space, Gensim, StanfordCoreNLP, Pattern, TextBlob и т. Д. В […]
Распознавание речи-одна из важнейших задач взаимодействия человека и компьютера. Мы будем использовать библиотеку распознавания речи для выполнения этой задачи в Python.
Автор оригинала: Usman Malik. Вступление Алгоритмы машинного обучения и глубокого обучения учатся на данных, которые состоят из различных типов функций. Время обучения и производительность алгоритма машинного обучения сильно зависят от особенностей набора данных. В идеале мы должны сохранять только те функции в наборе данных, которые действительно помогают нашей модели машинного обучения чему-то научиться. Ненужные и […]
Автор оригинала: Usman Malik. Вступление Классификация текстов-одна из важнейших задач обработки естественного языка . Это процесс классификации текстовых строк или документов по различным категориям в зависимости от содержания строк. Классификация текста имеет множество приложений, таких как определение настроений пользователей по твиту, классификация электронной почты как спама или ветчины, классификация сообщений в блогах по различным категориям, […]
Автор оригинала: Usman Malik. Это шестая статья в моей серии статей по Python для НЛП. В своей предыдущей статье я рассказывал о том , как выполнять анализ настроений данных Twitter с помощью библиотеки Scikit-Learn Python. В этой статье мы рассмотрим тему моделирования, которая является еще одним очень важным применением НЛП. Мы увидим, как сделать тематическое […]
Автор оригинала: Usman Malik. Вступление Преимущества NumPy Операции NumPy Создание массива NumPy Метод массива Метод аранжировки Метод нулей Метод те Метод linspace Глазной метод Случайный метод Изменение формы массива NumPy Поиск Максимальных/Минимальных Значений Индексация массива в NumPy Индексация с 1-D массивами Индексация с помощью 2-D массивов Арифметические операции с массивами NumPy Функция журнала Функция exp […]
Автор оригинала: Usman Malik. Это вторая и заключительная часть серии статей из двух частей, посвященных решению задач последовательности с помощью LSTMs. В части 1 этой серии я объяснил , как решать задачи последовательности “один к одному” и “многие к одному” с помощью LSTM. В этой части вы увидите, как решать задачи последовательности “один ко многим” […]
Автор оригинала: Usman Malik. В предыдущей статье Seaborn Library for Data Visualization in Python: Part 1 мы рассмотрели , как библиотека Seaborn используется для построения распределенных и категориальных графиков. В этой статье мы продолжим наше обсуждение и рассмотрим некоторые другие функции, предлагаемые Seaborn для рисования различных типов графиков. Мы начнем наше обсуждение с матричных графиков. […]