Рубрики
Без рубрики

Как я научился обрабатывать естественный язык

Короткий пост о тонкостях обработки естественного языка.

Автор оригинала: Bharat Suri.

Обо мне

Я студент CS, в настоящее время учусь на третьем курсе своей академической программы. Я уже давно интересуюсь основной дисциплиной в области компьютерных наук, и именно поэтому мне нравится заниматься этой областью.

Почему я хотел изучать обработку естественного языка

В этой области каждый день появляются новые технологии. Новые прорывы обнаруживаются в каждом уголке и уголке этого места.

Я очарован идеей изучения этих технологий и получения более глубокого понимания их, поскольку это в первую очередь помогает в создании решений многих наших реальных жизненных проблем.

Вот почему я заинтересовался областью искусственного интеллекта, и глубокое обучение стало инструментом для ее решения. Я выбрал НЛП вместо Компьютерного зрения из-за проблем, которые в настоящее время решаются с помощью этой технологии.

Текстовые данные, как структурированные, так и неструктурированные, – это то, что в настоящее время управляет нашими ресурсами, доступными в Интернете. НЛП казалось правильным, когда дело доходило до изучения этих данных, их взаимоотношений и того, как заставить компьютеры понять это.

Как я подошел к изучению обработки естественного языка

Я нашел материал для изучения НЛП в лекциях Стэнфордского курса CS224N, доступных в виде плейлиста YouTube |. Прежде чем я начал смотреть лекции в Интернете, я также прочитал об исследованиях, которые проводились в области НЛП, после чего я решил получить твердое представление об этом предмете.

Помимо лекций, было также довольно много статистических данных, необходимых для понимания концепций, поэтому я посмотрел много видео из Академии Хана, еще один отличный ресурс для изучения широкого спектра дисциплин.

Проблемы, с которыми я столкнулся

Первым серьезным препятствием, с которым я столкнулся, была невозможность напрямую применить эти концепции к реальному проекту. Это было проблемой, потому что без каких-либо практических знаний это казалось бесполезным усилием.

Я искал проекты на GitHub, и, к счастью, мне удалось пройти стажировку в компании, которая работает в этой области. На мой взгляд, лучший способ действительно понять теоретические концепции-это применять их любым возможным способом. Если, создав простую программу, вы можете реализовать новейший алгоритм, который вы только что изучили, очень важно, чтобы вы это сделали. Это лучший способ преодолеть любые проблемы, с которыми вы можете столкнуться в процессе обучения.

Ключевые выносы

Самым важным для меня было то, что все доступно, если вы посмотрите в нужном месте. Я узнал о бесчисленных возможностях в этой области через онлайн-лекции, конкурсы, проекты, доступные на GitHub, и, самое главное, о возможностях, доступных в сообществах с открытым исходным кодом.

Я осознал важность разработки с открытым исходным кодом, изучая библиотеки, которые были доступны, когда я решал задачи, и был мотивирован вносить свой вклад в проекты с открытым исходным кодом.

Советы и рекомендации

Для любого разработчика, который хочет изучать НЛП, лучшее, что можно сделать прямо сейчас, – это выйти в Интернет, пройти курсы, о которых я упоминал выше, и попытаться пройти их с глубоким пониманием концепций. Пока вы делаете это, попробуйте найти проекты с открытым исходным кодом, которые помогут вам применить концепцию, которую вы только что изучили. Не забывайте продолжать поиски.

Заключительные мысли и следующие шаги

Это общий процесс, и список доступных ресурсов на самом деле не является исчерпывающим, но ознакомьтесь с этим списком, куратором которого является @gutfeeling на его GitHub repo .

После того, как вы поработаете над некоторыми второстепенными задачами для любого проекта с открытым исходным кодом, следующее, что вы можете сделать, – это развить свои знания и начать проект, который инкапсулирует все концепции, которые вы изучили. Когда вы пытаетесь создать проект с нуля, есть много базовых концепций, которые становятся очевидными для вас, и вы получаете больше практических знаний по этому предмету.