Публикации по теме 'naturallanguageprocessing'


Прогнозирование сбоев моделей машинного обучения в производственной среде
Аннотировать или нет? Прогнозирование падения производительности при смене домена . Статья # EMNLP2019 авторов Хади Эльсахар и Матиас Галле — В тот момент, когда вы запускаете модель в производство, она начинает деградировать. Построение моделей машинного обучения, которые хорошо работают в дикой природе во время производства, по-прежнему остается открытой и сложной проблемой. Хорошо известно, что современные модели машинного обучения могут быть хрупкими, а это означает, что..

Как создать приложение для классификации сообщений о бедствиях с контролируемым машинным обучением и естественными…
После стихийного бедствия миллионы и миллионы сообщений, напрямую или через Twitter и Facebook, отправляются именно тогда, когда у организаций, занимающихся реагированием на стихийные бедствия, меньше всего возможностей фильтровать и извлекать сообщения с более высоким приоритетом. Прохожие часто публикуют сообщения о том, что происходит, и создают поток информации в социальных сетях быстрее и информативнее, чем репортажи. Однако зачастую только одно из тысячи таких сообщений имеет..

Обновление от 10/75 — Все еще не уверен в наборе данных
Все признаки указывают на то, что мы создадим собственный набор данных. Для нашего домена еще нет набора данных. (Я уже почти уверен в этом.) Это хорошо, потому что создание набора данных позволяет нам отправиться на неизведанную территорию и, возможно, оставить большой научный след в нашей области. Я надеюсь доработать вопрос «набор данных — сделать или взять», который я изначально планировал взять на этой неделе, на следующей неделе… Как уже упоминалось, сейчас я даже больше, чем на..

Оценка модели НЛП - последние тесты
И почему это важно Необходимость в метрике оценки Расчет убытков по другим направлениям В большинстве задач глубокого обучения - классификации, регрессии или генерации изображений - довольно легко и прямо оценить производительность модели, поскольку пространство решений является конечным / не очень большим. В большинстве задач классификации количество меток фиксировано, что позволяет рассчитать балл для каждого класса и, следовательно, дает возможность рассчитать потери / смещение..

ИИ, машинное обучение, НЛП и глубокое обучение?
Являются ли эти ингредиенты будущим человеческого успеха? Автономные или беспилотные автомобили сейчас являются горячей темой на сцене искусственного интеллекта. Google, Volvo, Tesla, Uber ... это лишь некоторые из громких имен в гонке, доказывающей, что беспилотные или автономные транспортные средства лучше и, возможно, даже безопаснее, чем транспортные средства, управляемые людьми. Недавно я был на семейном мероприятии, и двое гостей болтали о компоненте искусственного интеллекта..

Семантический поиск с использованием обработки естественного языка
Введение Компьютерный анализ текста известен как обработка естественного языка (NLP). Одним из аспектов НЛП является изучение того, как человек использует и понимает язык. Целью этого является разработка инструментов и методов, необходимых компьютерным системам для понимания, изменения и выполнения широкого круга полезных задач с использованием естественного языка. Исследования в области НЛП в настоящее время сосредоточены на создании сложных систем НЛП, которые включают как общий текст,..

Это библиотеки Python, над которыми я начну работать в 2023 году.
Я поделюсь списком библиотек Python, используемых в науке о данных, аналитике, машинном обучении, НЛП и глубоком обучении , которые я буду использовать для создания проектов и коротких руководств в этом году. 2023 . Библиотеки следующие: Apache Spark Spark — это унифицированный аналитический механизм для крупномасштабной обработки данных. Он предоставляет API высокого уровня на Scala, Java, Python и R , а также оптимизированный движок , поддерживающий общие графики..