Как работает распространение меток, часть 6 (машинное обучение)

Обучение распределению меток с помощью сетки корреляции меток (arXiv)

Автор: Цимэн Го, Чжуоран Чжэн, Сюи Цзя, Ляньчэн Сюй.

Аннотация: Обучение распределению меток может охарактеризовать полисемию экземпляра посредством распределения меток. Однако при обработке данных о распределении меток из-за искусственных факторов или факторов окружающей среды в пространство меток могут быть внесены некоторый шум и неопределенность. Чтобы решить эту проблему, мы предлагаем \textbf{L}abel \textbf{C}orrelation \textbf{G}rid (LCG) для моделирования неопределенности отношений меток. В частности, мы вычисляем матрицу ковариации для пространства меток в обучающем наборе, чтобы представить отношения между метками, затем моделируем распределение информации (функцию распределения Гаусса) для каждого элемента в матрице ковариации, чтобы получить LCG. Наконец, наша сеть учит LCG точно оценивать распределение меток для каждого экземпляра. Кроме того, мы предлагаем алгоритм проецирования распределения меток в качестве члена регуляризации в процессе обучения модели. Обширные эксперименты подтверждают эффективность нашего метода на нескольких реальных тестах.

2. Обучение распределению меток через неявное представление распределения (arXiv)

Автор: Чжуоран Чжэн, Сюи Цзя.

Аннотация: В отличие от обучения с несколькими метками, обучение с распределением меток характеризует многозначность примеров с помощью распределения меток для представления более богатой семантики. В процессе обучения распределению меток обучающие данные собираются в основном с помощью алгоритмов ручной аннотации или улучшения меток для создания распределения меток. К сожалению, сложность задачи ручной аннотации или неточность алгоритма улучшения меток приводит к шуму и неопределенности в обучающей выборке распределения меток. Чтобы облегчить эту проблему, мы вводим неявное распределение в структуру обучения распределению меток, чтобы охарактеризовать неопределенность каждого значения метки. В частности, мы используем глубокое неявное обучение представлению для построения матрицы распределения меток с гауссовыми априорными ограничениями, где каждый компонент строки соответствует оценке распределения каждого значения метки, и этот компонент строки ограничен априорным гауссовым распределением для уменьшения шума и неопределенности. интерференция набора данных о распределении меток. Наконец, каждый компонент строки матрицы распределения меток преобразуется в стандартную форму распределения меток с помощью алгоритма внутреннего внимания. Кроме того, некоторые подходы с характеристиками регуляризации применяются на этапе обучения для повышения производительности модели.

Как работает распространение меток, часть 6 (машинное обучение)

Вопросы по теме