SHAREWOOD
SHAREWOOD
Редактор
- Регистрация
- 25/11/2019
- Сообщения
- 136.537
- Репутация
- 77.566
Складчина: Классификация, кластеризация и оценка сходства текстов (Курс "Компьютерная лингвистика") [Архэ] [Александр Пиперски]
Описание:
Компьютерная лингвистика представляет собой активно развивающуюся дисциплину на пересечении теории и практики. Её применение можно наблюдать ежедневно, включая машинный перевод, поиск в Интернете, голосовые ассистенты и многое другое. За созданием каждого из этих продуктов стоят усилия лингвистов и программистов. В рамках курса мы обсудим историю компьютерной лингвистики, её ключевые методы, а также рассмотрим, как они помогают решать практические задачи, такие как проверка орфографии или классификация новостей по темам.
7. Классификация, кластеризация и оценка текстового сходства
Важная функция компьютерной лингвистики - группировка похожих текстов. Это может включать категоризацию по заранее заданным классам (например, "Спорт", "Политика" и т.д.) и группировку на основе сходства текстов. Например, новостные сервисы сначала объединяют схожие тексты в одну историю, а затем присваивают её определённой категории. На лекции мы обсудим, как оценить расстояние между текстами, в чём различие между задачей классификации и задачей кластеризации, и как эти задачи решаются.
Лектор: Пиперски Александр Чедович, кандидат филологических наук, доцент Института лингвистики РГГУ, научный сотрудник Школы филологии НИУ ВШЭ.
Скрытая ссылка
Материал «Классификация, кластеризация и оценка сходства текстов (Курс "Компьютерная лингвистика") [Архэ] [Александр Пиперски]», возможно, скоро появится на SHAREWOOD.
Воспользуйтесь поиском, может быть, он уже опубликован.