0:Информационные технологии в филологии

Материал из Викиверситета
Перейти к навигации Перейти к поиску
Fairytale up blue.png
Вы находитесь в Инкубаторе

Перейти на уровень выше

Проект Квантитативная лингвистика и новые информационные технологии[править]

1. Описательная статистика и статистические методы анализа данных в лингвистических исследованиях.[править]

Цели и организация лингвостатистических исследований.Основные статистические категории: выборка и совокупности, типы переменных, их классификация применительно к соответствующему уровню лингвистического анализа. Частота и распределение частот встречаемости для больших и малых инвентарей. Меры центральной тенденции и рассеяния. Выборочные статистики и параметры распределения: методы оценивания. Планирование статистического эксперимента и проверка гипотез. Параметрические критерии значимости. χ2-критерий. Непараметрические критерии. Корреляционный анализ в лингвистических исследованиях. Дисперсионный анализ (ANOVA). Кластерный анализ. Факторный анализ.

2. Закон Ципфа-Мандельброта и его следствия.[править]

Частота как характеристика употребительности слова в тексте. Закон Ципфа.Уточнение закона Ципфа: закон Ципфа -Мандельброта. Закон Ципфа и структура реального текста. Частотные словари, словари-индексы, машинные фонды лексики. Характеристики частотных словарей и индексы покрытия текста. Частота слова и продуктивность. Частота слова и многозначность. Частота слова и его возраст

3. Примеры применения статистических методов в основных разделах лингвистики.[править]

Фоностатистика. Статистико-комбинаторные. дистрибутивно-статистические и дешифровочные методы в грамматике. Меры автономности грамматических структур и их семантики. Квантитативная типология Гринберга. Опыт квантитативного обоснования морфологических типов (корреляции между морфологическими признаками). Статистические методы в сравнительно-историческом языкознании. Глоттохронология. Статистические методы в анализе дискурса. Статистические методы при выделении топика / фокуса внимания / максимально активированного референта. Оценка повторяемости отдельных элементов и когерентность связанных текстов.Контент-анализ, анализ метафоры. Статистические методы в психо-лингвистике и социолингвистике. Социолингвистические переменные, их оценивание.Психометрические методы.

Стилостатистический метод анализа текста

4. Квантитативные методы, применяемые в корпусной лингвистике:[править]

Корпусная лингвистика

Статистические методы оценки продуктивности аффиксов. Корпусные статистические методы анализа лексики. Статистические методы выделения терминов, устойчивых словосочетании, синонимических групп, семантических полей. Статистические методы машинного перевода. 0:Методы самообучения в применении к частеречной разметке корпуса (автоматический тэггинг). Применение методов скрытых марковских моделей при частеречной разметке корпуса текстов.Статистические методы синтаксической разметки корпуса. Стохастические грамматики. Программное обеспечение предметной области

5. Задачи атрибуции текстов и стилеметрия.[править]

Авторизация текста: пример экспертизы 0:Программное обеспечение задач атрибуции текстов и стилиметрии

Ссылки[править]

Метод проектов ссылки[править]

Метод проектов

Литература[править]