Машиночитаемый Викисловарь/Словарные пометы и толкования

Материал из Викиверситета

Построение файла с пометами и толкованиями[править]

Задача:

  • извлечь из базы данных машиночитаемого Викисловаря словарную помету и толкование;
  • записать их в файл таким образом, что на каждой строке файла идут
    1. слово (название словарной статьи),
    2. словарная помета (или несколько помет),
    3. текст толкования.

Пример файла:

подвизаться|книжн.|ирон.|осуществлять деятельность, работать, действовать в какой-нибудь области
подвизаться|религ.|совершать подвиг в чём-либо, часто о ежедневном борении
заткнуться|перен.|груб.|то же, что замолчать; перестать говорить, кричать, плакать; замолкнуть

GoEmotions и словарные пометы[править]

Цель в два шага:

  1. для каждой строки нашего файла (слово, помета, текст) получить по тексту толкования оценки 28 эмоциональных тегов.
  2. суммировать, нормировать — получить усреднённые эмоциональные оценки для словарных помет (получить эмоциональный вектор для каждой из словарных помет).

Ссылки[править]

Литература[править]