Программирование Викиданных

Материал из Викиверситета
Перейти к навигации Перейти к поиску
↱ w.wiki/62E
Иконка программы Pywikibot.
Эта статья — часть материалов: кафедры Веб-технологии

Программирование Викиданных (с листингами, рисунками и упражнениями) — это курс, обучающий работе с Викиданными. Курс предназначен для студентов и преподавателей технических вузов, а также для школьников старших классов, углублённо изучающих информатику. В этом курсе вы с необходимостью познакомитесь с языками Python, SPARQL, системой Pywikibot, средой Викиданные.

Автором курса является Крижановский Андрей. Каждая глава курса представляет собой серию задач на одну тему. Решением поставленных задач, оформлением и описанием путей решения занимаются студенты Петрозаводского государственного университета в ходе выполнения работ по предметам "Интернет-математика" и "Автоматическая обработка текста".

Перевод завершённых глав публикуется в Английском Викиверситете в проекте Research in programming Wikidata.

Принятые работы[править]

Список принятых работ. В какой-то мере это образцы для подражания. Статьи могут дорабатываться любыми участниками Викиверситета.

📖 — символ книги ставится перед именем редактора, работающего с LaTeX.

  • архивы
  • банки и коммерческие организации
  • войны и битвы
  • заповедники и ООПТ
  • катастрофы
  • кино, мультфильмы, телевидение
  • книги и литературные произведения, картины, музыка
  • компьютерные программы
  • космос
  • образование (школы, вузы, институты)
  • СМИ, радио, издательства
  • техника: корабли, воздушные суда, танки
  • технология, информатика
разработанные программы, сайты

В процессе[править]

Статьи над которыми работа ещё не завершена. Чтобы выяснить, что именно осталось сделать — посетите страницу обсуждения соответствующей статьи.


  • Коронавирус — Экстраполяция взаимосвязанных кривых числа заражений COVID-19 на примере субъектов России
  • COVID-19

Алгоритм работы[править]

Алгоритм работы для новых статей

Алгоритм доработки существующих статей:

  1. ProWD
  2. Иллюстрации в Викиверситете
  3. LaTeX и kaobook
  4. Иллюстрация в LaTeX
  5. Статья в LaTeX на русском

Todo[править]

Темы на выбор[править]

Предложите свою тему или выберите одну из перечисленных тем ниже, указав свои данные следующим образом:

  • Название главы [[User:имя пользователя|Фамилия Имя Отчество]]

Можно продолжить работу, которая была начата студентами в предыдущем семестре (на строке с объектом не указана фамилия).

  • языки и названия
  • медицина
  • поселения, в том числе деревни и станицы
  • школы
  • вузы
  • институты, академии
  • религия
  • church — храмы и церкви
  • СМИ и издательства
  • операции, функции, парадоксы и теоремы
  • науки
  • войны и битвы
  • корабли, воздушные суда и танки
  • транспорт
  • выступления и радиопередачи
  • книги и литературные произведения, картины, музыка
  • красная книга (животные, растения)
  • японская анимация

Языкознание и литература[править]

  • корпус текстов
  • электронная библиотека
  • детский писатель

Математики[править]

Возможно, для поиска вклада учёных, кроме свойства "notable work", нужно будет воспользоваться solved by (P1136) или аналогичными (какими?).
Открытые задачи, связанные с математиками

+ связь возраста и наград в разных областях:

  1. Определить возраст (min, max, avg) получения первой награды. Меняется ли и как меняется этот возраст с каждым десятилетием?
  2. Работников каких областей математики награждают больше, чаше? Можно ли выделить разные эпохи в математике по превалирующим наградам в разных областях?
  3. Какие регионы чаще награждают?
  4. Выпускников каких вузов чаще награждают?

См. ещё задачи: Обсуждение:Программирование Викиданных/География математиков.

математики и время
  1. Суммарный индекс гениальности математиков по годам, векам. Распределение гениальности: равномерное или нет. Определить пики, периоды активности и эпохи застоя (+по странам).
относительный уровень математиков
  1. Насколько сильно отличается Ньютон от своих современников в 17 веке, Арнольд ‒ от наших современников? (Вычислить по рейтингу).
  2. Разбить математиков на группы (по 10, 20, 30 ... 100 лет). Вычислить (1) расстояние в группе между всеми математиками, (2) между всеми и средним, (3) средний диаметр. Как эти расстояния меняются со временем, со странами?

Лекции[править]

  • /RAWGraph ‒ Инструмент RAWGraph.io для визуализации Викиданных
  • /QuickStatements — Пакетная обработка Викиданных

Работы[править]

читать
Review

This research deals with Cultural Context Content (CCC), that is articles of Wikipedia "related to the editors’ geographical and cultural context (i.e. their places, traditions, language, agriculture, biographies, etc.)". CCC is about 25% of articles in one Wikipedia edition. These articles are exclusive and have no equivalence across language editions. This research paper can be usefull for learning Wikidata, because it describes Wikidata properties grouped by country, location, language, author, affiliation and several taxonomic relations (part of, has part). The future research of this papercould be directed to the visualization of some results via Wikidata Query Service (see examples in the Wikiversity course "Research in programming Wikidata"). Very interesting results of this work are

Задачи по написанию скриптов (идеи)[править]

Вузы[править]

Корпуса текстов[править]

  • Анализ текстовых корпусов мира. См. text corpus.

Named after[править]

Свойство d:Property:P138 (named after, названо в честь).

Первая задача. Скрипты:

  1. Какие профессии "названцев" лидируют?
  2. Сравнить распределение лидерства названий по профессиям для двух стран.
  3. Выбрать какую-либо из отстающих отраслей (по числу улиц, названных в честь людей этой отрасли). Внести информацию в Викиданные, чтобы исказить полученную ранее картину, добиться того, чтобы эта отрасль (профессия) стала лидером.


  1. Что это за "различные объекты", кроме улиц? Привести список типов объектов, например: (1) Улица, (2) Танк, (3) Университет... с числом (1) улиц, названных именами людей, (2) танков с именами, (3) именованных университетов и так далее.
  2. Сравнить список типов объектов для России и какой-либо другой страны.

Литература[править]

ПетрГУ
arxiv.org

Ссылки[править]

SPARQL[править]

Pywikibot[править]

Викиданные[править]

Приложения Викиданных[править]

Jupyter Notebook[править]

Другие[править]