Программирование Викиданных

Материал из Викиверситета
Курс «Программирование Викиданных»

Факультет: Информационные технологии
Кафедра: Программирование, Веб-технологии


Пререквизиты:
Постреквизиты:


Преподаватель: Крижановский Андрей (обсуждение)


Силлабус
Ссылка: w.wiki/62E

Иконка программы Pywikibot.
Робот перевозчик материалов

Программирование Викиданных (с листингами, рисунками и упражнениями) — это курс, обучающий работе с Викиданными. Курс предназначен для студентов и преподавателей технических вузов, а также для школьников старших классов, углублённо изучающих информатику. В этом курсе вы познакомитесь с языками Python, SPARQL, системой Pywikibot, средой Викиданные.

Автором курса является Крижановский Андрей. Каждая глава курса представляет собой серию задач на одну тему. Решением поставленных задач, оформлением и описанием путей решения занимаются студенты Петрозаводского государственного университета в ходе выполнения работ по предметам «Интернет-математика» и «Автоматическая обработка текста».

Перевод завершённых глав публикуется в Английском Викиверситете в проекте Research in programming Wikidata. Курсу соответствует объект Викиданных d:Q110042825.

В формате LaTeX мы пишем в проекте wd_book на сайте GitHub. Последнюю версию русского и английского варианта книги в формате PDF можно скачать по ссылке.

Добро пожаловать![править]

На этой странице координируется работа студентов ПетрГУ, пишущих исследовательские статьи по программированию Викиданных.

Каждый студент, получивший задание, должен зарегистрироваться в Викиверситете или Википедии (см. правый верхний угол), это занимает несколько секунд и не требует получения подтверждения на e-mail. Для регистрации желательно выбрать реальное имя (латиницей или кириллицей), так чтобы ваши правки были легко идентифицируемы. Затем:

  • нажмите кнопку «править» напротив заголовка «Викиверситет (первый этап)» (ниже);
  • в конце той строки, где указана выбранная вами статья, напишите свой ник и имя так: 📖 [[User:Mary Ivanova|Иванова Мария Сергеевна]].

Приоритет у того, кто раньше указал своё имя в строке со спорной темой.

Ваша первая статья в Википедии. Видеоучебник создан студентами ПетрГУ в 2013 году.

Некоторые полезные ссылки для работы в в вики-проектах:

Общий обзор смотрите также в стандартном приветствии Шаблон:Привет. Главное помните: синяя ссылка — статья есть, красная — статьи нет, но нажав на неё, Вы попадёте на страницу, где её можно создать. У существующих же статей вверху есть закладка «Править», нажав которую, статью также можно редактировать.

Если у Вас появятся вопросы, можно их задавать прямо на странице обсуждения этого проекта.

Алгоритм работы[править]

Алгоритм работы для новых статей

Алгоритм доработки существующих статей:

  1. ProWD
  2. SPARQL — оформление скриптов
  3. Иллюстрации в Викиверситете
  4. LaTeX и kaobook + доклад по главам классам LaTeX kaobook
  5. Три SPARQL-задачи — придумываем и решаем задачи, доклады SPARQL Wikibooks
  6. Иллюстрация в LaTeX
  7. Статья в LaTeX на русском + листинги программ, оформление ссылок, индексирование
  8. Статья в LaTeX на английском

См. также доклады студентов.

Лекции[править]

Робот
Три крошечных заводных робота с экранчиками
Три крошечных заводных робота с телефонами
Три робота на батарейках
Испытание взаимодействия робота и космонавта при моделировании полета на Марс в сходных условиях в проекте "Moonwalk"

Принятые работы[править]

Список принятых работ. В какой-то мере это образцы для подражания. Статьи могут дорабатываться любыми участниками Викиверситета.

📖 — символ книги ставится перед именем редактора, работающего с LaTeX.

LaTeX + Викиверситет (второй этап)[править]

  • компьютерные программы
  • техника: корабли, воздушные суда, танки
  • технология, информатика

Викиверситет + La (промежуточный этап)[править]

  • кино, мультфильмы, телевидение
  • заповедники и ООПТ
  • космос

Викиверситет (первый этап)[править]

  • архивы
  • банки и коммерческие организации
  • войны и битвы
  • заповедники и ООПТ
  • катастрофы
  • кино, мультфильмы, телевидение
  • книги и литературные произведения, картины, музыка
  • компьютерные программы
  • образование (школы, вузы, институты)
  • СМИ, радио, издательства
разработанные программы, сайты

В процессе[править]

Статьи над которыми работа ещё не завершена. Чтобы выяснить, что именно осталось сделать — посетите страницу обсуждения соответствующей статьи.

  • география и лингвистика
  • страны и города
  • компьютерные программы, компьютеры
  • кино, мультфильмы, телевидение
  • СМИ, радио, издательства
  • история, персоны
  • книги и литературные произведения, картины, музыка

Темы на выбор (нулевой этап)[править]

Предложите свою тему или выберите одну из перечисленных тем ниже, указав свои данные следующим образом:

  • Название главы [[User:имя пользователя|Фамилия Имя Отчество]]

Можно продолжить работу, которая была начата студентами в предыдущем семестре (см. историю правок интересующей вас страницы).

  • языки и названия
  • медицина
  • COVID-19, Коронавирус — Экстраполяция взаимосвязанных кривых числа заражений COVID-19 на примере субъектов России
  • поселения, в том числе деревни и станицы
  • школы
  • вузы
  • институты, академии
  • религия
  • church — храмы и церкви
  • СМИ и издательства
  • операции, функции, парадоксы и теоремы
  • науки
  • войны и битвы
  • корабли, воздушные суда и танки
  • транспорт
  • выступления и радиопередачи
  • книги и литературные произведения, картины, музыка
  • красная книга (животные, растения)

Языкознание и литература[править]

  • корпус текстов
  • электронная библиотека
  • детский писатель

Математики[править]

Возможно, для поиска вклада учёных, кроме свойства "notable work", нужно будет воспользоваться solved by (P1136) или аналогичными (какими?).
Открытые задачи, связанные с математиками

+ связь возраста и наград в разных областях:

  1. Определить возраст (min, max, avg) получения первой награды. Меняется ли и как меняется этот возраст с каждым десятилетием?
  2. Работников каких областей математики награждают больше, чаше? Можно ли выделить разные эпохи в математике по превалирующим наградам в разных областях?
  3. Какие регионы чаще награждают?
  4. Выпускников каких вузов чаще награждают?

См. ещё задачи: Обсуждение:Программирование Викиданных/География математиков.

математики и время
  1. Суммарный индекс гениальности математиков по годам, векам. Распределение гениальности: равномерное или нет. Определить пики, периоды активности и эпохи застоя (+по странам).
относительный уровень математиков
  1. Насколько сильно отличается Ньютон от своих современников в 17 веке, Арнольд ‒ от наших современников? (Вычислить по рейтингу).
  2. Разбить математиков на группы (по 10, 20, 30 ... 100 лет). Вычислить (1) расстояние в группе между всеми математиками, (2) между всеми и средним, (3) средний диаметр. Как эти расстояния меняются со временем, со странами?

Работы[править]

читать
Review

This research deals with Cultural Context Content (CCC), that is articles of Wikipedia "related to the editors’ geographical and cultural context (i.e. their places, traditions, language, agriculture, biographies, etc.)". CCC is about 25% of articles in one Wikipedia edition. These articles are exclusive and have no equivalence across language editions. This research paper can be usefull for learning Wikidata, because it describes Wikidata properties grouped by country, location, language, author, affiliation and several taxonomic relations (part of, has part). The future research of this papercould be directed to the visualization of some results via Wikidata Query Service (see examples in the Wikiversity course "Research in programming Wikidata"). Very interesting results of this work are

Задачи по написанию скриптов (идеи)[править]

Вузы[править]

Корпуса текстов[править]

  • Анализ текстовых корпусов мира. См. text corpus.

Топонимия[править]

Named after[править]

Свойство d:Property:P138 (named after, названо в честь).

Первая задача. Скрипты:

  1. Какие профессии "названцев" лидируют?
  2. Сравнить распределение лидерства названий по профессиям для двух стран.
  3. Выбрать какую-либо из отстающих отраслей (по числу улиц, названных в честь людей этой отрасли). Внести информацию в Викиданные, чтобы исказить полученную ранее картину, добиться того, чтобы эта отрасль (профессия) стала лидером.


  1. Что это за "различные объекты", кроме улиц? Привести список типов объектов, например: (1) Улица, (2) Танк, (3) Университет... с числом (1) улиц, названных именами людей, (2) танков с именами, (3) именованных университетов и так далее.
  2. Сравнить список типов объектов для России и какой-либо другой страны.

Литература[править]

ПетрГУ
arxiv.org

Ссылки[править]

идеи на следующий год
  • OpenRefine — разобраться и описать его работу.
  • Выбрать статью о Викиданных и включить лучшее в обзорную главу.
  • RAWGraphs — каждый разбирает и объясняет работу на своих данных с одним из типов графиков.
в работу
  • b:en:SPARQL tutorial on Wikibooks — можно перевести и включить отдельные операторы.
  • Ivo Velitchkov. Buckets and Balls // strategic structures, 2020 // Корзины и мячи (Как сформулировать вопрос Викиданным. Введение) (получено разрешение от автора на перевод на русский язык)
  • Will Kent. What can querying Wikidata do for me? (Результаты какого вида можно получить из Викиданных) // September 27, 2021 (CC-BY-SA)
  • Knowledge Graphs, 2021, book kgbook.org
  • d:Category:WikiProjects — выбирать темы, у которых есть свой проект?..
прочее

Научные статьи для обзора[править]

SPARQL[править]

Видео[править]

Визуализация[править]

Visualization tools and tutorials:

Pywikibot[править]

Викиданные[править]

Приложения Викиданных[править]

Jupyter Notebook[править]

Другие[править]