Программирование Викиданных/Архивы

Материал из Викиверситета

Статья посвящена исследованию объекта Викиданных — "Архивы". С помощью SPARQL-запросов, вычисляемых на объектах типа "архивы" в Викиданных, решены такие задачи: выведен список всех архивов на английском и русском языках, построена карта существующих архивов по всему миру и построена карта архивов, расположенных в России до внесения изменений в свойства архивов, не имеющих координат на карте, и после. Сделаны выводы по поводу полноты Викиданных по данной теме и построена карта архивов мира после добавления данных.

Экземпляры объекта "Архив"[править]

Построим список всех архивов на английском и русском языках.

#List of archive in English and Russian
SELECT ?archive ?label_en ?label_ru 
WHERE {
  ?archive wdt:P31 wd:Q166118. #instance of archive
  ?archive rdfs:label ?label_en.
  ?archive rdfs:label ?label_ru.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
      }

SPARQL-запрос, 32 результата.

Наиболее полными и проработанными архивами на Викиданных являются: Архив Интернета, Викисклад, Президентская библиотека Рональда Рейгана.
Почти пустыми и малоинформативными архивами были: Национальный архив Республики Карелия, Федеральное архивное агентство, Российский государственный военный архив.

Среди отечественных архивов в Викиданных больше всего свойств по данным ProWD у Российского государственного архива экономики (12 свойств). Лидером по архивам всего мира является Internet Archive (32 свойства).

Распределение архивов на карте мира[править]

Покажем географическое местоположение архивов на карте мира на основе свойства "location", определим географические координаты архивов и нанесём архивы на карту мира.

#List of archives on the world map 
#defaultView:Map
#28 October 2017
SELECT ?archive ?archiveLabel ?location WHERE {
  ?archive wdt:P31 wd:Q166118. #instance of archive
  ?archive wdt:P625 ?location. #instance location of archive
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

SPARQL-запрос, 672 результата.

Рис. 1. 672 архива на карте мира на основе Викиданных на 28 октября 2017


По расположению архивов на карте мира видно, что большинство архивов на основе Викиданных на 28 октября 2017 расположены в в Европе.

Полнота Викиданных[править]

По данным категории List of archives in Russia Английской Википедии существует 5 архивов. По-видимому, в этой категории перечислен список крупных архивов России.

По данным категории List of national archives Английской Википедии список национальных архивов мира включает 147 архивов.

По данным портала "Архивы России" государственными и муниципальными архивами от учреждений на постоянное хранение принято около 1,5 млн единиц хранения[1]. Только в федеральные архивы поступило около 100 тыс. дел управленческой документации и свыше 100 тыс. дел по личному составу.

Всего стран мира насчитывается 193. По данным категории List of archives Английской Википедии насчитывается 190 стран, в которых есть архивы.

Можно посмотреть количество архивов в каждой стране мира. Для этого необходимо выполнить следующий скрипт.

SELECT ?archiveLabel (COUNT(?org) AS ?count) WHERE {
  ?org wdt:P31 wd:Q166118. #instance of archive
  ?org wdt:P17 ?country. #instance country of archive
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
GROUP BY ?country ?countryLabel
ORDER BY DESC(?count)

SPARQL-запрос, 70 результатов.

В результате программа выдает 70 стран, что говорит о недостаточной заполненности Викиданных применительно к архивам, потому что не у всех архивов заполнено свойство "государство". В первую десятку стран по количеству архивов вошли:

  1. Германия (486 архивов),
  2. Испания (141 архив),
  3. Болгария (110 архивов),
  4. Соединенное Королевство (75 архивов),
  5. Соединенные Штаты Америки (61 архив),
  6. Бельгия (54 архива),
  7. Россия (46 архивов) - после добавления данных, 2 архива - до работы,
  8. Польша (35 архивов),
  9. Швейцария (28 архивов),
  10. Нидерланды (26 архивов).

Заполнение Викиданных[править]

По скрипту, написанному выше, можно выяснить что в России было 9 архивов. И это говорит о недостаточности заполненных Викиданных в России, следовательно, это следует исправить.

Выполним программу по поиску этих 9 архивов.

#List of archive in Russia
#28 October 2017
SELECT ?archive?countryLabel WHERE {
  ?archive wdt:P31 wd:Q166118. #instance of archive
  ?archive wdt:P17 wd:Q159. #instance state Russia of archive
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

SPARQL-запрос, 9 результатов.

Покажем российские архивы на карте.

#List of archives in Russia 
#defaultView:Map
SELECT ?archive ?archiveLabel ?location WHERE {
  ?archive wdt:P31 wd:Q166118. #instance of archive
  ?archive wdt:P17 wd:Q159. #instance country Russia of archive
  ?archive wdt:P625 ?location.  #geographical coordinates of archive
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

SPARQL-запрос, 2 результата.

Рис. 2. Два российских архива на карте России на основе Викиданных на 28 октября 2017


Оказалось, что не все российские архивы, представленные в Викиданных, изображены на карте. Поэтому необходимо каждому отечественному архиву, представленному в Викиданных, добавить свойства: "instance of", "country", "coordinate location".

После добавления географических координат отечественным архивам отмечено 46 точек на карте.

#List of archives 
#defaultView:Map
#29 October 2017
SELECT ?archive ?archiveLabel ?location WHERE {
  ?archive wdt:P31 wd:Q166118. #instance of archive
  ?archive wdt:P17 wd:Q159. #instance country Russia of archive
  ?archive wdt:P625 ?location.  #geographical coordinates of archive
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

SPARQL-запрос, 46 результатов.

Рис. 3. 46 российских архивов на карте на основе Викиданных на 29 октября 2017


Построим карту мира с вновь добавленными отчечественными архивами.

#List of archives on the world map 
#defaultView:Map
SELECT ?archive ?location WHERE {
  ?archive wdt:P31 wd:Q166118.  #instance of archive
  ?archive wdt:P625 ?location.  #geographical coordinates of archive
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

SPARQL-запрос, 723 результата.

Рис. 4. 723 архива на карте мира на основе Викиданных на 29 октября 2017


Будущая работа[править]

  • Подсчитать и вывести список основателей архивов мира.
  • Нарисовать архивы на карте мира с указанием объёма архива (размер кружка на карте соответствует объёму архива).
  • Подсчитать объём архивов по континентам.

Упражнения[править]

1 Соотнесите названия университетов с их логотипами:

1
2
3
4


1 2 3 4
Архив Интернета
Викисклад
Национальный архив Каталонии
Архив Ландескичелич Кассель

2 Расставьте страны в порядке убывания количества архивов по странам (1 - означает самое маленькое количество архивов в стране):

1 2 3 4 5 6
Германия
Испания
США
Россия
Финляндия
Норвегия


SPARQL-запросы с ответами:

Примечания[править]

Литература[править]

Ссылки[править]