Перейти к содержанию

Программирование Викиданных/Радиопрограммы

Материал из Викиверситета

Аннотация

[править]

Радиопрограмма — это средство массовой информации, представляющее собой совокупность звуковых сообщений и материалов. Данная статья посвящена исследованию радиопрограмм на основе Викиданных. Для исследования спроектированы SPARQL-запросы, работающие с объектами Викиданных типа “radio program”. Получен список всех радиопрограмм, описанных в Викиданных. В статье присутствует результат анализа полноты Викиданных.

Также выделены сопутствующие классы классу "radio program", этими классами являются "подкаст" и "радиопостановка". Подсчитано количество действующих радиопрограмм в каждый год: с начала их существования и по сей день. Определены наиболее популярные жанры радиопрограмм, подкастов и радиопостановок в мире и в России. Детально разобраны радиопрограммы по свойству даты начала существования и даты конца существованияю. Произведено сравнение британских и российских радиопрограмм. Иследована зависимость между появлением/исчезновением радиопрограмм и ожидаемой продолжительностью жизни/индексом человеческого развития. Сделан небольшой обзор радиоведущих, а именно: сколько различных радиопрограмм они вели. Намечена дальнейшая работа.

Сопутствующие классы, исследуемому объекту "радиопрограмма" через свойство "экземпляр".

[править]

Определим список классов, которые являются сопутствующими объекту "радиопрограмма". Сопутствующими мы будем называть те классы, которые встречаются в свойстве "экземпляр" у радиопрограмм, вместе с классом "радиопрограмма" (наш исследуемый объект - радиопрограмма, но также радиопрограмма относится к классам, поэтому объектом мы будем называть именно элемент нашего исследования).

К примеру: радипрограмма Miranda является частью классов television series и radio program. В этом разделе мы выявим наиболее часто встречающиеся сопутствующие классы.

Прежде чем составить таблицу сопутствующих классов, получим их с помощью следующего SPARQL-запроса:

# List of classes accompanying the radio program in the property 'instance of'
SELECT ?inst ?instLabel (COUNT(?radio) as ?sumRadio)
WHERE{
  ?radio wdt:P31 wd:Q1555508;   # instance of radio program
  wdt:P31 ?inst.   # other objects in instance of radio program
  ?inst wdt:P31 ?test.   # instance of other objects in instance of radio program
  ?test wdt:P31 ?typ.   # instance of instance of other objects in instance of radio program
  
  SERVICE wikibase:label{bd:serviceParam wikibase:language "ru,en"}
}
GROUP BY ?inst ?instLabel
ORDER BY DESC (?sumRadio)

Составим таблицу, с наиболее часто встречающимися классами, будем брать классы, у которых нашлось более 4 экземпляров:

Наиболее часто встречающиеся сопутствующие классы объекту "радиопрограммы" и их количество
Номер Название класса Количество
1 подкаст 87
2 радиопостановка 60
3 телесериал 18
4 мини-сериал 12
5 новостная программа 8
6 серия радиопередач 7
7 новости 6
8 новостная статья 6

Видим, что только первые два сопутствующих класса достаточно часто используются в Викиданных, поэтому вместе с радиопрограмми будем рассматривать "подкасты" (Q24634210) и "радиопостановки" (Q2635894).

Экземпляры объекта "Радиопрограммы"

[править]

Построим список всех радиопрограмм на английском и русском языках.

#List of radio program
SELECT ?radio_programLabel 
WHERE 
{ 
?radio_program wdt:P31 wd:Q1555508.  # instance of radio program
SERVICE wikibase:label { bd:serviceParam wikibase:language "ru". }
}

SPARQL-запрос, 10117 радиопрограмм на 2022 год.

Для более точно анализа полноты радиопрограмм, найдем общее количество радиостанций, на которых транслируются радиопрограммы. Для этого возьмем аналогично предыдущему запросу свойство, только в качестве объекта возьмем радиостанцию (Q14350):

#List of radio stations
SELECT ?radioStatLabel 
WHERE 
{ 
?radioStat wdt:P31 wd:Q14350.  # instance of radio station
SERVICE wikibase:label { bd:serviceParam wikibase:language "ru". }
}

С помощью SPARQL-запроса получили 28256 радиостанций на 2022 год.

"Хорошие" и "плохие" объекты "Радиопрограммы"

[править]

Построим список всех радиопрограмм, связанных с Россией.

#List of Russian radio program in Russian
SELECT ?radio_programLabel
WHERE
{
?radio_program wdt:P31 wd:Q1555508.   # instance of radio program                                 
{ ?radio_program wdt:P495 wd:Q34266 } UNION  # Russian Empire
{ ?radio_program wdt:P495 wd:Q15180 } UNION  # Soviet Union
{ ?radio_program wdt:P495 wd:Q159 }.         # Russia
SERVICE wikibase:label { bd:serviceParam wikibase:language "ru". }
}

SPARQL-запрос, 70 радиопрограмм, связанных с Россией (Российская Федерация, СССР, Российская Империя) на 2022 год.

Примеры хороших, полных радиопрограмм:

  1. Miranda;
  2. Opry;
  3. This American Life.

Примеры радиопрограмм, которые были плохими, неполными:

  1. Радионяня;
  2. В рабочий полдень;
  3. Луна-44.

Заполнение жанра и привязка к радиостанциям

[править]

Заполним сотню объектов отечественных радиопрограмм и укажем в каждом из них привязку к стране и жанру.

# List of radio programs with genre and country of origin
SELECT ?radio ?radioLabel ?countryLabel 
WHERE 
{
    ?radio wdt:P31 wd:Q1555508. # instance of radio program
    ?radio wdt:P136 ?genre. # has genre
    ?radio wdt:P495 ?country. # country of origin
    SERVICE wikibase:label { bd:serviceParam wikibase:language "ru,en,[AUTO_LANGUAGE]" }
}

SPARQL-запрос, получено 240 радиопрограмм, у которых есть свойство "жанр" и "страна происхождния" на 2017 год.

SPARQL-запрос, получено 494 радиопрограмм, у которых есть свойство "жанр" и "страна происхождния" на 2022 год.

Связь радиопрограмм с их жанрами

На скрипте ниже указаны только радиопрограммы, связанные с Россией.

#List of Russian radio programs with genre and country of origin
SELECT ?radio_programLabel ?form
WHERE 
{
    ?radio_program wdt:P31 wd:Q1555508. # instance of radio program
    ?radio_program wdt:P136 ?genre. # radio programs with genre
    {?radio_program wdt:P495 wd:Q15180 } UNION
    {?radio_program wdt:P495 wd:Q159}. # radio programs from USSR or Russia
    SERVICE wikibase:label { bd:serviceParam wikibase:language "ru" }
    OPTIONAL {
		?genre rdfs:label ?form
		filter (lang(?form) = "ru")
	}
}

SPARQL-запрос, 107 радиопрограмм, со страной происхождения (СССР, РФ), сгруппированным по жанрам на 2022 год.

Связь 110 радиопрограмм относящих к России и 19 жанров

Рисунок выше описывает связь отечественных радиопрограмм с соответствующими ими жанрами.

Наиболее популярные жанры радиопрограмм, подкастов и радиопостановок в мире и в России

[править]

Определим наиболее популярные жанры радиопрограмм, подкастов и радиопостановок в мире. Для этого будет рассматривать уже упомянутые три объекта, у которых есть свойство жанр (P136). Просуммируем все уникальные виды жанров в следующем SPARQL-запросе, который получает 327 результата, где наиболее популярный жанр-комедийный и юмористический подкаст (комедийный подкаст), с результатом в 203:

#sum of unique genres of radio programs podcasts and radio shows by genre
SELECT ?genreLabel (COUNT(?genre) as ?sumGenre)
WHERE 
{
    {?radioPodcastSta wdt:P31 wd:Q1555508} UNION  # instance of radio program
    {?radioPodcastSta wdt:P31 wd:Q24634210} UNION # instance of podcast
    {?radioPodcastSta wdt:P31 wd:Q2635894}.       # instance radioPost
    ?radioPodcastSta wdt:P136 ?genre.             # has genre
  
    SERVICE wikibase:label { bd:serviceParam wikibase:language "ru,en,[AUTO_LANGUAGE]" }
}
GROUP BY ?genreLabel
ORDER BY DESC (?sumGenre)

Ниже представленна диаграмма, на которой отмечено количество наиболее популярных жанров радиопрограмм, подкастов, радиопостановок в мире. Ввиду большо числа полученных результатов, на диаграмме отображены жанры, число которых больше 25.

Диаграмма суммы уникальных жанров радиопрограмм, подкастов, радиопостановок по жанрам

Теперь рассмотрим самый популярный жанр в России (СССР и Российскую Империю тоже включаем в рассмотрение): Для этого к нашему предыдущему SPARQL-запросу добавим несколько строчек о стране происхождения, будем использовать свойство: страна происхождения (P495). Не у всех радиопрограмм, подкастов и радиопостановок существует свойство страны происхождения, поэтому полученных результатов будет заметно меньше.

Получим новый SPARQL-запрос

#sum of unique genres of radio programs podcasts and radio shows by genre in Russian
SELECT ?genre ?genreLabel (COUNT(?genre) as ?sumGenre)
WHERE 
{
    {?radioPodcastSta wdt:P31 wd:Q1555508} UNION  # instance of radio program
    {?radioPodcastSta wdt:P31 wd:Q24634210} UNION # instance of podcast
    {?radioPodcastSta wdt:P31 wd:Q2635894}.       # instance radioPost
    ?radioPodcastSta wdt:P136 ?genre.             # has genre
    ?radioPodcastSta wdt:P495 ?country. 
    
  { ?radioPodcastSta wdt:P495 wd:Q34266 } UNION   # Russian Empire
  { ?radioPodcastSta wdt:P495 wd:Q15180 } UNION   # Soviet Union
  { ?radioPodcastSta wdt:P495 wd:Q159 }.          # Russia
    SERVICE wikibase:label { bd:serviceParam wikibase:language "ru,en,[AUTO_LANGUAGE]" }
}
GROUP BY ?genre ?genreLabel
ORDER BY DESC (?sumGenre)

Получим следующую диаграмму:

Диаграмма суммы уникальных жанров Российских радиопрограмм, подкастов, радиопостановок по жанрам

На основе полученных данных, можно сделать вывод о различии наиболее популярных жанров среди жителей России (СССР, Российской империи) и жителей остального мира. Из совпадения можно выделить жанр "ток-шоу" (из первой пятерки).

Зависимость числа действующих радиопрограмм от даты (года)

[править]

Построение графика зависимости числа передач от года (по всем странам). График получаем путем выполениния двух SPARQL-запросов. В первом запросе мы получаем информацию о радиопрограммах, которые имеют свойства даты начала существования программы (даты основания) и даты окончания (даты прекращения существования). Во втором запросе мы получаем информацию о радиопрограммах, которые имеют дату начала существованию, а также существуют по нынешний день (день выполнения запроса).

#List of radio programs which have startTime or Inception and dissolved or endTime
SELECT DISTINCT ?radioProgram ?radioProgramLabel ?startTime ?inception ?dissolved ?endTime  
WHERE
{
    ?radioProgram wdt:P31 wd:Q1555508. #instance of
    {?radioProgram wdt:P571 ?inception} UNION #radioProgram with inception
    {?radioProgram wdt:P580 ?startTime}. #startTime

    {?radioProgram wdt:P576 ?dissolved} UNION #radioProgram with desolved
    {?radioProgram wdt:P582 ?endTime}. #endTime  
    SERVICE wikibase:label { bd:serviceParam wikibase:language "ru, en" }
}

SPARQL-запрос, 249 радиопрограмм, у которых есть дата начала существования и дата конца, то есть радиопрограммы, прекратившие своё существование по состоянию на 2022 год.

#List of radioProgram which haven't end time or dissolved
SELECT ?radioProgram ?radioProgramLabel ?startTime ?inception
WHERE 
{
    ?radioProgram wdt:P31 wd:Q1555508.
    {?radioProgram wdt:P571 ?inception} UNION #radioProgram with inception and Start time
    {?radioProgram wdt:P580 ?startTime}. 
    
    SERVICE wikibase:label { bd:serviceParam wikibase:language "ru, en" }
    FILTER ( NOT EXISTS { ?radioProgram  wdt:P582 [] } ) # active radio, without "end time"
    FILTER ( NOT EXISTS { ?radioProgram  wdt:P576 [] } ) # active radio, without "dissolved"
}

SPARQL-запрос, 378 радиопрограмм, работающих в 2023 году.

Количество действующих радиопередач по годам на 2022 год.

По результатам запроса (на графике) можно наблюдать линейный рост числа радиопрограмм с течением времени.

Появление и исчезновение

[править]

Дополнение рассматриваемых радиопрограмм

[править]

Рассмотрим появление и закрытие (исчезновение) радиопрограмм по двум странам. Россию и СССР объединим в одну группу, а в другой группе будут британские радиопрограммы. На момент начала написания данного раздела у большого числа рассматриваем радиопрограмм отсутствовало свойство "start time", что сильно сказывалось на полученных данных, которых было крайне мало. Для начала мы должны заполнить наши объекты нужными свойствами, чтобы перейти к следующему этапу. С помощью SPARQL-запроса, мы определяем количество британских или российских радиопрограмм, у которых нет свойства "start time". Затем мы дополняем необходимые свойства "start time" и "end time", после чего радиопрограммы становятся полные для нашего запроса. Для небольшого числа радиопрограмм не получилось найти упоминания даты начала трансляции радиопрограммы, поэтому такие радиопрограммы убраны из рассмотрения.

#List of GB or Russian radio programs that we need to supplement
SELECT ?radio ?radioLabel
WHERE{
  ?radio wdt:P31 wd:Q1555508.           # instance of radio program
  #?radio wdt:P495 wd:Q145.             # GB
  {?radio wdt:P495 wd:Q15180}           # Russia + USSR
  UNION {?radio wdt:P495 wd:Q159}.
  
  MINUS {?radio wdt:P580 ?startTime}.   #without startTime property                
  FILTER (?radio != wd:Q4729778 && ?radio != wd:Q4943128          #  without Great Britan radio programs which don't have wikipedia page and
          && ?radio != wd:Q4943163 && ?radio != wd:Q5159039       #  information about startTime
          && ?radio != wd:Q5177196 && ?radio != wd:Q5188656 
          && ?radio != wd:Q6820391 && ?radio != wd:Q16994934 
          && ?radio != wd:Q16995119 && ?radio != wd:Q16245242 
          && ?radio != wd:Q16245880 && ?radio != wd:Q16248127 
          && ?radio != wd:Q26269682 && ?radio != wd:Q116312583 
          && ?radio != wd:Q107285323 && ?radio != wd:Q109901777 
          && ?radio != wd:Q88226879 && ?radio != wd:Q109473416 
          && ?radio != wd:Q109901738 && ?radio != wd:Q7728479 
          && ?radio != wd:Q7746325 && ?radio != wd:Q7239025 
          && ?radio != wd:Q7355361 && ?radio != wd:Q7580003 
          && ?radio != wd:Q8035460 && ?radio != wd:Q8035743 
          && ?radio != wd:Q13129366 && ?radio != wd:Q19874826 
          && ?radio != wd:Q57608008).
  
  FILTER(?radio != wd:Q43030945 && ?radio != wd:Q43031907         #  without Russian and USSR radio programs which don't have wikipedia page and
         && ?radio != wd:Q43032152 && ?radio != wd:Q43032609      #  information about startTime
         && ?radio != wd:Q43032896 && ?radio != wd:Q43033082 
         && ?radio != wd:Q43033263 && ?radio != wd:Q43033472 
         && ?radio != wd:Q43033652 && ?radio != wd:Q43033837 
         && ?radio != wd:Q43034123 && ?radio != wd:Q43034218 
         && ?radio != wd:Q4157342 && ?radio != wd:Q43038910 
         && ?radio != wd:Q43039029 && ?radio != wd:Q43039142 
         && ?radio != wd:Q43040574 && ?radio != wd:Q43040661 
         && ?radio != wd:Q43040769 && ?radio != wd:Q43040860 
         && ?radio != wd:Q43040985 && ?radio != wd:Q43041090 
         && ?radio != wd:Q43041195 && ?radio != wd:Q43041326 
         && ?radio != wd:Q43042325 && ?radio != wd:Q43042402 
         && ?radio != wd:Q43042496 && ?radio != wd:Q43042552 
         && ?radio != wd:Q43042592 && ?radio != wd:Q43042694 
         && ?radio != wd:Q43042757 && ?radio != wd:Q43034567 
         && ?radio != wd:Q43034690 && ?radio != wd:Q43034836 
         && ?radio != wd:Q43035009 && ?radio != wd:Q43035111 
         && ?radio != wd:Q43036117 && ?radio != wd:Q43036315 
         && ?radio != wd:Q43036441 && ?radio != wd:Q43036623 
         && ?radio != wd:Q43036760 && ?radio != wd:Q43036905 
         && ?radio != wd:Q43037093 && ?radio != wd:Q43037219 
         && ?radio != wd:Q43037370 && ?radio != wd:Q43038046 
         && ?radio != wd:Q43038179 && ?radio != wd:Q43038301 
         && ?radio != wd:Q43038439 && ?radio != wd:Q43038784 
         && ?radio != wd:Q43042982 && ?radio != wd:Q65448224 
         && ?radio != wd:Q43041452 && ?radio != wd:Q43041538 
         && ?radio != wd:Q43041754 && ?radio != wd:Q43041830 
         && ?radio != wd:Q43042076 && ?radio != wd:Q43042242 
         && ?radio != wd:Q43042817 && ?radio != wd:Q43042902).
  SERVICE wikibase:label {bd:serviceParam wikibase:language "ru,en"}
}

Российские радиопрограммы зачастую не являются полными, и объект радиопрограммы не содержит необходимых для заполнения источников, поэтому такие радиопрограммы мы игнорируем и убираем из рассмотрения за неточностью и нехваткой данных. Аналогично с британскими радиопрограммами, но их число намного больше.

При выолнении данного пункта было рассмотренно 62 российские радиопрограммы, большинство из которых дополнить не удалось ввиду недостатка данных, а также рассмотренно 360 британских радиопрограмм, большая часть которых была успешно дополненна. Запрос, указанный выше, на 04.03.2023 выдает 0 результатов, это означает, что все радиопрограммы были рассмотрены.

Сравнение появления (исчезновения) британских и российских радиопрограмм

[править]

После выявления неполных радиопрограмм и их дополнения, можно начинать выполнять анализ. Мы будем рассматривать российские и британские радиопрограммы.

Построим график появления, а также исчезновения радиопрограмм, используя свойства start time и end time. Викиданные уже считаем полными, так как мы заполнили объекты необходимыми свойствами. Считать количество радиопрограмм в каждой стране будем по пятилетками. Далее полученные данные будем заносить в таблицу, по ней затем построим график. Следующий SPARQL-запрос подсчитывает количество радиопрограмм, которые появились (или исчезли) по пятилеткам для Великобритании (и России + СССР).

#Number of new radio programes by year for a given country
SELECT (STR(?year5) AS ?five_year) (COUNT(?radio) AS ?radioCount)
WHERE {                                 
  ?radio wdt:P31 wd:Q1555508.          # instance of            
  ?radio wdt:P495 wd:Q145.             # Great Britan
  #{?radio wdt:P495 wd:Q15180}         # Russia + USSR
  #UNION {?radio wdt:P495 wd:Q159}.
  
  ?radio wdt:P580 ?startTime.          # startTime
  BIND(YEAR(?startTime) AS ?year) 
  
  #?radio wdt:P582 ?endTime.           # end Time
  #BIND(YEAR(?endTime) AS ?year)
  BIND(FLOOR(?year/5)*5 AS ?year5)     # count for each 5 years
  SERVICE wikibase:label {bd:serviceParam wikibase:language "ru,en"}
} 
GROUP BY ?year5
ORDER BY ?year5

Получим следующий график:

Число появившихся и исчезнувших радиопрограмм России и Великобритании по пятилеткам

На полученном графике можно увидеть необычный результат. Во-первых, на графике присутствует лишь небольшая доля российских (советских) радиопрограмм, со стороны Великобритании - большая часть радиопрограмм, по которым прослеживается пропорциональный рост двух графиков. Во-вторых, резкий скачок графика в 2005-2010 годах. Первую часть не очевидного результата можно объяснить неполнотой представления российских радиопрограмм в Викиданных. О большей части радиопрограмм России пока не написано статей в Википедии. По данным следующей статьи: радио России можно наблюдать количество действующих радиопрограмм России, но при анализе данных, ввиду их неполноты данных, нельзя получить необходимую информацию для сравнения. Вследствие этого мы не можем определить ни дату начала транслирования радиопрограммы, ни прекращение её работы. Дополним, что в России в целом существует (и существовало) меньше радиопрограмм, чем в Великобритании, и это нашло отражение на этом графике даже при неполных данных. Следующие статьи подтверждают наши слова: "Всероссийская государственная телевизионная и радиовещательная компания", "Список лет на британском радио", "Список русскоязычных радиостанций", "Список радиопрограмм Великобритании", "История развития радио в Великобритании".

Рассмотрим пик графика в 2005 - 2010 годах. Чтобы понять, что произошло с радио в Великобритании, нужно обратиться к истории. "Период с конца XX — начала XXI веков был временем коренных, революционных изменений в британской модели вещания. До 1970 года всё радиовещание было сосредоточено в одной вещательной компании — Британской вещательной корпорации (BBC) и было национальным" [1]. В 1973 году решением парламента учреждено частное (коммерческое) радиовещание, которое финансируется рекламодателями. «Революция» в британском теле- и радиовещании произошла в 1991 году. "По мнению правительства Тэтчер, британское вещание должно было стать более конкурентоспособным на международной арене и готовым к переходу в век высоких технологий и многоканального вещания. По их мнению этому мешала бюрократизация организации Би-би-си. А также правительство Тэтчер преследовало мысль, что телевидение и радио — это общественные трибуны, где должны быть представлены разные точки зрения. Решением этого конфликта был аукцион лицензий, прошедший в октябре 1991 года. Это принесло много новых коммерческих радиопрограмм, а также послужило изменению общенациональных" [1]. Также в 2002 году Би-би-си запустила 4 новых радиостанции. Это дало мощнейший толчок развитию радиовещания. Появилось множество новых радиопрограмм, которые стали охватывать больше интересов людей. Из-за введения коммерческих радиопрограмм, стало проще попасть на рынок. Все вышеописанное послужило резкому росту графика в 2005 - 2010 годах. После 2010 года можно наблюдать резкий спад графика до нынешнего времени. Это можно объяснить тем, что в Википедию попадают только известные радиопрограммы, но радиопрограмма не может сразу стать известной, для этого необходимо какое-то время. Вдобавок к этому, необходимо, чтобы кто-то написал статью про эту радиопрограмму. Это объясняет постепенный спад числа объектов при движении в настоящее.

Радиопрограммы, ожидаемая продолжительность жизни, индекс человеческого развития

[править]

Проверим гипотезу: когда продолжительность жизни возрастает (аналогично для индекса человеческого развития) (), тогда появляется больше радиостанций, чем закрывается. Гипотеза заключается в том, что есть положительная корреляция между продолжительностью жизни и разностью появившихся и исчезнувших радиопрограмм. Под дельтой ожидаемой продолжительности жизни (индекса человеческого развития) понимается (), для какой либо страны в заданный год. Проверять гипотезу будем на примере Великобритании, ввиду заполненности викиданных.

Зависимость между числом радиопрограмм и ожидаемой продолжительностью жизни

[править]

Для получения данных об ожидаемой продолжительности жизни по годам используем следующий SPARQL-запрос:

# List of countries with life expectancy (property) and point in time (qualifire)
SELECT ?country ?countryLabel ?lifeExpectancy ?pointInTime ?year
WHERE
{
    VALUES ?country {wd:Q145}.
    ?country wdt:P31 wd:Q6256.    # instance of country
    ?country p:P2250 [ps:P2250 ?lifeExpectancy; pq:P585 ?pointInTime] # life expectancy and point in time
             
    BIND(YEAR(?pointInTime) AS ?year)
    SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
}
ORDER BY (?country)

Также возьмем необходимые данные по появившимся и исчезнувшим радиопрограммам Великобритании по годам, используя запросы, написанные в разделах выше. На основе имеющихся данных, получим следующий график (из-за небольшой дельты ожидаемой продолжительности жизни, увеличим ее в десять раз на графике, для более наглядного результата):

График появившихся, исчезнувших радиопрограмм Великобритании, их разница и дельта ожидаемой продолжительности жизни, умноженная на 10

По полученному графику трудно сказать, есть ли корреляция между двумя рассматриваемыми величинами (разностью появившихся и исчезнувших радиопрограмм Великобритании и ожидаемой продолжительности жизни). Для этого проверим связь двух величин, используя RStudio, вычислим коэффициент корреляции двух величин и значение p-value. Коэффициент корреляции данных величин составляет: , а значение , что не удовлетворяет допустимому уровню значимости (0,1). Взаимосвязь двух величин получилась слабая. Но по нашей гипотезе нас устраивает связь увеличения (уменьшения) радиопрограмм и соответствующей положительной (отрицательной) дельты, для этого заменим все положительные значения на единицу, а отрицательный на минус единицу. Затем снова проверим взаимосвязь двух величин. Коэффициент корреляции для новых величин составляет: , а значение , что не удовлетворяет допустимому уровню значимости (0,1). Взаимосвязь для новых величин получилась также слабая, что опровергает нашу гипотезу о связи ожидаемой продолжительности жизни и положительной разности радиопрограмм.

Зависимость между числом радиопрограмм и индексом человеческого развития

[править]

Для получения данных об ожидаемой продолжительности жизни по годам используем следующий SPARQL-запрос:

# List of countries with human development index (property) and point in time (qualifire)
SELECT ?country ?countryLabel ?humanDevelopment ?pointInTime ?year 
WHERE
{
    VALUES ?country {wd:Q145}.    # Great Britain
    ?country wdt:P31 wd:Q6256.    # instance of country
    ?country p:P1081 [ps:P1081 ?humanDevelopment; pq:P585 ?pointInTime] # Human Development and point in time
             
    BIND(YEAR(?pointInTime) AS ?year)
    SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
}
ORDER BY (?country)

Также возьмем необходимые данные по появившимся и исчезнувшим радиопрограммам Великобритании по годам, используя запросы, написанные в разделах выше. На основе имеющихся данных, получим следующий график (из-за небольшой дельты ожидаемой продолжительности жизни, увеличим ее в сто раз на графике, для более наглядного результата):

График появившихся, исчезнувших радиопрограмм Великобритании, их разница и дельта индекса человеческого развития, умноженная на 100

По полученному графику трудно сказать, есть ли корреляция между двумя рассматриваемыми величинами (разностью появившихся и исчезнувших радиопрограмм Великобритании и индексом человеческого развития). Для проверки наличия связи, будем использовать тот же метод, что и в пункте выше. Коэффициент корреляции данных величин составляет: , а значение , что не удовлетворяет допустимому уровню значимости (0,1). Взаимосвязь для величин получилась также слабая, что также опровергает нашу гипотезу о связи индекса человеческого развития и положительной разности радиопрограмм.

Радиоведущие

[править]

Представленный ниже скрипт выводит список всех радиопрограмм, у которых есть свойство - "ведущий".

# List of radio programs with presenter
SELECT DISTINCT ?radio ?radioLabel ?presenter ?presenterLabel
WHERE
{
  ?radio wdt:P31 wd:Q1555508;  # instance of radio program
         wdt:P371 ?presenter. # radio program with presenter
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ru, en, [AUTO_LANGUAGE]" }
}

SPARQL-запрос, 1275 ведущих радиопрограмм, которые были указанны в качестве ведущих каких-либо радиопрограмм с 1920 по 2022 год.

Посчитаем, число радиоведущих, которые вели разное количество радиопередач. Воспользуемся следующим SPARQL-запросом. Этот запрос выводит список ведущих, а также подсчитывает число раодпрограмм, которые они вели.

#This query counts the number of broadcasts a given speaker has hosted
SELECT ?presenter ?presenterLabel (COUNT(?radioProgram) as ?countRadioProgram) 
WHERE
{
?radioProgram wdt:P31 wd:Q1555508. # instance of radio program
?radioProgram wdt:P371 ?presenter. # radioProgram with presenter

SERVICE wikibase:label { bd:serviceParam wikibase:language "ru, en" }
}
GROUP BY ?presenter ?presenterLabel

Далее, сделаем подсчет полученных данных и составим круговую диаграмму, для наглядности результата.

Процентное соотношение радиоведущих, которые вели от 1 до 5 радиопрограмм. 2022.

На диаграмме, большая часть радиоведущих (90,23%) вели всего одну радиопрограмму, остальная часть - 2 и более.

Полнота Викиданных

[править]

На сайте радиопортала Radio.ru[2] в 2017 году насчитывается более 51 000 радиостанций в мире. Таким образом, даже если на каждой из них идёт хоть одна радиопередача, то это как минимум 51 тысяча программ. По результатам запроса, который подсчитывал радиопрограммы всего мира, получилось всего 5249 радиопрограмм. Иными словами, нашлось всего одна десятая фактического количества радиопрограмм, что показывает неполноту Викиданных.

Если говорить исключительно о русских радиопрограммах, то запрос выдает всего 5 результатов, в то время, как на том же портале Radio.ru[2] пишут, что самое большое количество сетевых радиостанций в 2015 году зафиксировано в Екатеринбурге — 36 штук, а это только один город. А в России 1124 города.

Будущая работа

[править]
  1. Определить, на какую букву начинается большинство названий радиопрограмм (рассматривается английский алфавит).
  2. Найти программы с количеством ведущих равным одному, более одного. Результаты представить на гистограмме.
  3. Отобразить фотографии (изображения) радиопрограмм для детей.

Упражнения

[править]

1 К каким жанрам относится большинство российских радиопрограмм?

Музыкальный;
Детское радио;
Развлекательный;
Спортивный.

2 Сколько насчитывается радиостанций в мире на 2017 год?

27 000;
44 000;
51 000.

3 Радиопрограмма - это

Приложение на телефон;
Средство массовой информации;
Магнитофон в машине.


Примечания

[править]

Литература

[править]