Обсуждение:Программирование Викиданных/Виды спорта

Содержимое страницы недоступно на других языках.
Материал из Викиверситета

Таблица Олимпийских видов спорта с иконками[править]

@Антон, Вы написали замечательный скрипт 6GJb. Он мне особенно нравится потому, что вызывает вопросы, которые я поставлю, а Вы попробуете ответить.

По мелочи: «олимпийские виды спорта» пишется с маленькой буквы, в отличие от «Олимпийских игр» (это название), см. текст статьи w:Олимпийские виды спорта.

По скрипту 6GJb:

  1. Скрипт возвращает 45 олимпийских видов спорта с иконками. Если я закомментирую строку 8 (# ?s wdt:P2910 ?icon. # with icons), то я получу 50 видов спорта, например Ачери-биатлон. Что это за 5 олимп. видов без иконки? Опишите этот казус в статье и приведите своё объяснение — почему так. Вообще говоря, 50 видов — это странно, поскольку в следующем скрипте 6FhP Вы получаете один (кстати, сегодня уже два) вид(а) спорта без иконки.
  2. Если закомментировать строку 7 (то есть получаем любые виды спорта, не только олимпийские) и «поломаем» (или удалим) строку 2 (чтобы получить список), то получаем 94 любых видов спорта с иконками. Мне кажется, это несколько противоречит гипотезе следующего раздела. Стоит это описать в статье в следующем разделе и дать своё толкование этому феномену. Придётся или скорректировать скрипт или изменить выводы о гипотезе. --Andrew Krizhanovsky (обсуждение) 09:59, 27 января 2023 (UTC)[ответить]

Кстати, в этом скрипте 6GJb предлагаю в строку SELECT добавить ?s. Это позволит получать в выводе гиперссылку на объект Викиданных. Это удобно. --Andrew Krizhanovsky (обсуждение) 10:03, 27 января 2023 (UTC)[ответить]

1. Если не комментировать 8 строку, а написать команду OPTIONAL{ ?s wdt:P2910 ?icon. # with icons} и удалить 2-ю строку - "#defaultView:ImageGrid", то будет выдано 53 результата, и будет видно у каких видов спорта иконок нет.
Прошелся по всем таким видам спорта:
  • Перетягивание каната является видом спорта исключенным из Олимпийских согласно статье «Олимпийские виды спорта».
  • Сёрфинг был признан Олимпийским видом спорта совсем недавно в 2021 году, согласно статье о нем на Википедии. Возможно, иконку еще не успели добавить в проект ВикиДанных и Википедии
  • Лыжный спорт не является отдельным видом спорта, а является подклассом, соответственно, отдельной иконки у него нет.
  • То, что у синхронного плавания нет иконки - это ошибка, т.к. на странице данного вида спорта в Википедии иконка есть.
  • У спортивного скалолазания - тоже ошибка скорее всего, иконки нет ни на ВикиДанных, ни на странице в Википедии, но при этом на ВикиМедиа есть - загруженная иконка в категории Sport climbing
  • У скейтбординга тоже ошибка, т.к. на ВикиМедиа иконка есть
  • У гребли на каное - нет иконки на ВикиДанных, есть иконка на ВикиПедии, только полное название "Гребля на байдарках и каноэ"
  • Один из видов спорта, которые получены в результате запроса - Q114729327, не имеет названия ни на английском, ни на русском языке, только изображение - судя по изображению биатлон, но биатлон уже есть в списке с иконкой. Значит, возможно, это просто ошибочно созданная страница, не до конца заполненная.
2. Здесь согласен. Выводы в следующей части - не верные. Переделаю
Скрипт переделал с учетом добавления "?s" - вот обновленный Akovin (обсуждение) 09:35, 1 февраля 2023 (UTC)[ответить]
  • @Антон, отличная работа! Поскольку в этом разделе мы получаем не совсем "таблицу", то название раздела стоит изменить. И заменить слово "таблица" в тексте раздела на что-то более подходящее.
  • У картинки в статье должна быть подпись (по-русски). У той же иллюстрации commons:File:Olympic types of sport with icons.png на Викискладе сейчас не хватает описания на русском, есть только английское описание. --Andrew Krizhanovsky (обсуждение) 17:30, 1 февраля 2023 (UTC)[ответить]

Проверяем гипотезу о том, что «свойство иконка есть только у тех видов спорта, которые относятся к олимпийским»[править]

@Антон, Ваш скрипт 6FhP возвращает бобслей (Q177275). Однако у этого объекта Q177275 (бобслей) есть иконка?! Почему же Ваш скрипт его возвращает? Попробуйте разобраться, пожалуйста. Напишите своё объяснение в том же разделе своей статьи или исправьте скрипт, если придумаете — как.

Поскольку сегодня этот скрипт возвращает не один, а два вида спорта без иконки, то если скрипт не будете менять, то приведите два этих объекта после скрипта. --Andrew Krizhanovsky (обсуждение) 09:59, 27 января 2023 (UTC)[ответить]

Добавил новый скрипт, среди результатов которого есть те, которые опровергают гипотезу. Поменял текст данного раздела. Akovin (обсуждение) 11:14, 1 февраля 2023 (UTC)[ответить]


Страны происхождения видов спорта[править]

@Антон, по добавленному тексту (diff).

  1. В этой фразе "...больше всего видов спорта было придумано..." после названия страны укажите (числом в скобках) — сколько именно видов спорта было придумано в Англии и так далее. В первой скобке пишите развёрнуто (NN видов спорта было придумано), в последующих скобках (YYY видов).
  2. Антон, Вы пишите: «В остальных 145 странах не было придумано ни одного вида спорта.» Антон, когда Вы будете гостить в одной из этих 145 стран, то хозяева с удовольствием Вам расскажут о тех спортах, которые придумал лично их народ, но просто руки не дошли добавить это в Викиданные. Прошу смягчить формулировку. --Andrew Krizhanovsky (обсуждение) 11:48, 7 февраля 2023 (UTC)[ответить]

Олимпийские игры и войны[править]

@Антон, помните есть легенда, что все воины прекращались на время игр. Мы можем её проверить. Мне кажется, что нужно по порядку делать так:

  1. На временной шкале (сначала просто таблица) получить даты начала и конца летних и зимних игр. Вот, например, объект 2024 Summer Olympics (Q995653) имеет свойства "start time" и "end time".
  2. Дальше получить периоды мира и войн для стран (для всех или для нескольких?). См. работу "(Андрей) Голубев А. А. «Исследование периодов мира и войны стран с помощью SPARQL-запросов и анализа данных в Python», 2018." Добавьте раздел "Литература" и сошлитесь на работу Голубева.
  3. Нужно придумать, как наложить эти две серии данных, чтобы (1) получить рисунок (график) и (2) подсчитать (в своей разработанной программе, Python?). Вопрос — что считать? Ну, например, берём параметр τ - это число дней до начала Игр и после конца Игр. Если война/конфликт заканчивается в период "начало игр — τ" (то есть начало Игр "гасит" войну) или начинается в период с окончания игр до момента + τ (Игры кончились, война зажигается), то наша гипотеза имеет +1 балл, а если война/конфликт пересекается с Играми, то -1.
  4. Получить список войн/конфликтов, у которых начало или конец срока находятся максимально близко к началу/концу Игр. Типа: сегодня Игры кончились, а завтра была война. --Andrew Krizhanovsky (обсуждение) 11:48, 7 февраля 2023 (UTC)[ответить]
@Антон, получилось интересно. Что дальше:
  1. "Рис. 3: График периодов проведения Олимпийских игр" - после этого рисунка напишите, какие на нём видно два больших интервала. Объясните их наличие.
  2. "с 1896-01-01 по 2023-01-01" - слишком формально написано. Можно просто годы написать.
  3. "Рис. 4: График периодов войн" - сейчас рисунок неинформативен. Видно только, что недавно был необъяснимый интервал в 2010-х годах, хотя это не верно. Попробуйте нарисовать гистограмму так, что по оси Y мы видим число одновременно идущих войн и конфликтов, 0 - если в указанный момент времени совершенно нет войн и конфликтов. Тогда и цель несколько изменится - нужно увидеть (и подсчитать) есть ли "ямы", то есть - есть ли снижение войн и битв (значимое, ощутимое снижение) в период олимпиад или рядом с ними. Скорее всего, понадобится программирование на чём-либо для визулизации таких интересных данных.
  4. c:File:War periods.png — (1) что это за код языка "Ab"? (2) Новую версию картинки не загружайте отдельным файлом, а грузите поверх старого файла, чтобы заново не писать описание. См. кнопку "Upload a new version of this file" на той же странице. (3) Слишком краткое описание "График периодов войн", думаю, что можно было бы более полно написать, но не настаиваю.
  5. Сообщите, пожалуйста, свой логин на GitHub (это по поводу кода, который Вы написали). --Andrew Krizhanovsky (обсуждение) 13:24, 17 февраля 2023 (UTC)[ответить]
@Антон, у меня есть уточнения к фразе "Скорее всего, это связано с двумя мировыми войнами, которые проходили в эти периоды. Согласно статье и статье, Первая и Вторая мировые войны проходили приблизительно в эти периоды времени: с 1914 по 1918 год и с 1939 по 1945 год."
  1. Вы пишите в первом предложении: "войнами, которые проходили в эти периоды". При этом в предыдущем предложении эти периоды не названы, а написано "На графике можно наблюдать два больших перерыва в проведении Олимпийских игр." Будет хорошо для читателя, если Вы напишите словами, каких именно два больших перерыва видно на графике.
  2. "Согласно статье и статье..." — это, несомненно, перл. Но мы так не будем писать. Идея с гиперссылками понятна, но попробуйте как-то иначе давать ссылки, чтобы текст оставался удобным для чтения.
  3. "Скорее всего, это связано с двумя мировыми войнами ... " Мне кажется, что можно найти литературу (и поставить в статье ссылку на эту литературу), где будет чётко написано, почему именно этих олимпиад не было.
  4. "Первая и Вторая мировые войны проходили приблизительно в эти периоды времени: с 1914 по 1918 год и с 1939 по 1945 год". Почему "приблизительно"? Вы же указываете точно годы войны? Именно в эти годы эти войны и шли. --Andrew Krizhanovsky (обсуждение) 16:39, 22 февраля 2023 (UTC)[ответить]
Рис. 5: График периодов Олимпийских игр, наложенный на график войн
  • @Антон, Вы написали скрипт "List of war periods" https://w.wiki/6L$j Получен: 171 период. Если закомментировать строку 6 (instances of "country"), то получим 184 периода, если строку 5 (instances of "sovereign state"), то 176. Почему так? Попробуйте разобраться — баг это или фича — и провести небольшое исследование. Результаты напишите после скрипта словами.
  • Я смотрю на рисунок 5. И мне кажется, что некоторое изменение с числом войн в окрестности многих олимпийских игр происходят. Тот вариант с алгоритмом hypothesis_True, который Вы написали — оставляем в тексте. Но я предлагаю ещё один алгоритм.
  1. У нас снова есть входной параметр τ — это число месяцев (а не дней) до начала Игр и после конца Игр.
  2. Есть известная нам функция War(date) — это число войн на выбранную дату (месяц). Значение функции представлено на рис. 5.
  3. Подсчитаем ΔWar (τ), а именно: уменьшилось или увеличилось число войн в момент проведения Олимпийских игр (дата TGame) относительно числа войн в дату до игр (TGame — τ) и после игр (TGame + τ).
  4. Меняем параметр τ от 1 месяца до максимума (про максимум ниже) и считаем ΔWar (τ). Рисуем график ΔWar (τ). Пытаемся понять и описать — что этот график показывает. Есть ли на графике явно выраженный минимум, то есть эффективное временное расстояние от Игр, на которых число войн уменьшается.
  5. Ограничение для максимального периода: τ меньше времени между играми, то есть τ < 4 лет. Если всё в месяцах, то τ < 48. --Andrew Krizhanovsky (обсуждение) 08:19, 2 марта 2023 (UTC)[ответить]