Обсуждение:Программирование Викиданных/field of work (math)

Материал из Викиверситета
Перейти к навигации Перейти к поиску

Рисунки и области математики[править]

Table of fields.jpg

@User:Elvira0p, рисунок получился интересный, спасибо! Но есть мелкие замечания:

  1. Неспецифичное, а потому неудачное название файла Table of fields.jpg
    Можно пойти от описания (Сколько ученых заняты одновременно в двух областях математики) и предложить такое название: "Number of scholars sharing math fields".
  2. В вики-разметке не нужно использовать символ br как в HTML. Нужно использовать пробельные строки как в Latex. Хотя я в специальных целях и использовал br строкой выше :)
  3. В названиях столбцов и строк лучше применять латиницу, а не кириллицу, на случай использования этой иллюстрации в английской версии статьи.
  4. В таблице на рисунке по диагонали можно было бы указать число учёных, занимающихся только этой областью.
  5. И всё-таки есть большое желание уместить (хотя бы для строк, не столбцов) названия областей на рисунке. Завтра на встрече поясню.
  6. Развёрнутая подпись для рисунков и таблиц - это обязательный элемент.
  7. Привычнее диагональная матрица другая. Нужно эту повернуть на 90 градусов против часовой стрелки.
  8. Предлагаю добавить ещё один столбце справа: сумма пересечений данной области со всеми прочими. Тогда будет видно, нужна ли ещё сортировка областей...
  9. На Викискладе принято писать описание на двух языках (родной и английский) и расставлять категории. -- Andrew Krizhanovsky (обсуждение) 08:55, 18 декабря 2016 (UTC)

Рейтинг ученых + гистограмма[править]

The number of scientists and the number of objects.jpg
The number of scientists and the number of objects in the world.jpg

@User:Elvira0p, к этому разделу (а точнее, к подразделу " 1. Напишем SPARQL-запрос, который выводит список математиков и количество изучаемых ими наук") такое предложение. Постройте гистограмму учёных и числа наук (предметов, научных областей), которыми они занимаются. То есть вычислите и нарисуйте:

  • число учёных с числом field_of_work == 0,
  • число человек с одной наукой (одним интересом),
  • число человек, занимающихся двумя науками,
  • и так далее. Andrew Krizhanovsky (обсуждение) 19:02, 3 февраля 2017 (UTC)

Два рейтинга: один по всем математикам мира, второй по отечественным. -- Andrew Krizhanovsky (обсуждение) 19:25, 3 февраля 2017 (UTC)


@User:Elvira0p, получилось здорово! Две вещи.

0) Хорошая, ёмкая и понятная подпись к иллюстрации - это искусство. Попытайтесь добавить подписи ко всем иллюстрациям. См., например, страницу Работа в вики-среде (с упражнениями)/Энциклопедический стиль статей (идеалы и нейтральность). Примеры классных иллюстраций и развернутых подписей можно посмотреть в статьях журнала Nature. См. 6.5. Представление иллюстраций в тексте.

1) Можно попытаться сделать третий рисунок, в котором две гистограмы будут даны сразу. См. идеи от Гугла: comparative histograms. Возможно, будет лучше перейти на этом третьем рисунке к процентам. То есть писать, например, на рыжем рисунке не 424, а какой процент составляет 424 от общего числа отечественных учёных. Возможно, будет лучше видно, если шкала Y будет логарифмической.

2) После этих двух (или трёх) рисунков с гистограммами должно быть самое сложное и интересное - качественный анализ и сравнение гистограмм. Попробуйте ответить на вопросы:

  • В чём сходство?
  • В чём разница гистограмм?
  • Почему так получилось (гипотезы)? -- Andrew Krizhanovsky (обсуждение) 20:48, 6 февраля 2017 (UTC)

О машиночитаемых данных (поиск по отношениям против поиска по текстовой строке "description")[править]

Эльвира, ещё вопрос. Мне казалось, что у Вас были скрипты, где Вы рассматривали учёных из СССР, России, Российской империи. А сейчас я вижу только "?item schema:description "Russian mathematician"@en". А где те скрипты? -- Andrew Krizhanovsky (обсуждение) 19:28, 3 февраля 2017 (UTC)

@User:Elvira0p, вот скрипт, который выбирает персон таких, что

  • "country of citizenship" Россия или СССР или Российская империя,
  • "occupation" (занятие) - mathematician (математик),
  • description ≠ "Russian mathematician".
SELECT ?item ?label ?field_of_work ?field_of_workLabel
WHERE
{  
  ?item wdt:P106 wd:Q170790. # occupation is 'mathematician'
  ?item wdt:P101 ?field_of_work . # field_of_work
  {
    { ?item wdt:P27 wd:Q34266 } UNION # country of citizenship Russian Empire
    { ?item wdt:P27 wd:Q15180 } UNION # country of citizenship  Soviet Union
    { ?item wdt:P27 wd:Q159 } # country of citizenship Russia
  }
  FILTER NOT EXISTS {
        ?item schema:description "Russian mathematician"@en. # 104 results
  }
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
  ?item rdfs:label ?label.
  FILTER(LANG(?label) = "ru").
}

SPARQL query 104 Results

В этом списке из около 40 математиков мы редко видим неточную запись фразы "Russian mathematician". Например, Alexander Friedmann с двумя пробелами между словами "Russian" и "mathematician" вместо одного пробела. И в основном видим значимые персоны, описание которых заполнял не бот, а человек. Поэтому вместо шаблонного и казённого выражения "Russian mathematician" можно прочитать:

Разницу между страной и национальностью можно увидеть в следующих примерах российских или советских математиков:

По-видимому, с годами вдумчивая работа редакторов с карточками математиков на Викиданных будет вести к уменьшению числа шаблонных записей "Russian mathematician" (согласитесь, что невозможно при формулировке одного предложения, полно описывающего человека, получить одинаковый для всех математиков текст), и к увеличению самых разнообразных описаний.

Это указывает на ненадёжность и шаткость конструкций (скриптов), основанных на текстовых полях типа "schema:description". Поэтому при возможности уйти от текстовых полей с произвольным текстом к строго определённым отношениям, например, свойство country of citizenship или ethnic group, следует использовать эту возможность. -- Andrew Krizhanovsky (обсуждение) 15:32, 6 февраля 2017 (UTC)