Обсуждение модуля:AutoDescriptionHuman

Последнее сообщение: 2 года назад от Kaganer в теме «Ошибки»

Ошибки

править

Фатальные ошибки

править
Нуждается в обработке в первую очередь. Страницы с фатальными ошибками в модуле AutoDescriptionHuman собираются в Категория:Страницы с ошибками в модуле AutoDescriptionHuman. Секция архивируется в Обсуждение модуля:AutoDescriptionHuman/Архивы/Фатальные ошибки.

Ошибки без группировки

править
- какая-то ошибка, связанная с модулем Declension (видимо, не обрабатывается страна, хотя гражданство указано).
--Kaganer (обсуждение) 12:30, 20 августа 2019 (UTC)Ответить
С этим разобрался, хотя бы частично. Ошибка уходит, если указать в ВД место рождения. Это неправильная ситуация в принципе - нужно сначала разбирать гражданство, и только если оно вдргу не указано, использовать место рождения.
Место рождения - наименее надежный критерий для отнесения в категории стран по профессиональной принадлежности. --Kaganer (обсуждение) 23:40, 2 мая 2022 (UTC)Ответить
--Kaganer (обсуждение) 03:36, 8 мая 2021 (UTC)Ответить
  • ... и до нашей эры. Хотелось чтобы DonSimon нашёл время эти задачи с разнообразными датами рождения и смерти порешал. Это давняя проблема, а у меня висяки с роботами. --cаша (krassotkin) 08:08, 8 мая 2021 (UTC)Ответить
  • И вообще нам бы любителей Lua, как и любого языка программирования ещё найти. Просто непочатый край работы для программистов. И это самое перспективное направление развития. --cаша (krassotkin) 08:08, 8 мая 2021 (UTC)Ответить

Пример - Категория:Александр Кузнецов (1958)
Непонятно, по какому правилу в конце добавилось ещё "России"; кажется, что оно лимшнее.
Категория:Депутаты Государственной думы Российской Федерации у нас есть, и должна называться именно так. --Kaganer (обсуждение) 23:41, 20 апреля 2022 (UTC)Ответить

"Родившиеся в Владимире" > "Родившиеся во Владимире"

править

Для категорий вида "Что-то в Где-то" нужно добавить обработку ситуаций, когда после предлога "в" идет слово, начинающееся с "В", после котрой согласная. И в этих случаях менять "в" на "во".

"Категория:Род занятий:..." + "Категория:Профессии без склонения"

править

Часто создаю категории по футболистам и шахматистам. Везде где есть шаблон {{Оформление категории}} и где категория по человеку, появляется данная категория, походу. Проблема настолько взбесила (я программист, но не понимаю что не так), что решил написать сюда (и даже создал подраздел).

Возьмём шахматиста, например, Категория:Даниил Дубов (он молодой, не уровня Магнуса Карлсена, который уже много чего выиграл — свойств должно быть немного, плюс россиянин). Викиданные о нём: Q3078552. В модуле Declension прописал склонение слова «шахматист». Теперь идём в Викиданные: род занятий (Property:P106): шахматист (Q10873124). Теперь лезу в этот модуль Модуль:AutoDescriptionHuman. Код «Категория:Профессии без склонения» встречается два раза (оба раза в середине). Рассмотрим первый случай, второй похожий (мне кажется). if (p == true), тогда добавляем категорию «Профессии без склонения». Причём человеку добавляется категория «Род занятий: шахматист» (мне сама постановка категории не нравится, но это другой вопрос, а так — понятно, что свойство Викиданных анализируется). Сначала переопределяется переменная: local p=false. True присваивается вот здесь: if(Declension.declineWord(vi, 7) == "Logical error Declension.declineWord(arg): word not found" or Declension.declineWord(ReturnGendered.launch(vi, entitiesArray["P21"], 2), 7)== "Logical error Declension.declineWord(arg): word not found") then p=true

Во-первых, я не очень понимаю, зачем два типа проверок, разделённые словом or (может там and нужен?)? И второе — попадались ли кому категории без данной категории, где нормально работает? --Brateevsky {talk} 13:48, 30 декабря 2018 (UTC)Ответить

@DonSimon:, что с этим? --Kaganer (обсуждение) 18:58, 31 октября 2019 (UTC)Ответить

"Род занятий: священнослужитель" + "Род занятий: clergyman"

править

Пример: Категория:Епифаний (Думенко)

Проблема: "священнослужитель" - это подкласс от "clergyman" (у которого, кстати, в ВД есть русский перевод). Кажется, в данном случае "clergyman" - лишняя сущность. --Kaganer (обсуждение) 12:13, 17 июня 2019 (UTC)Ответить

"Род занятий: священнослужитель" + "Род занятий: священник"

править

Наверное, должно быть только второе. --Kaganer (обсуждение) 18:57, 31 октября 2019 (UTC)Ответить

Вот это вот, по-моему, нужно убирать. Это наведённая штука от "выпускник". --Kaganer (обсуждение) 18:28, 24 июня 2019 (UTC)Ответить

Что с этим? --Kaganer (обсуждение) 18:49, 31 октября 2019 (UTC)Ответить
Тут всё по-прежнему. --Kaganer (обсуждение) 01:07, 16 марта 2020 (UTC)Ответить

В ВД "журналист" - подкласс от элемента "авторы, журналисты и лингвисты". Не уверен, что нужно тащить сюда этот над-уровень классификации.--Kaganer (обсуждение) 04:56, 19 ноября 2021 (UTC)Ответить

Ошибки в Викиданных, для которых нужен обработчик

править

Ошибки в Викиданных, которые можно/нужно исправлять в Викиданных

править

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.


Лимит по длине названия категории

править

В движке существует лимит на длину имён. Иногда при автоматическом формировании, длина превышается, и движок не может обработать категорию как ссылку. В результате она вылезает в текст. См. пример: Категория:Евгений Томашевский. Возможно то же самое может наблюдаться в автоматически формируемых ссылках на статьи. И там и там нужно проверять. --cаша (krassotkin) 09:23, 3 декабря 2020 (UTC)Ответить

Члены академий, научных обществ и различных организаций

править

То же и для большинства других организаций. То есть "Участники шоу", но "члены Академии Наук". Увы, так принято в русском языке. --Kaganer (обсуждение) 02:13, 31 декабря 2020 (UTC)Ответить

Президент США vs Избранный президент США

править

См. Категория:Джордж Уокер Буш - "Избранный президент США с 2000 года по 2001 год после Билл Клинтон перед Барак Обама." А про собственно президентство с 2001 по 2009 год ничего не сказано.
Там в элементе ВД в списке занимаемых должностей есть и "президент США" (d:Q11696), и "Избранный президент США" (d:q1467287 - подкласс от d:Q11696). Я бы в этом случае выводил только d:Q11696, ну или оба значения. --Kaganer (обсуждение) 04:11, 16 января 2021 (UTC)Ответить

Мусорные надкатегории

править

На Категория:Генри_Таррио висит куча лишних надкатегорий: Категория:Города без склонения, красная Категория:Организации без склонения, и даже Категория:Фамилия не установлена (empty) (хотя, смотрите, с полем «фамилия» у него всё в порядке). Incnis Mrsi (обсуждение) 16:47, 23 января 2021 (UTC)Ответить

  • Incnis Mrsi: diff. С остальным так же — где-то нужно дописать, что-то просклонять, это технические категории. Они о том, что скрипт сам не может разрешить ситуацию — нужна помощь человека. --cаша (krassotkin) 18:26, 23 января 2021 (UTC)Ответить

В ВД добавили новые мета-классы, и в результате у нас съехала категоризация. См. Категория:Род занятий: черта личности и Категория:Род занятий: профессия. То есть "актёр" или "дизайнер" - это у нас сначала "профессия", а уже она является подклассом от "род занятий". Нужно это как-то обрабатывать.

Род занятий "активист" - это подкласс от "черта личности", что нам как бы не нужно (это другая ветка, по сравнению с подклассами от "род занятий"). --Kaganer (обсуждение) 01:40, 26 апреля 2021 (UTC)Ответить

Предложения

править

Замены

править

Некоторая терминология у нас устойчиво отражается по-другому. Её нужно заменять в коде. Возможно должен быть отдельный модуль для таких замен, который проверяется в первую очередь, а дальше уже их склонять, добавлять в категории и т.п. --cаша (krassotkin) 13:53, 3 сентября 2018 (UTC)Ответить

Вопросы к обсуждению

править

Индивидуальные замечания

править
Перенесено со страницы Викиновости:Форум/Общий#Категория:Олег Абарников --cаша (krassotkin) 21:56, 1 ноября 2018 (UTC)

Про меня какое-то мракобесие добавлено. Я не википедист, викимедист, писатель и журналист Казахстана, и в Казахстане последний раз был в возрасте 9 лет в 1994 году. Я исключительно россиянин, и не согласен даже на двойную категоризацию исходя из места рождения. Далее, я нахожусь в «красных» категориях Московский государственный университет (выпускники) (я учился в аспирантуре, и не являюсь выпускником МГУ), Образовательные учреждения без склонения (what?), Род занятий: писатель-документалист (может я и работаю с документами, но в писатели пока точно не гожусь, пока не выпустив ни одной книги), Организации без склонения (what?). Где это всё редактируется? В Викиданных такого нет.—Soul Train (обсуждение) 20:46, 1 ноября 2018 (UTC)Ответить

  • Да, ты прав, реальное мракобесие. Где-то работает отлично, а где-то сбоит во всех местах. Но работаем над этим, вон выше список багов, которые обнаружили и которые чиним постепенно. Продвигается не быстро. Просто не хватает рук. Извини. В письме пояснил подробнее. Всё обязательно приведём в порядок. Но очень нужны люди, которые подключаться к разработке. --cаша (krassotkin) 22:10, 1 ноября 2018 (UTC)Ответить
  • Категория «без склонения» — это специфика русского языка. В категориях слова употребялются в другом роде и числе, не в таком как указано в Викиданных (именительный, единственное). Эти категории сигнализируют о том, что для некоторых слов ещё не создана таблица склонений. Мы пока сделали у себя такую табличка, её можно руками пополнять, что мы и делаем постепенно. Но сейчас хотим переписать на Викиданные и забирать склонения оттуда. Но там эта работа ещё медленней чем у нас продвигается. Затянули они с интеграцией Викисловаря. Только в этом году удалось убедить, что это очень важно, в том числе и для таких вот вопросов. Сейчас инфраструктура создана (пример: d:Lexeme:L14233), но наполнения ещё нет. Как только там напишут робота и заберут всё из Викисловаря, подключимся туда и проблема мгновенно исчезнет. --cаша (krassotkin) 22:10, 1 ноября 2018 (UTC)Ответить

Плохая логика

править

Не надо валить все данные, снятые с Викиданных, сразу в один массив для последующей обработки. Надо обрабатывать значения последовательно. Каждую пару «свойство — значение» пропускайте через обработчик, создающий потребный для случая викикод. Наверняка можно где-то найти уже готовые образцы, написанные с разумной логикой.

Я попытался было исправить ахинею, возникшую в категория:Лакшми Татма (см. d:Q2617946 #P569 для объяснения причины), но с вашей последовательностью действий с трудом понимаю, как можно справиться с многозначностью, не городя страницы дополнительного кода. И такое же может случиться с другими (нечётко известными) атрибутами персоны, да и не только персоны. Incnis Mrsi (обсуждение) 19:09, 3 февраля 2020 (UTC)Ответить

  • Многие утверждения создаются на основе сразу нескольких полей. Вытаскивать их из Викиданных — непрозрачная операция с кучей проверок, и если её делать многократно, совмещая с логикой формирования утверждений, получится совсем нечитабельно. Но сейчас тоже не гуд, согласен. Если кто может рефакторить симпатичней, будет здорово. --cаша (krassotkin) 11:50, 3 января 2021 (UTC)Ответить

Ключ сортировки в категориях

править
  • Без DEFAULTSORT сбиваются все категории. --cаша (krassotkin) 23:14, 26 августа 2018 (UTC)Ответить
    • @Krassotkin: DEFAULTSORT всё равно нужен, и его всё равно делать руками. Только если в ВД заполнены свойства "Фамилия" и "Имя", и значения имеют русские метки, - можно генерить ключ автоматом (это крайне редкий случай). Нужна проверка на наличие DEFAULTSORT и служебная категория для отслеживания категорий людей с автоописанием и без DEFAULTSORT. --Kaganer (обсуждение) 12:32, 30 августа 2018 (UTC)Ответить
      • Семён уже придумал, как получить ключ. Это просто оказалось. Проблема только в том, что его в код на Lua не получается вставить. Он уже всюду спрашивал, что-то безрезультатно. --cаша (krassotkin) 12:41, 30 августа 2018 (UTC)Ответить
      • Kaganer, если честно, я забил уже этот ключ проставлять. Так буквально немножко в коде реализовать и оно автоматом проставится. Всего лишь минимальная проблема - понять как DEFAULTSORT из Lua реализовать. Но если совсем никак, то мы этот ключ тупо в каждую категорию впишем - роботу пофиг сколько раз это сделать. На мой взгляд, сейчас не имеет смысла тратить время на ключи для людей. Просто немножко потерпеть когда у Семёна или кого другого руки дойдут. --cаша (krassotkin) 22:56, 6 сентября 2018 (UTC)Ответить
        • @Krassotkin: Я не понял, откуда ты его возьмешь (хоть ботом, хоть как). Разве что из интервики на ру-вп. В любом случае, нам нужна служебная категория отслеживания, чтобы понимать, где он есть, где его нет. И вторая - для проверки случаев, когда есть конфликт автоматического ключа и ручного.--Kaganer (обсуждение) 16:43, 9 сентября 2018 (UTC)Ответить
          • На первый вопрос сам ответил. А на последний можно сделать только лишь реализовав специальным полем в шаблоне. На Викискладе в инфобоксе, если не ошибаюсь, именно этот путь используется. --cаша (krassotkin) 17:41, 9 сентября 2018 (UTC)Ответить
    • Закрыл этот тикет. Как оказалось — это просто предрассудки сотрировать по фамилиям. По личному имени тоже нормально ищется, тем более для человека оно важнее. --cаша (krassotkin) 19:29, 22 июля 2020 (UTC)Ответить
      • @Krassotkin: Я открыл этот тикет снова. Я не согласен с тобой, и не буду согласен. Даже если это "предрассудки" (а это не так), этот подход реализован абюсолютно во всех изданиях и ресурсах, хоть сетевых, хоть бумажных. По личному имени ничего "нормально" не ищется, это просто нрелевантная информация для любого осмысленного поиска. То, что "для человека оно важнее" - тоже абсолютно нерелевантный этой теме аргумент. --Kaganer (обсуждение) 22:33, 13 марта 2021 (UTC)Ответить
      • Думаю, что я просто дополню шаблон оформления категории (буду как первичный ключ название статьи в ру-вики, если нету - значение свойства "фамилия", если и этого нету - добавлять служебную категорию "Люди без автоматического ключа сортировки"), и мы закроем эту проблему. См. Обсуждение_шаблона:Оформление_категории#Добавление ключа сортировки по фамилии. --Kaganer (обсуждение) 22:39, 13 марта 2021 (UTC)Ответить

Необходимо добавлять ключ сортировки по фамилии (как это уже делается на Викискладе), на основании языковой метки для элемента-значения свойства "Фамилия".
Если автоматический ключ отличается от заданного вручную, нужно выводить сообщение (также по аналогии с Викискладом).
Если у элемента Викиданных нет свойства "Фамилия" или для фамилии нет русской языковой метки, добавлять специальную категорию отслеживания (чтобы можно было увидеть фронт работ по добавлению значений в ВД). --Kaganer (обсуждение) 23:13, 26 декабря 2020 (UTC)Ответить

Вернуться на страницу «AutoDescriptionHuman».