Ученые поменяли название генов из-за ошибки в Microsoft Excel
9 августа 2020 года
Комитет по номенклатуре генов (HUGO Gene Nomenclature Committee, HGNC) принял новые правила именования для человеческих генов. Все из-за программы для ведения электронных таблиц Excel, которая ошибочно принимает этот тип данных за даты. На текущий момент изменения коснулись обозначения 27 генов.
На данный шаг ученым пришлось пойти из-за Excel. Оказалось, что уже несколько лет при заполнении исследователями электронных таблиц результатов различных экспериментов и оформлении научных публикаций в этой офисной программе происходит замена обозначения гена на дату.
Некоторые из переименованных генов были похожи на названия месяцев. Например, записанный в ячейку "MARCH1" (сокр. от Membrane Associated Ring-CH-Type Finger 1) автоматически преобразовывался в дату — "1-Mar" (1 марта). Эту ситуацию поможет исправить замена типа данных для столбца. Но при неправильном открытии файла вновь собьются все настройки.
«Это очень раздражает», — заявил журналистам генетик Дезо Модос (Dezső Módos). Excel является распространенной программой среди научного сообщества, поэтому ошибки из-за неправильной трактовки символьных обозначений происходят довольно часто. Недавно учёные проверили 3597 научных статей и обнаружили, что пятая часть из них пострадала от ошибок Excel. При этом отказаться от Excel генетики не могут — они повсеместно используют этот инструмент в своей работе, в том числе при проведении клинических испытаний.
Для решения проблемы на этой неделе вышло новое руководство по наименованию генов. 27 из них уже поменяли названия. Пресловутый MARCH1 стал MARCHF1. Координатор HGNC Элспет Бруфорд объяснила, что переименовать гены было проще, чем дожидаться обновления Excel.
Проблема с автоматической конвертацией научных символов в электронных таблицах Excel поднималась учеными неоднократно. Еще в 2004 году авторы научных работ предупреждали о том, что идентификаторы генов автоматически искажаются в программе Excel. За прошедшие пятнадцать лет проблема не была решена. Наоборот, стало выходить еще больше научных работ по биоинформатике с такими ошибками.
Источники
правитьЭта статья содержит материалы из статьи «Ученые поменяли название генов из-за ошибки в Microsoft Excel», опубликованной на сайте SecurityLab.ru и распространяющейся на условиях лицензии Creative Commons Attribution 3.0 Unported (CC-BY 3.0 Unported). |
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.