Опубликовано 07 августа 2017, 17:50

Использовать электронные таблицы Microsoft Excel в науке опасно

Использовать электронные таблицы Microsoft Excel в науке опасно

© Edgar Su/Reauters

Исследователи из Кардиффского столичного университета проанализировали использование электронных таблиц, например, Microsoft Excel, в научных статьях по нейронаукам. В результате выяснилось, что никто из респондентов не проходил специального обучения для работы с подобными программами, а большинство недостаточно тщательно проверяли свои документы на наличие ошибок. Это вызывает особые опасения, так как именно в таких разделах, как нейронауки и медицина, у сторонних исследователей зачастую нет доступа к таблицам с исходными данными. Это может привести не только к появлению некорректного результата, но и неправильно выписанным медикаментам. Препринт статьи с подробным описанием случаев опубликован на сервере arXiv.org.

Авторы опросили 17 сотрудников Центра нейронаук Университета Ньюкасла, среди которых были как аспиранты, так и ученые со стажем. Ни у кого не было каких-либо подтверждений обучению работы с электронными таблицами, 71% назвали себя самоучками. При этом большинство определило свой уровень владения подобными программами как «промежуточный» («intermediate»). Но самым тревожным оказалось то, что только 20% ответивших заявили, что их таблицы проверяли коллеги. Большинство опрошенных проводили проверку лишь самостоятельно или не проводили ее вовсе.

Авторы делают вывод, что исследователи зачастую чрезмерно самоуверенны в вопросе пользования подобными программами. Это особенно важно, так как с поверхностной точки зрения подобные приложения кажутся простыми и ясными инструментами, хотя данные по ошибкам указывают, что они таят существенный риск. Также выяснилось, что наиболее образованные люди отличаются повышенной самоуверенностью (относительно собственных навыков пользования Excel). В бизнес-среде, где также часто используются подобные программы, уже выработалась культура пользования электронными таблицами, которую в случае науки еще только предстоит выработать, утверждают авторы.

Обсуждающие новое исследование ученые стали делиться историями неправильного использования таблиц из собственной практики. Один нейробиолог описал, как он случайно отсортировал не все колонки с экспериментальными данными, что привело к появлению неожиданного результата, который он признал ошибочным, к счастью, до публикации. Другой ученый пишет, что около одной пятой биологических статей с дополнительными материалами в виде таблиц Excel содержат неправильные названия генов, так как стандартные настройки преобразуют их. Например, ген «SEPT4» превращается в «32493». Другой ученый описал, что в ведущем мировом журнале была опубликована статья, где в таблице с вычислениями в формулу подставлялись числа из неправильного столбца. Автору работы сообщили об этом, он обещал исправить ошибку, но спустя 18 месяцев так и не сделал этого.

Теги #Ген