Чтобы результаты нейропсихологических экспериментов с МРТ-сканированием имели смысл для всех людей, в них должно участвовать порядка тысяч добровольцев.
Львиная доля исследований человеческого мозга выполняется с использованием магнитно-резонансной томографии. Экспериментаторы приглашают какое-то количество добровольцев в лабораторию и сканируют им мозг — либо для того, чтобы узнать какие-то постоянные структурные особенности мозговых центров, либо для того, чтобы увидеть, как меняется активность тех или иных центров в зависимости от когнитивной задачи. И когда мы рассказываем про результаты таких исследований, то обычно добавляем, что полученные результаты нужно будет проверить на большем числе подопытных. Мы повторяем это настолько часто, что «большее число подопытных» начинает восприниматься просто как ритуальное заклинание, на которое можно закрыть глаза.
О том, что это не просто ритуальное заклинание, пишут в Nature сотрудники Вашингтонского университета в Сент-Луисе. Всё началось с того, что они попытались воспроизвести собственные результаты. Исследователи пытались выяснить, как связаны когнитивные особенности с некоторыми структурными особенностями мозга, и на примере тысячи детей им удалось обнаружить определённое соответствие. Но когда это соответствие попробовали увидеть на другой тысяче детей, то у них таких соответствий не оказалось.
Тогда авторы работы обратились к трём большим базам данных, в которых в сумме хранились результаты МРТ-сканирования примерно 50 тыс. человек, и начали перепроверять самые разные корреляции на большем количестве материала. То есть они, например, брали некую связь между данными МРТ и психологическими особенностями, обнаруженную на примере двадцати пяти человек, и пытались найти ту же связь на примере тысячи, двух, трёх, десяти и т. д., чьи данные были в базах.
Оказалось, что достаточно надёжными подобные исследования становятся тогда, когда в них анализируют данные порядка тысяч человек. То есть когда мы делаем выводы, опираясь на МРТ-сканирование тысячи, или двух тысяч, или трёх тысяч добровольцев, то наши результаты с высокой вероятностью подтвердятся и на других людях. Если число участников исследования будет меньше, то наши результаты, скорее всего, имеют смысл только для этих людей.
В качестве примера авторы работы приводят данные о том, как связанность различных мозговых центров влияет на когнитивные особенности: если это влияние анализировать на двадцати пяти добровольцах, то такое влияние однозначно будет сильным, или, наоборот, мы увидим вообще отсутствие какой-либо связи между тем и другим. И только на тысяче человек станет видно, что связь между когнитивными особенностями и характером межцентровых соединений на самом деле есть, но очень слабая.
При этом в большинстве подобных исследований участвует около двух десятков человек. В некоторых случаях небольшая выборка вполне допустима: например, когда вы изучаете влияние определённой мутации на мозг, вы вполне можете обойтись малым числом людей, у которых есть такая мутация. Но если, скажем, речь об аутизме, который развивается по самым разным причинам, и не только генетическим, то тут нужно либо очень тщательно подбирать малую группу добровольцев, либо всё же использовать как можно больше данных. Вообще проблема воспроизводимости результатов, полученных на небольшом числе добровольцев, касается не только нейробиологии. Какое-то время назад нечто похожее происходило и в генетике, пока там не накопились десятки и сотни тысяч прочитанных индивидуальных геномов.
И ещё здесь обязательно нужно упомянуть о разнообразной научно-популярной литературе, где порой не просто рассказывают об устройстве мозга, но и описывают закономерности нашего поведения, дают какие-то психологические советы и т. д. Не всегда в такого рода литературе сообщают подробности тех исследований, на основании которых мы выслушиваем все эти советы. С учётом всего вышесказанного про МРТ-исследования стоит помнить, что популярные советы, опирающиеся на «новейшие нейробиологические данные», далеко не всегда имеют хоть какой-то смысл.
Комметарии