НЕОПРЕДЕЛЕННОСТЬ ПО–НАУЧНОМУ
НЕОПРЕДЕЛЕННОСТЬ ПО–НАУЧНОМУ
В Гарварде недавно прошел диспут, посвященный попыткам определить важнейшие элементы современного образования. Одной из обсуждавшихся категорий (по существу, частью обязательных научных требований) были «эмпирические рассуждения». Предложение состояло в том, что университет должен ставить перед собой цель «научить студентов собирать и оценивать эмпирические данные, взвешивать доказательства, разбираться в оценках и вероятностях, делать выводы из имеющихся данных [пока все нормально —Л. Р.], а также распознавать ситуации, в которых вопрос не может быть разрешен на базе имеющихся свидетельств».
Предложенная формулировка — позже она была изменена — была составлена с самыми лучшими намерениями, но содержала в корне неверное представление о том, как работают измерения, то есть экспериментальные данные. Как правило, наука решает вопросы с определенной степенью вероятности. Конечно, мы можем достичь высокой степени уверенности в каком?то вопросе или наблюдении и высказывать здравые суждения. Однако редко человеку удается решить вопрос полностью — научный или иной — на основании прямых доказательств. Мы можем набрать достаточно данных, чтобы можно было доверять причинно-следственным связям, можем делать необычайно точные предсказания, но, как правило, все они делаются с определенной степенью вероятности. Как говорится в главе 1, неопределенность, даже маленькая, допускает потенциальное существование новых интересных явлений, которые еще надо открыть. Мало что известно со 100%-ной точностью, и ни одна теория или гипотеза не будет гарантированно действовать в условиях, в которых еще не проводились никакие испытания.
В измерения всегда входит некоторый вероятностный компонент. Многие научные измерения опираются на предположение о том, что те или иные явления основаны на существующих физических закономерностях, которые можно открыть при помощи достаточно точных и тщательных измерений. При помощи измерений мы стараемся найти эти физические закономерности. Затем мы можем утверждать, что некий интервал, в пределах которого лежат наши измерения, содержит истинную величину измеряемого параметра с вероятностью 95%. В этом случае мы могли бы сказать, что уверены на 95%. Подобные вероятности сообщают нам достоверность любого конкретного измерения, а также полный спектр возможностей и следствий. Невозможно до конца понять смысл измерения, не зная и не оценивая связанных с ним неопределенностей.
Один из источников неопределенности — то, что в природе не существует абсолютно точных измерительных инструментов. Для измерений абсолютной точности потребовалось бы устройство, откалиброванное с точностью до бесконечного числа десятичных знаков. Экспериментаторы не в состоянии проводить такие измерения — они могут калибровать свои инструменты лишь с той точностью, которую допускают современные технологии. Чем более развиты технологии, тем точнее измерительные устройства. При всем при том измерения никогда не достигнут абсолютной точности, до каких бы вершин не поднялась техника. Некоторая систематическая погрешность, или неопределенность[41], присущая самому измерительному устройству, останется всегда.
Вездесущая неопределенность не означает, что ученые воспринимают все варианты или заявления одинаково (хотя средства массовой информации частенько совершают эту ошибку). Вероятность 50 на 50 в реальной жизни встречается очень редко. Однако все это значит, что ученые (или любой человек, стремящийся к идеальной точности) в своих заявлениях сообщают, что именно было измерено и что это означает в вероятностном смысле, даже если вероятности очень высоки.
Когда ученые и журналисты очень аккуратно выражают свои мысли, они используют в разных значениях два, казалось бы, близких слова: прецизионность и точность. Некое устройство считается прецизионным, если при повторных измерениях одной и той же величины полученные значения не будут слишком сильно отличаться друг от друга. Таким образом, прецизионность — мера уровня изменчивости и схожести результатов. Если результаты повторных измерений отличаются не сильно, то измерения прецизионны. Измеренные таким образом величины дают меньший разброс значений, поэтому среднее значение при повторных измерениях будет сходиться быстрее.
Точность, с другой стороны, говорит о том, как далеко полученное вами среднее значение отстоит от правильного результата. Иными словами, она говорит о том, вносит ли измерительная установка смещение и насколько измерения достоверны. С технической точки зрения ошибка, присущая измерительному устройству, не ухудшает его прецизионности — ведь ошибка каждый раз будет одна и та же, — хотя, безусловно, вредит точности собственно измерения. Систематическая погрешность характеризует неустранимое отклонение от истинного значения, присущее самим измерительным устройствам.
Тем не менее во многих ситуациях даже при наличии идеального измерительного инструмента вам придется проводить многократные измерения, чтобы получить корректный результат. Дело в том, что существует еще один источник неопределенности[42] — статистический; это означает, что измерения необходимо проводить многократно, чтобы результатам можно было доверять. Даже точное измерительное устройство не всякий раз будет давать верное значение, а вот среднее значение при многократных измерениях сойдется к верному ответу. Систематическая погрешность управляет точностью измерений, тогда как статистическая погрешность влияет на их прецизионность. В идеале измерения должны быть и точными, и прецизионными; тогда ожидаемая абсолютная погрешность будет мала, а полученным величинам можно будет доверять. Иначе говоря, вы должны желать, чтобы они лежали в как можно более узком диапазоне (прецизионность) и сходились в конце концов к верному результату (точность).
Приведем знакомый и весьма важный пример, на котором можно практически рассмотреть все приведенные понятия, — испытания эффективности лекарственных средств. Врачи часто не хотят раскрывать (а может быть, и не знают) соответствующую статистику. Случалось ли вам испытывать острое разочарование от слов: «Иногда это лекарство помогает, а иногда нет»? Подобное заявление скрывает от вас массу полезной информации. Так, в нем ничего не говорится о том, как часто это лекарство срабатывает и насколько статистически та часть населения, на которой его испытывали, схожа с вами. После такого заявления очень трудно принять решение. Гораздо лучше было бы, если бы вам сказали, как часто это лекарство помогает людям, близким к вам по возрасту и физическому состоянию.
Разные люди по–разному реагируют на одни и те же лекарства, и это очень усложняет вопрос о том, как подействует то или иное лекарство на конкретного человека. Давайте для начала рассмотрим более простой случай и представим, что мы проводим испытания на одном человеке. В качестве примера возьмем аспирин и проверим, помогает ли он от головной боли.
Кажется чего проще: взять аспирин и посмотреть, сработает ли он. Но на самом деле все немного сложнее. Даже если вам стало лучше, откуда вы можете знать, что вам помог именно аспирин? Чтобы убедиться в этом, то есть понять, уменьшилась ли боль быстрее, чем без лекарства, вам нужно было бы сравнить самочувствие с ним и без него. Однако, поскольку вы либо приняли аспирин, либо нет, одного измерения будет недостаточно, чтобы получить ответ на вопрос.
Но способ получить его существует. Для этого нужно провести эксперимент много раз. Всякий раз, когда у вас заболит голова, вам следует бросить монетку и принять случайное решение о том, принимать на этот раз аспирин или нет. Результат, естественно, нужно зафиксировать. После достаточного количества испытаний вы сможете усреднить свои данные по различным типам головной боли и сопутствующим обстоятельствам (возможно, боль проходит быстрее, если вы накануне хорошо выспались); статистика поможет вам получить верный результат. Вероятно, в ваших измерениях не будет систематической погрешности, поскольку решение о приеме лекарства вы принимали на основании броска монетки, а выборка состоит из вас одного, поэтому результаты при достаточном количестве испытаний будут корректными.
Было бы здорово, если бы любое лекарство можно было испытать посредством такой простой процедуры. Однако большинство лекарств используется при лечении более серьезных заболеваний, чем головная боль, иногда даже смертельно опасных. А у многих лекарств есть долгосрочные последствия, поэтому провести много коротких испытаний на одном человеке невозможно, даже если очень хочется.
Так что обычно, когда биологи или врачи хотят проверить, насколько хорошо действует лекарство, они не испытывают его на одном–единственном человеке, хотя с точки зрения науки такой вариант был бы оптимальным. Им приходится мириться с тем фактом, что люди по–разному реагируют на один и тот же препарат. Любое лекарство дает целый спектр реакций, даже если пробуют его на группе людей с одним заболеванием одной и той же степени тяжести. Поэтому лучшее, что могут в большинстве случаев сделать ученые, — это разработать программу испытаний для группы людей, как можно сильнее похожих на того человека, которому они в будущем намерены давать или не давать данное лекарство. На самом деле врачи, как правило, не планируют эксперименты сами, так что сходство с реальным пациентом гарантировать трудно.
Иногда вместо этого врачи используют уже существующие результаты, где никто не проводил тщательных испытаний, а просто собраны данные наблюдений за существующими группами людей, такими как жильцы одного дома. Затем им придется столкнуться с проблемой правильной интерпретации результатов. С такими исследованиями иногда трудно бывает гарантировать, что проведенные измерения отражают причинно–следственные связи, а не случайные совпадения или корреляции. Так, заметив у многих пациентов с раком легких желтые пальцы, можно сделать ошибочный вывод о том, что именно желтизна пальцев — причина рака легких.
Поэтому ученые предпочитают исследования, в которых методы лечения или дозы назначаются случайным образом. К примеру, исследование, в котором люди будут принимать лекарство по результатам броска монетки, будет меньше зависеть от выборки: ведь то, будет ли данный пациент принимать препарат, полностью зависит от случая. Точно так же при помощи рандомизированного исследования можно установить связь между курением, раком легких и желтизной пальцев. Если бы можно было случайным образом предписать, кто из членов группы будет курить, а кто нет, вы бы поняли, что курение — это по крайней мере один из факторов и желтизны пальцев у пациентов, и рака легких; при этом не важно, является ли одно причиной другого. Но, разумеется, такой эксперимент был бы неэтичным.
Везде, где это возможно, ученые стремятся упростить систему и выделить таким образом те специфические явления, которые хотят изучить. И для точности, и для прецизионности результата очень важен подбор как группы испытуемых, так и контрольной группы. Такой сложный параметр, как действие лекарства на биологию человека, определяется одновременно множеством факторов. Очень важно также, насколько достоверные результаты исследования нам нужны.
Данный текст является ознакомительным фрагментом.