Каковы основные источники ошибок в проведении эксперимента. Особое значение имеет правильная разработка методик эксперимента
В главе XV рассмотрены основные вопросы статистической обработки результатов эксперимента: определение наиболее достоверного значения измеряемой величины и погрешности этого значения по нескольким измерениям, оценка достоверности различия двух близких величин, установление достоверной функциональной зависимости между двумя величинами и аппроксимация этой зависимости.
Глава носит вспомогательный характер. Материал в ней изложен в справочной форме, без доказательств. Обоснование и более подробное изложение приведенных методов имеется, например, в .
1. Ошибки эксперимента.
Численные методы часто применяют при математическом моделировании физических и других процессов. Результаты расчетов в этом случае сравнивают с экспериментальными данными и по степени их согласованности судят о качестве выбранной математической модели. Чтобы обоснованно сделать заключение о соответствии или несоответствии, вычислитель должен знать, что такое погрешность эксперимента и как с ней обращаются, а также уметь в случае необходимости провести статистическую обработку первичных данных эксперимента.
Кроме того, задача статистической обработки эксперимента представляет самостоятельный интерес, поскольку она очень важна в тех приложениях, когда или требуется особенно высокая точность (например, уравнивание триангуляционных сетей в геодезии), или разброс отдельных измерений превосходит исследуемый эффект (что нередко встречается в физике элементарных частиц, химии сложных соединений, испытании сельскохозяйственных сортов, медицине и т. д.).
Обычно, чем точнее эксперимент, тем более сложной аппаратуры он требует и дороже обходится. Однако хорошо продуманная математическая обработка результатов в ряде случаев позволяет выявить и частично исключить ошибки измерений; это может оказаться не менее эффективным, чем использование более дорогой и точной аппаратуры. В этой главе будет рассмотрена статистическая обработка, позволяющая существенно уменьшить и аккуратно оценить случайную ошибку измерений.
Ошибки эксперимента условно разбивают на систематические, случайные и грубые; рассмотрим их подробнее.
Систематические ошибки - это те, которые не меняются при многократном повторении данного эксперимента. Примерами таких ошибок являются пренебрежение выталкивающим действием воздуха при точном взвешивании или измерение тока гальванометром, нуль которого неправильно установлен. Различают три вида систематических ошибок.
а) Ошибки известной природы, величину которых можно определить; их называют поправками. Так, при точном взвешивании рассчитывают поправку на выталкивающее действие воздуха и прибавляют ее к измеренной величине. Внесение поправок позволяет существенно уменьшить (или даже практически исключить) ошибки такого рода.
Заметим, что иногда расчет поправок бывает самостоятельной сложной математической задачей. Например, некорректно поставленная задача (14.2) о восстановлении переданного радиосигнала по принятому является, по существу, нахождением поправки на искажение принимающей аппаратуры.
б) Ошибки известного происхождения, но неизвестной величины. К ним относится погрешность измерительных приборов, определяемая их классом точности. Для таких ошибок обычно известна только верхняя граница, а как поправки их учесть нельзя.
в) Ошибки, о существовании которых мы не знаем; например, используется прибор со скрытым дефектом или изношенный, фактическая точность которого существенно хуже, чем обозначено в техническом паспорте.
Для выявления систематических ошибок всех видов обычно заранее отлаживают аппаратуру на эталонных объектах с хорошо известными свойствами.
Случайные ошибки вызываются большим числом факторов, которые при повторении одного и того же эксперимента могут действовать по-разному, причем учесть их влияние практически невозможно. Например, при измерении длины предмета линейка может быть неточно приложена, взгляд наблюдателя может падать не перпендикулярно шкале и т. д.
При многократном повторении эксперимента результат вследствие случайной ошибки будет, различным. Однако такое повторение и соответствующая статистическая обработка позволяют, во-первых, определить величину случайной ошибки и, во-вторых, уменьшить ее. Повторяя измерение достаточное число раз, можно уменьшить случайную ошибку до требуемой величины (целесообразно уменьшать ее до величины 50- 100% от систематической ошибки).
Грубые ошибки - это результат невнимательности наблюдателя, который может записать одну цифру вместо другой.
При единичном измерении грубую ошибку не всегда можно опознать. Но если измерение повторено несколько раз, то при статистической обработке выясняют вероятные пределы случайной ошибки. Измерение, существенно выходящее за полученные пределы, считается грубо ошибочным и не учитывается при окончательной обработке результатов.
Таким образом, если измерение повторено достаточно много раз, то можно практически исключить грубые и случайные ошибки, так что точность ответа будет определяться только систематической ошибкой. Однако во многих приложениях это требуемое число раз оказывается неприемлемо большим, а при реально осуществимом числе повторений случайная ошибка может быть определяющей.
Классификация экспериментов
В социальных науках эксперименты подразделяются на: 1) истинные эксперименты и квазиэксперименты; 2) натурные (натуральные) эксперименты (natural experiments) и натуралистические эксперименты (naturalistic experi-ments); 2) полевые (естественные) и лабораторные эксперименты; 3) параллельные и последовательные (линейные) эксперименты; 4) активные и пассивные эксперименты; 5) эксперименты «улучшающие» и «дублирующие реальный мир»; 6) методическое экспериментирование и эксперименты в оценочных исследованиях; 7) многофакторные и однофакторные эксперименты; 8) модельные и мысленные эксперименты и др. Кроме того, бывают еще пилотные эксперименты.
По характеру экспериментальной ситуации в социальных науках, прежде всего в социологии и антропологии, выделяют две главные формы - полевой и лабораторный эксперименты.
Лабораторный эксперимент - методическая стратегия, направленная на моделирование деятельности индивида в специальных условиях. Он основан на создании искусственных ситуаций, позволяющих изменять контролируемые переменные и следить за сопутствующими изменениями зависимых переменных. Чаще всего такой метод требует специального оснащения, а порой и применения технических приспособлений. Ведущим признаком лабораторного эксперимента является обеспечение воспроизводимости исследуемой характеристики и условий ее проявления. Требование чистоты получаемых данных вместе с тем связано и с некоторыми ограничениями: в искусственных лабораторных условиях практически невозможно моделировать реальные жизненные обстоятельства, только отдельные их фрагменты.
Примером может служить исследование процесса узнавания при помощи специальной установки, которая позволяет на особом экране (типа телевизионного) постепенно предъявлять испытуемому разное количество зрительной информации (от нуля до показа предмета во всех его деталях), чтобы выяснить, на каком этапе человек узнает изображаемый предмет. Лабораторный эксперимент содействует глубокому и всестороннему изучению психической деятельности людей. В лабораторных условиях проводятся обычно социально-психологические и психологические эксперименты.
Полевой эксперимент проходит в естественных для изучаемого процесса условиях. Методика этого эксперимента требует подбора контрольных и экспериментальных групп с необходимым набором переменных. При этом члены группы (испытуемые) могут быть осведомлены либо не осведомлены о том, что они участвуют в эксперименте. Решение об их осведомлении в каждом конкретном случае зависит от того, насколько эта осведомленность может повлиять на ход эксперимента.В полевом эксперименте выезжают на место поселения первобытных племен, жительства национальных меньшинств или место работы других социальных общностей, ставших объектом изучения.
Так, Шефилд и Андерсон с коллегами в течение трех лет изучали межнациональные отношения в средней школе США. В первый год они выяснили, что белые и черные американцы по-разному реагируют на проявления подростковой агрессивности на переменах (взаимные толки, перебранку, потасовки), на уроках (списывание, взятие без спроса чужой авторучки и т.д.), в столовой (перебранки за столом). В интервью также выяснилось, что белые настроены к черным дружественнее, чем те к ним. Для проверки выявленных фактов Шефилд и Андерсон в 1987 г. провели полевой эксперимент. По случайной выборке они отобрали по 40 белых и черных студентов-мужчин. Каждому предъявляли серию рисунков и рассказов с проявлением умеренных форм агрессивности. Испытуемые должны были проранжировать свои оценки поведения нарушителей - от одобрения и равнодушия до резкого осуждения. В результате белые увидели в действиях черных большую угрозу, чем те у них. Ученые пришли к выводу, что страх перед неграми прививает белым подросткам сама школа.
Рональд Миллиман (1986) провел полевой эксперимент, в ходе которого изучал реакцию посетителей ресторана на быструю и медленную музыку. По случайной выборке он опросил 227 человек. Определив, как воспринимается темп музыки, ученый по субботам вечером сам играл медленную, а по пятницам быструю музыку. Затем менял график. Выяснилось: темп музыки влияет на время, которое посетители проводят за столом. При медленной музыке они сидели в ресторане 56 мин, а при быстрой управлялись с едой за 45. Причем разница в 11 мин приносила владельцам выручку в 30,5 долл. А если учесть выручку бара при ресторане, то выгода от медленной музыки становится еще больше.
Марвин Харрис провел в Бразилии эксперимент по замене слов в вопросе, касающемся расовых отношений. Эксперимент проводился во время переписи населения. Демографы считали уместным и благозвучным слово parda предпочтя его слову morena, который для англоговорящих жителей означало «brown» (смуглый). Харрис решил выяснить, как скажется на ответах замена первого слова на второе. По случайной выборке он отобрал 505 домов, разбил их на две равные группы и проинтервьюировал по одному взрослому в каждом. В каждой группе задавали открытый и закрытый вопросы. Открытый звучал так: какого цвета, по их мнению, у них кожа. Закрытые различались набором закрытий - по 4 разных понятия, обозначавших цвет кожи. Необходимо выбрать один вариант. В первой группе варианты были следующие: branca (белые), parda (серый или коричневый), prela (черный) и amerela (желтый). У второй: branca, morena (коричневый), preta и amerela. В первой группе респонденты выбрали parda, а во второй - morena. По результатам эксперимента выработаны практические рекомендации по проведению переписи.
Полевые эксперименты по упрощенной схеме часто проводят журналисты. На время замаскировавшись под представителей какой-то социальной группы или профессии, например нищих, они выходят на улицу, спускаются в метро или заходят в общественный транспорт, прося милостыню. Главная цель - посмотреть реакцию людей. Они получают прекрасную информацию что называется из первых рук. В результате - публицистический очерк живыми красками реальных событий.
Истинные эксперименты , организованные с соблюдением всех требований научного метода, выработанных естествознанием (программа исследования, выдвижение гипотез о причинно-следственных связях, зависимых и независимых переменных, статистический подбор экспериментальной и контрольной групп, ученые не проводят контроль над всеми факторами, которые влияют на конечный результат, и т.д.), встречаются в социальных науках достаточно редко. Какое-либо правило обязательно нарушается или полностью не выполняется. Оправдываясь, социальные ученые кивают на сложность предмета своей науки, вмешательство человеческого фактора и множество других причин, которые отсутствуют, скажем, в физике.
Гораздо чаще в социальных науках применяется квазиэксперимент . Его считают чем-то противоположным истинному эксперименту. В квазиэкспериментах нарушаются все мыслимые и немыслимые требования научного метода, а именно отсутствует программа исследования, не выдвигаются гипотезы и переменные, не создаются два обязательных типа группы и т.д., тем не менее эксперимент считается проведенным16. От эксперимента в подобной процедуре порою остается одно - воздействие субъекта на объект, изменение социальной среды. Вот почему практически все социальные эксперименты принимают форму квазиэкспериментов. Поскольку они достигают того или иного (иногда среда улучшается, иногда ухудшается) практического эффекта, например в городе устанавливается платный телефон, вводится оригинальная система оплаты проезда, внедряется особая система льгот для инвалидов и т.п., их называют также социальным нововведением (инновацией, внедрением). Хотя в социальных инновациях нарушаются строгие принципы научного эксперимента, их нельзя считать бессмысленными или ненужными человечеству мероприятиями. Во-первых, к социальной реальности неприменима во всем объеме та методика, которую разработали для эксперимента физики или биологи. Во-вторых, истинные эксперименты в естественно-научном понимании этого слова попросту не нужны обществу. Естественные хард-методологии и жесткие стратегии неуместны, неадаптированы и легко разрушаемы в социатьной реальности. Здесь гораздо эффективнее софт-методологии и мягкие или гибкие научные стратегии. В одном из них испытуемыми были школьники начальных классов. Одну группу учили быстрому чтению, а другую нет. После эксперимента школьников опрашивали, произошли ли у них улучшения. Этот эксперимент имеет черты истинного, но в отличие от того здесь не соблюдалось условие случайного отбора респондентов перед их распределением на экспериментальную и контрольную группы. Д. Кемпбелл и Дж. Стенли (1963) доказали, что отсутствие случайной выборки серьезно влияет на качество результатов.
Натурный эксперимент сильно отличается от истинного и квазиэкспериментов. Во втором случае любое вмешательство устраивается ученым, в первом оно происходит естественно. К натурным относятся такие случаи: а) часть жителей решила уехать из деревни в город, а часть остаться; б) в некоторые деревни в данном регионе провели электричество, а в другие нет; в) часть представителей национального меньшинства посещает школы для представителей среднего класса, а часть обучается в резервации; г) некоторые культуры практикуют женский инфантицид, а другие нет. Любая из этих ситуаций может стать объектом натурного эксперимента, в ходе которого изучаются аспекты поведении людей. В таких случаях нельзя провести претест, измерить независимые переменные до начала вмешательства. Ученый теоретически или по вторичным источникам мысленно восстанавливает исходные условия, затем изучает ход эксперимента и последствия. Часто он лишь застает последние, а все другое приходится реконструировать по опросам респондентов.
X. Бернард описывает знаменитый натурный эксперимент, проведенный в 1955 г. в штате Коннектикут, губернатор которого ввел закон об ограничении скорости на дорогах. Количество ДТП сократилось с 324 в 1955 г. до 284 в 1956 г. Реформа сохранила жизнь 40 гражданам, хотя число штрафов сильно возросло18. Ученых интересовало: являлись ли суровые меры наказания причиной сокращения числа ДТП. За решение взялись Campbell and Ross (1968). Они просчитали статистику ДТП за 1951-1959 гг. в Коннектикуте, Массачусетсе, Нью-Йорке и Нью-Джерси. Все штаты были примерно похожи по климату и количеству ДТП. Выяснилось: во всех штатах выросло число ДТП в 1955 г. и сократилось в 1956. Если опираться лишь на эти данные, то можно заключить, что усилия губернатора Коннектикута ни к чему не привели. Однако количество ДТП постоянно сокращалось еще в течение трех лет. В других же штатах статистика ДТП колебалась по годам без всякой видимой закономерности. Campbell and Ross интерпретировали полученные данные как серию натуральных экспериментов (series of natural experiments) и убедительно доказали, что реформа губернатора на дорогах своего штата удалась.
Известны натуральные эксперименты, проводившиеся на бирже ценных бумаг (изучалось колебание активности брокеров в зависимости от того, проводятся в эти часы и дни крупные матчи по американскому футболу или нет). В 1976 г. Циалдини провел подобный эксперимент в ряде крупных университетов и выяснил (опросив профессоров университетов, попавших в выборку), что после выигрыша любимой команды студенты ведут себя на лекциях иначе, чем после проигрыша. В таких случаях футбольный матч - это естественное событие, а не стимульный материал, предоставляемый испытуемым в лабораторных условиях.
В отличие от натурального эксперимента, где стимульный материал не придумывается, в натуралистическом эксперименте мы искусственно конструируем условия и обстановку, позволяющие собрать необходимую информацию.
Такой эксперимент провел Стенли Милграм (1967). Он попросил американцев со Среднего Запада послать студентам богословского факультета Гарварда в подарок небольшую книжечку, но только если они с ними знакомы. К книжечке прилагалась просьба передать подарок своим знакомым, а те, как следовало из инструкции, должны были переслать их своим знакомым. В конце концов многие книжечки вернулись на круги своя, т.е. попали в руки к тем, кто их запустил. Таким способом ученый доказал свою цель - как узок этот громадный мир. Среднее число переходов, совершенных каждым письмом, равнялось 5. Через стольких людей прошла книжечка прежде чем вернулась в исходную точку. Таким способом ученые выясняют количество социальных связей между людьми.
По логической структуре доказательства гипотез различают линейный (последовательный) и параллельный эксперимент .
Линейный эксперимент проводится без контрольных групп и основан на сравнении состояния контролируемых и зависимых переменных до и после экспериментального воздействия. Он отличается тем, что анализу подвергается одна и та же группа, являющаяся и контрольной (ее первоначальное состояние), и экспериментальной (ее состояние после изменения одной или нескольких характеристик). Иными словами, еще до начала эксперимента четко фиксируются все контрольные, факторные и нейтральные характеристики объекта. После этого изменяются факторные характеристики группы (или условия ее функционирования), и по истечении определенного, заранее заданного времени вновь измеряется состояние объекта по его контрольным характеристикам. Очень важно, чтобы в процессе линейного эксперимента было исключено воздействие на объект анализа мешающих факторов.
Параллельный эксперимент предполагает использование контрольных групп, в которых состояние независимых и зависимых переменных измеряется параллельно с их состоянием в экспериментальной группе, причем экспериментальные воздействия в контрольной группе не производятся. Состав групп должен быть идентичен по всем контрольным, а также по нейтральным характеристикам, которые могут повлиять на исход эксперимента (в первую очередь это социально-демографические признаки). Характеристики контрольной группы остаются постоянными в течение всего периода эксперимента, а экспериментальной - изменяются. По итогам эксперимента контрольные характеристики двух групп сравниваются и делается вывод о причинах и величине произошедших изменений.
В зависимости от активности экспериментатора различают активные и пассивные эксперименты. Первый предусматривает целенаправленное изменение изучаемой ситуации за счет введения контролируемой переменной, являющейся гипотетической причиной состояния зависимой переменной. Экспериментатор прибегает к управленческому воздействию на изучаемый объект: вводятся новая форма оплаты труда, скользящий график выходных дней, система контроля качества и т.д. Пассивный эксперимент характеризуется подбором в естественных условиях объектов, обладающих нужным экспериментатору сочетанием переменных.
Например, при изучении связи между качеством служебных инструкций и успешностью деловых взаимоотношений между членами первичных трудовых коллективов, связанных отношениями партнерства, могут быть подобраны коллективы-партнеры, отличающиеся качеством должностных инструкций и выравненные по другим переменным, которые влияют на взаимоотношения этих коллективов (стаж работы руководителей и рядовых сотрудников, уровень квалификации и т.д.).
Эксперимент «экс-пост-фактум» предусматривает реконструкцию действия гипотетической причины от настоящего к прошлому. Известен эксперимент «экс-пост-фактум», проведенный в США (в 1930-х гг.), по изучению влияния уровня образования выпускников школ на экономическую адаптацию в обществе в период самостоятельной жизни.
Мысленным экспериментом называют специальную технологию интерпретации полученной информации об изучаемом объекте, исключающую вмешательство исследователя в процессы, происходящие в объекте.
В каждой области знания выделяют свои типы и виды экспериментов. Так, в психологии используются следующие их разновидности.
Ассоциативный эксперимент - проективный метод, предложенный одновременно К. Г. Юнгом, М. Вертгеймером и Д. Кляйном и предназначенный для исследования мотивации личности. В нем испытуемому предлагается как можно быстрее отвечать на набор слов-стимулов любым словом, которое приходит ему в голову. При этом возникающие ассоциации регистрируются по их типу, частоте однородных ассоциаций, времени между словом-стимулом и ответом испытуемого. На основании полученных данных делается вывод о скрытых влечениях и аффективных комплексах испытуемого.
Двойной слепой опыт - особая экспериментальная процедура, когда не только испытуемый остается в неведении о смысле и особенностях проведения эксперимента, но и экспериментатор, который его проводит. За счет таких условий достигаются исключение возможности влияния экспериментатора на результаты эксперимента и повышение показателей его объективности. В частности, подобные условия могут моделироваться с помощью компьютера.
Естественный эксперимент - экспериментальная стратегия, разработанная А.Ф. Лазурским в 1910 г. Характеризуется тем, что проводится в условиях, близких к обычной деятельности испытуемого, который не знает, что участвует в исследовании. За счет этого достигается большая чистота эксперимента. Основными методами являются наблюдение и беседа с испытуемым, результаты чего обрабатываются качественно. Такой эксперимент сочетает в себе положительные стороны метода наблюдения и лабораторного эксперимента. Здесь сохраняется естественность условий наблюдения и вводится точность эксперимента. Для правильного и успешного проведения естественного эксперимента необходимо соблюдать все те требования, которые предъявляются к лабораторному эксперименту. В соответствии с задачей исследования экспериментатор подбирает такие условия, которые обеспечивают наиболее яркое проявление интересующих его сторон психической деятельности. Вариантом естественного эксперимента является психолого-педагогический эксперимент, или экспериментальное обучение, где изучение психических особенностей школьника, подлежащих формированию, осуществляется в процессе обучения и воспитания.
Обучающий эксперимент - форма естественного эксперимента, который характеризуется тем, что изучение тех или иных психических процессов происходит при их целенаправленном формировании. С помощью данного метода выявляется не столько наличное состояние знаний, умений, навыков, сколько особенности их становления.
В его рамках испытуемому сначала предлагается самостоятельно овладеть новым действием или новым знанием (например, сформулировать закономерность), затем, если это не удалось, ему оказывается строго регламентированная и индивидуализированная помощь. Весь этот процесс сопровождается констатирующим экспериментом, благодаря которому удается установить различие начального, актуального уровня и конечного, соответствующего зоне ближайшего развития. Обучающий эксперимент используется не только в теоретической психологии, но и для диагностики умственного развития, в частности в патопсихологии. Обучающий эксперимент стал применяться в отечественной психологии в конце 30-х гг.
Производственный эксперимент - естественный эксперимент, осуществляющийся в обычных для испытуемого условиях его труда. При этом о проведении производственного эксперимента сам работник может и не знать. В других же случаях он становится активным участником эксперимента, что важно, например, при изменении структуры трудовой деятельности.
При проведении эксперимента иногда допускают ошибки и возникают определенные трудности:
· эксперимент производится для получения информации, которая может быть добыта иными, более простыми способами;
· за эксперимент выдается включенное или стандартизированное невключенное наблюдение;
· экспериментальная ситуация четко не определена, в силу чего эксперимент проводится с нарушением его условий;
· субъективные оценки экспериментальной ситуации преобладают над объективными характеристиками;
· неправильно построена теоретическая система переменных, перепуганы причины и следствия;
· нет органической связи проведенного эксперимента с целью, задачами и гипотезами исследования;
· сформулированные гипотезы не отражают проблемных ситуаций, существенных зависимостей в изучаемом объекте;
· допущена двусмысленность или иная существенная значимая неточность в формулировке гипотезы, вынесенной на экспериментальную проверку;
· в качестве независимой переменной выделен фактор, который не может быть причиной, устойчивой детерминантой процессов, происходящих в изучаемом явлении;
· экспериментальный фактор (независимая переменная) выбран произвольно, без учета того, что он должен играть роль детерминанты и поддаваться управлению со стороны исследователя;
· недооценено воздействие на зависимые переменные факторов, не входящих в независимую переменную;
· связи между зависимой и независимой переменными носят случайный характер, неправильно установлена структура переменных;
· независимая и зависимые переменные не нашли адекватного выражения в эмпирических индикаторах;
· допущены ошибки в предварительном описании объекта, что привело к неверной эмпирической интерпретации переменных, выбору неадекватных показателей;
· были допущены ошибки при формировании экспериментальных и контрольных групп. В ходе эксперимента обнаружилось значительное различие групп, что вызвало сомнение в возможности сравнивать эти группы по составу переменных;
· для экспериментальной группы трудно подобрать контрольную;
· в ходе эксперимента выяснились такие важные свойства экспериментальной группы, которые не были известны до его начала;
· контрольная группа не представляет собой аналога экспериментальной группы по существенным для исследования параметрам;
· не поддается нейтрализации действие побочных факторов, трудно создать экспериментальную ситуацию;
· не обеспечен достаточный уровень измерения и контроля за состоянием переменных;
· при анализе данных использовался логико-математический аппарат, который неприменим к изучаемому классу явлений;
· при анализе результатов эксперимента социолог переоценивает воздействие независимой на зависимую переменную, недоучитывает влияние ряда случайных факторов на изменения в экспериментальной ситуации;
· инструментарий эксперимента нацелен лишь на фиксацию определенных данных (по типу инструмента наблюдения), а не на соблюдение чистоты эксперимента;
· использованные при анализе полученной информации статистические методы не соответствуют природе причинно-следственных связей;
· выводы экспериментаторов подстраиваются (подгоняются) под гипотезу без достаточных на то оснований;
· эксперимент проводится над людьми, которые не желают этого и сопротивляются ему;
· среди организаторов экспериментальных работ оказались люди, не заинтересованные в положительных результатах эксперимента;
· в ходе эксперимента возникли конфликты среди участников по поводу участия в эксперименте;
· коллектив отказывается принять участие в эксперименте, мотивируя свой отказ тем, что ранее уже приходилось участвовать в эксперименте и ничего кроме лишних забот это участие не принесло.
Общие принципы планирования экспериментов
Сравнение.
Рандомизация.
Репликация.
Однородность.
Стратификация.
уровнями фактора
Название: Общие принципы планирования экспериментов
Детальное описание:
С момента своего появления наука ищет пути к познанию законов окружающего мира. Совершая одно открытие за другим, ученые поднимаются все выше и выше по лестнице знания, стирая границу неизвестности и выходя на новые рубежи науки. Этот путь лежит через эксперимент. Сознательно ограничивая бесконечное разнообразие природы искусственными рамками научного опыта, мы превращаем его в понятную для человеческого разума картину мира.
Эксперимент как научное исследование - это форма, в которой и посредством которой наука существует и развивается. Эксперимент требует тщательной подготовки перед его проведением. В биомедицинских исследованиях планирование экспериментальной части исследования имеет особенно большое значение по причине широкой вариабельности свойств, характерной для биологических объектов. Эта особенность является основной причиной трудностей при интерпретации результатов, которые могут значительно различаться от опыта к опыту.
Статистические проблемы обосновывают необходимость выбора такой схемы эксперимента, которая минимизировала бы влияние вариабельности на выводы ученого. Поэтому цель планирования эксперимента заключается в создании схемы, которая необходима для получения как можно большей информации при наименьших затратах для выполнения исследования. Более точно планирование эксперимента можно определить как процедуру выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью.
Планирование эксперимента появилось в агробиологии и связано с именем английского статистика и биолога сэра Рональда Эйлмера Фишера. В начале XX века на агробиологической станции в Ротамстеде (Великобритания) начались исследования влияния удобрений на урожайность различных сортов зерновых. Ученые вынуждены были считаться как с большой изменчивостью объектов исследования, так и с большой продолжительностью опытов (около года). В этих условиях не было иного пути, кроме разработки продуманного плана эксперимента для уменьшения негативного влияния указанных факторов на точность выводов. Применив статистические знания к биологическим проблемам, Фишер пришел к разработке собственных принципов теории статистического вывода и положил начало новой науке о планировании и анализе экспериментов.
Сам Рональд Фишер объяснял основы планирования на примере эксперимента произведенного для выяснения способности некой английской леди различать, что было налито в чашку в первую очередь - чай или молоко. Следует отметить, что для настоящих английских леди важно, чтобы чай наливался в молоко, а не наоборот, нарушение последовательности будет признаком невежества и испортит вкус напитка.
Эксперимент проходит просто: леди пробует чай с молоком и по вкусу пытается понять, в какой очередности были налиты оба ингредиента. План, разработанный для этого исследования, характеризуется рядом свойств.
Сравнение. Во многих исследованиях точное определение результата измерения затруднительно или невозможно. Так, например, леди не сможет количественно оценить качество чая, она будет сравнивать его с эталоном правильно приготовленного напитка, вкус которого знаком ей с детства. Как правило, в научном эксперименте объект сравнивается либо с неким заранее заданным стандартом, либо с контрольным объектом.
Рандомизация. Это очень важный момент в планировании. В нашем примере рандомизация относится к тому, в каком порядке представлять чашки на дегустацию. Рандомизация необходима для того, чтобы стало возможным применение статистических методов для анализа результатов исследования.
Репликация. Повторяемость - это необходимый компонент постановки эксперимента. Недопустимо делать выводы о способности к определению качества чая только по одной чашке. Результат каждого отдельного измерения (дегустации) несет в себе долю неопределенности, возникшей под влиянием множества случайных факторов. Следовательно, для выявления источника вариабельности необходимо провести несколько испытаний. С этим свойством связана чувствительность эксперимента. Фишер отмечал, что пока число чашек чая не превысит некоторого минимума, невозможно сделать какие-либо однозначные выводы.
Однородность. Несмотря на необходимость повторения измерений (репликация), их число не должно быть слишком велико, чтобы не утратилась однородность. Разность температур чашек, притупление вкуса и т. п. при превышении некоторого предельного числа повторений, могут затруднить анализ результатов эксперимента.
Стратификация. Выходя за рамки примера Р. Фишера к более абстрактному описанию экспериментального плана можно дополнительно указать такое свойство как стратификация (блокировка). Стратификация - это распределение экспериментальных единиц в относительно однородные группы (блоки, слои). Процедура стратификации позволяет минимизировать эффект известных нам неслучайных источников вариабельности. Внутри каждого блока ошибку эксперимента предполагают меньшей относительно варианта со случайным отбором для эксперимента такого же количества объектов. Например, при исследовании нового лекарственного препарата мы имеем два уровня фактора - «препарат» и «плацебо», которые назначаются мужчинам и женщинам. В данном случае пол - это блокирующий фактор, по которому происходит разделение исследуемых на подгруппы.
Описанные выше характеристики экспериментального плана полностью или частично относятся к любому научному эксперименту. Однако для начала работы недостаточно одного только знания об общих свойствах исследования, необходима более тщательная подготовка. Создание подробного руководства в рамках одной статьи невозможно, поэтому здесь будет изложена наиболее общая информация об этапах планирования эксперимента.
Любое исследование начинается с постановки цели. Выбор проблемы для изучения и ее формулировка повлияют как на дизайн исследования, так и на выводы, которые будут сделаны по его результатам. В самом простом случае формулировка проблемы должна предполагать вопросы «Кто?», «Что?», «Когда?», «Почему?» и «Как?».
В качестве иллюстрации важности данного этапа планирования можно привести исследование, в котором проводится сбор информации о дорожно-транспортных происшествиях. В зависимости от постановки цели, работа может быть направлена на разработку нового автомобиля либо нового дорожного покрытия. Несмотря на то, что используется один и тот же набор данных, постановка задачи и выводы существенно различаются в зависимости от формулировки проблемы.
После выбора цели работы следует определить так называемые зависимые переменные. Это переменные, которые будут измеряться при проведении исследования. Например, показатели функционирования тех или иных систем организма человека или лабораторных животных (частота сердечных сокращений, артериальное давление, содержание ферментов в крови и т. п.), а также любые другие характеристики объектов исследования, изменение которых будет для нас информативно.
Поскольку есть зависимые переменные, то должны быть еще и независимые переменные. Другое их название - факторы. Факторами исследователь оперирует в эксперименте. Это может быть доза исследуемого препарата, уровень стресса, степень физической нагрузки и т. д. Взаимосвязь между фактором и зависимой переменной удобно представлять с помощью кибернетической системы, часто называемой «черный ящик».
Черный ящик - это система, механизм работы которой нам неизвестен. Однако исследователь имеет информацию о том, что происходит на входе и выходе черного ящика. При этом состояние выхода функционально зависит от состояния входа. Соответственно y1, y2, ..., yp - это зависимые переменные, величина которых зависит от факторов (независимых переменных x1, x2, ..., xk). Параметры w1, w2, ..., wn представляют собой возмущающие воздействия, не поддающиеся контролю или изменяющиеся со временем.
В общем виде это можно записать так: y=f(x1, x2, ..., xk).
Каждый фактор в опыте может принимать одно из нескольких значений. Такие значения называют уровнями фактора . Может оказаться, что фактор способен принимать бесконечное число значений (например, доза лекарственного препарата), однако на практике выбирается несколько дискретных уровней, количество которых зависит от задач конкретного опыта.
Фиксированный набор уровней факторов определяет одно из возможных состояний черного ящика. Вместе с тем, это есть условия проведения одного из возможных опытов. Если перебрать все возможные наборы таких состояний, то мы получим полное множество различных состояний данной системы, количество которых будет числом всех возможных экспериментов. Для того, чтобы вычислить количество возможных состояний, достаточно число уровней факторов q (если для всех факторов оно одинаково) возвести в степень количества факторов k.
Совокупность всех возможных состояний определяет сложность черного ящика. Так, система из десяти факторов на четырех уровнях может находиться более чем в миллионе разных состояний. Очевидно, что в подобных случаях невозможно провести исследование, включающее все возможные опыты. Поэтому на этапе планирования решается вопрос о том, сколько опытов и каких именно необходимо провести для решения поставленной задачи.
Следует отметить, что свойства объекта исследования имеют существенное значение для эксперимента. Во-первых, нам надо иметь информацию о степени воспроизводимости результатов опытов с данным объектом. Для этого можно провести эксперимент, а затем повторить его через неравные промежутки времени и сравнить результаты. Если разброс значений не превышает наших требований к точности эксперимента, то объект удовлетворяет требованию воспроизводимости результатов. Другое требование к объекту - его управляемость. Управляемым считается объект, на котором можно провести активный эксперимент. В свою очередь, активный эксперимент - это такой эксперимент, в процессе которого исследователь имеет возможность выбора уровней факторов, представляющих для него интерес.
На практике не существует полностью управляемых объектов. Как уже говорилось выше, на реальный объект действуют как управляемые, так и неуправляемые факторы, что приводит к вариабельности результатов между отдельными объектами. Отделить случайные изменения от закономерных, вызванных различными уровнями независимых переменных, мы можем лишь с помощью статистических методов.
Но статистические методы эффективны лишь в определенных условиях. Одно их таких условий - это требование некоего минимального размера выборок, используемых в проведении эксперимента. Очевидно, что чем шире диапазон изменения признаков от объекта к объекту, тем больше должна быть повторность опыта, т. е. численность экспериментальных групп.
Поскольку, неоправданно большое число испытаний сделает исследование слишком дорогим, а недостаточный объем выборки может поставить под сомнение точность выводов, определение необходимого объема выборок играет решающую роль в планировании эксперимента. Методы вычисления минимального объема выборок подробно описаны в специальной литературе, поэтому привести их в статье не представляется возможным. Тем не менее, следует упомянуть, что они требуют предварительного определения средней величины исследуемого показателя и ее ошибки. Источником такой информации могут послужить публикации о похожих исследованиях. Если они еще не проводились, то возникает необходимость в выполнении предварительного «пилотного» исследования для оценки вариабельности признака.
Следующий этап в планировании экспериментов - это рандомизация. Рандомизация представляет собой процесс используемый для группировки объектов таким образом, чтобы у каждого из них была равная вероятность попасть в контрольную или опытную группу. Другими словами, выбор участников исследования должен происходить случайно, чтобы исследование не было отклонено в сторону «предпочтительного» для исследователя результата.
Рандомизация помогает предотвратить смещения, обусловленные причинами, которые не были непосредственно учтены в плане эксперимента. Для этого, например, формирование экспериментальных групп лабораторных животных производится случайным образом. Однако полная рандомизация возможна далеко не всегда. Так, в клинических исследованиях принимают участие пациенты определенной возрастной группы, с заранее заданным диагнозом и тяжестью заболевания, а, следовательно, отбор участников не является случайным. Кроме того, ограничивают рандомизацию так называемые «блочные» планы экспериментов. Эти планы подразумевают, что отбор в каждый блок выполняется в соответствии с определенными неслучайными условиями, а случайный отбор объектов исследования возможен только внутри блоков. Процесс рандомизации легко осуществить с помощью специализированного статистического программного обеспечения или специальных таблиц.
В заключение необходимо сказать о необходимости учета в плане исследования помимо требований медицины и статистики еще и морально-этических норм. Не стоит забывать о том, что не только люди, но и лабораторные животные должны вовлекаться в эксперимент в соответствии с этическими принципами.
Эксперимент играет огромную роль в современной науке. Все новые технические открытия обязаны именно эксперименту. Какие возникают сложности при проведении эксперимента, а так же каковы методы его проведения, поговорим в этой статье.
В наше время ни одно научное или техническое исследование не может обойтись без экспериментов . Эксперимент необходим в области прикладных наук, а также при разработке новой науки. Таким образом, этого требует технический прогресс.
Проблемы эксперимента
Благодаря техническому прогрессу инженер-экспериментатор сталкивается с новыми трудностями. Одна из них в том, что параметры испытуемых объектов, которые нужно определить, часто недоступны непосредственному измерению (долговечность, коррозионная стойкость и т.п.). То есть совокупность технико-экономических показателей, по которым выполняется оценка объекта испытаний, не совпадает, в большинстве случаев, с совокупностью параметров объекта, определяемых по результатам натурного эксперимента.
Еще одна проблема заключается в возможности организовать испытания объектов, процессы протекания которых характеризуются сложной динамикой и склонны к воздействиям непостоянных условий внешней среды.
При испытаниях сложных комплексов повышается значение учета тех воздействий, которые оказывает испытательное регистрирующее и управляющее оборудование на сам процесс функционирования испытуемого объекта.
Поэтому главным принципом организации эксперимента в современных условиях является системный подход.
Системный подход предполагает рассмотрение всех средств, участвующих в эксперименте как единой системы, описываемой соответствующей математической моделью. Тем самым математическая модель становится элементом испытаний, которая строится после осуществления, планирования эксперимента, его проведения и обработки результата. Только наличие соотношений, связывающих искомые технико-экономические характеристики испытуемого объекта с его параметрами, позволяет получить обоснованные суждения о перечне необходимых испытательных мероприятий и их рациональной последовательности, совокупности регистрируемых величин, об условиях к точности измерений, частоте регистрации и т.п.
Чтобы построить математическую модель необходимо иметь представление о поведении отдельных элементов, взаимодействии между ними, влиянии различных факторов, а также о реакции на изменения условий испытаний.
Методы проведения
Что может объединять инженеров, физиков, биологов, социологов и других специалистов? Биологи проверяют лекарственные аппараты на животных, клонируют, инженеры проводят научные исследования, испытывают различные материалы, социолог же собирает и обрабатывает информацию. У каждого специалиста свой путь, объединяет их лишь – эксперименты.
В способах проведения эксперимента в различных отраслях все же есть много общих черт:
1. Все исследователи обращают внимание на точность измерительных приборов и точность получаемых данных.
2. Каждый исследователь старается минимизировать количество переменных, участвующих в эксперименте, поскольку его работа будет выполнена быстрее и понесет меньше затрат.
3. Эксперимент может быть любой сложности, но первое, что необходимо сделать – это написать план его проведения. При построении плана эксперимента очень важно правильно и четко формулировать вопросы.
4. Во время проведения эксперимента исследователь должен проверять испытуемый объект на наличие ошибок и неполадок. С этой задачей связана проверка приемлемости полученных данных. Результаты не должны противоречить логике.
5. Во время проведения любого эксперимента нужно делать анализ полученных данных и давать им объяснение, потому что без этого пункта эксперимент не будет иметь смысла.
6. Все исследователи контролируют проводимый эксперимент, то есть можно опустить зависимость от внешних переменных.
По характеру эксперименты вполне могут отличаться друг от друга, но планирование, проведение и анализ всех экспериментов должен выполняться в одной последовательности. Результаты экспериментов выводятся, как правило, в виде таблиц, графиков, формул. Но отличие – в качестве эксперимента.
Каждый эксперимент завершается представлением результата, формулировкой вывода и выдачей рекомендации. Чтобы получить зависимость результата от нескольких параметров, требуется построить несколько графиков, либо построить график в изометрических координатах. С помощью графиков изобразить сверхсложные функции пока не представляется возможным. Выводя результаты в виде математических формул, можно выразить зависимость результата от большего числа переменных. Но все же, как правило, ограничиваются 3 переменными.
Вывод результатов эксперимента в словесной форме является самым неэффективным.
В конце большинства технических экспериментов следует определенное действие – принятие решения, продолжение испытаний или признание неудачи.
Исследователь должен методично и полностью обдумать все вероятные внешние воздействия и оптимальные методы контроля. Он должен быть способен отличить исключительный и особенный эффект от множества посторонних влияний и внешних факторов ошибок.
Случайные открытия появляются тогда, когда все предвиденные возможности заранее подсчитаны, предсказаны, либо устранены, и могут открыться только совершенно новые, неисследованные ранее возможности.
При экспериментировании даже опытный исследователь не гарантирован от ошибок и искажений информации. Часть из них можно устранить, если более тщательно подходить к построению эксперимента. Другая часть в принципе неустранима» Но учет самой этой возможности, - возможности ошибок - позволяет вносить необходимые поправки.
Прежде всего ошибочно может быть названо экспериментом то что по сути дела таковым не является. При проведении параллельного эксперимента можно например, в одной заводской бригаде изменить систему оплаты труда, а в другой не менять, и может оказаться, что в первой бригаде производительность труда повысилась. Однако такого рода ситуация ни в коей мере не будет экспериментальной, если - не будут приняты во внимание некоторые важные характеристики обеих групп и за ними ни будет установлен: контроль.
Экспериментальная и контрольная бригады должны быть равными по количественному составу, по роду деятельности, по распределению производственных функций, по типу руководства или другим важным c точки зрения гипотезы характеристикам. Если какие-либо важные групповые свойства не могут быть выравнены, следует попытаться их каким-то образом нейтрализовать или зафиксировать и учесть при анализе результатов.
В тех случаях, когда социолог не делает этого, он не имеет нрава называть созданную ситуацию экспериментальной и объяснять изменение производительности изменением системы оплаты труда, так как изменение производительности может оказаться вызванным любым другим случайным фактором, а не изменением; оплаты труда. Прежде чем называть исследование экспериментальным, исследователь должен проанализировать, есть ли у него для: этого основания, иными словами, создал ли он необходимые условия и обеспечил ли нужный уровень измерения и контроля.
При формулировании гипотезы и при переходе от общей гипотезы коперациональным переменным могут возникнуть ошибки, связанные с логикой рассуждений.
В качестве объединяющей причины при формулировке гипотезы: могут быть ошибочно определены выделенные механизмы и связи. Обычно это бывает при изучении малоизвестных явлений, и тогда полученные в эксперименте негативные результаты являются положительным вкладом в разработку теоретической модели объекта наблюдения, так как они показывают, что данный механизм или связь не обусловливают происходящих процессов.
Ошибки возможны при переходе от определения гипотетической
связи к описанию ее эмпирических показателей. Неверно выбранные показатели лишают эксперимент какой бы то ни было ценности, вне зависимости от того, насколько тщательно оно проводился. Возможны ошибки, связанные, с субъективным восприятием ситуации как участниками эксперимента, так и исследователем. Экспериментатору часто бывает свойственна тенденция переоценивать воздействие исследуемой переменной, и это приводит к тому, что любой двусмысленный факт он склонен толковать в желательном для него направлении.
Возможность субъективном толкования ситуации есть и у членов экспериментальной группы: они могут воспринимать определенные черты экспериментальной ситуации в соответствии, с собственными установками, а не в том значении, в каком они представляются экспериментатору. Такое расхождение в восприятии если оно не учитывается при планировании эксперимента, обязательно скажется в ходе анализа результатов и значительно снизит их достоверность.
Ослабление контроля и понижение степени «чистоты» эксперимента повышают возможность воздействия дополнительных переменных или случайных факторов, которое по окончании эксперимента не может быть учтено или оценено. Это в свою очередь очень сильно понижает достоверность сделанных выводов.
Недостаточно опытного, исследователя подстерегает опасность, связанная с применением статистических методов, Он может применить методы, не соответствующие задаче исследования. Такая возможность относится как к построению экспериментальной группы, так и к способу анализа результатов.
Применение эксперимента в социологии связано с целым рядом трудностей, не позволяющих добиться чистоты естественнонаучного эксперимента, поскольку нельзя устранить влияние отношений, существующих за пределами исследуемого, невозможно осуществить контроль факторов в той степени, как это удается в естественнонаучном эксперименте, повторить в той же самой форме ход и результаты.
Эксперимент в социологии затрагивает непосредственно конкретного человека, а Это ставит также и эпические проблемы, естественно, сужает границы применения эксперимента и требует от исследователя повышенной ответственности.
Литература для дополнительного чтения
Ленин В. R, Великий почин. - Полн. собр. соч., т. 39, с. 1-29.
Афанасьев В. Г. Управление обществом как социологическая проблема. - В кн.: Научное управление обществом. М.: Мысль, 1968, вып. 2, с. 218-219.
Мелева Л. А., Сивоконь П. Е. Социальный эксперимент и его методологические основы. М.: Знание 1970. 48 с.
Кузнецов В. П. Эксперимент как метод преобразования объекта.- Вести. МГУ.
Сер. 7. Философия, 1975, № 4, с. 3-10.
Куприян А. П. Проблема эксперимента в системе общественной практики М. Наука, 1981. 168 с.
Лекции по методике конкретных социальных исследований/Под ред. Г. М. Анддреевой. М.: Изд-во МГУ, 1972, с. 174-201.
Михайлов С. Эмпирическое социологическое исследование. М.: Прогресс, 1975 с, 296-301.
Основы марксистско-ленинской социологии. М.: Прогресс, 1972, с. 103-108. Процесс социального исследования/Под общ. ред. Ю. Е. Волкова. М.: Прогресс 1975, разд. ПД II.4.
Пэнто Р., Гравитц М. Методы социальных наук. М.: Прогресс, 1972, с.557-562.
Рихтаржик К. Социология на путях познания. М.: Прогресс, 1981, с. 89-112.
Рузавин Г. И. Методы научного исследования. М.: Мысль, 1974, с. 64-84.
Штофф В. А. Введение в методологию научного познания. Л.; Изд-во ЛГУ. 1972. 191 с.
Раздел четвертый