chi-squared
Я сейчас опять заведу шарманку про Перевал Дятлова, так что
удалите детей от экранов.
С недел назад Ютуб вдруг начал мне подбразывать видео по Дятлову
в каких-то промышленных масштабах. Из трех, в которые я потыкался,
два откровенный трэш, пересказываь не буду. Третьим роликом был
почти 8-часовой нарратив, читаемый скирее всего ИИ, но это неточно,
поскольку за то время пока я его слушал в спортзале (подобные темы
меня реально электризуют) я не заметил ни одного фонетического
глюка.
Теперь преамбула.
Когда я еще работал в универе на сравнительно редкой должности
ученого-исследователя, занимался я в частности молекулярной
спектроскопией высокого разрешения, которая на низовом уровне требует
идентификации всех вращательно-разрешенных уровней, и фита его к
модели. Значения параметров модели нам что-то говорят о молекуле.
The least squares fit могучая штука, но есть у нее одна пакостная
особенность. Если туда подбросить несколько случайных величин, не
описываетмых моделью (в моем случае, несколько линий от другой
молекулы), то алгоритм сожрет и их и упакует в модельное поведение.
конечно, когда таких линий сравнительно мало, на выводы они повлияют
несильно; пакость в другом. Из качества фита и fit residuals как
правило невозможно определить какие данные наши, а какие подброшены,
LSF маскирует ошибки очень хорошо.
Неутихающие споры о перевале Дятлова не утизют потому, что по всей
видимости, не существует консесусса даже о том, какие факты считать
фактами, а какие нет; без такого консенсуса дискуссия невозможна
вообще. С пролиферацией ИИ эта проблема будет, увы, нарастать.
Недавно я писал о подкасте по Стругацким, где после часа исторического
экскурса было заявлено, что Аркадий умер от инсульта, и похоронен на
таком-то кладбище (что неправда). При том процентов на 80% материал
бился с известными историческими фактами.
В подкасте по Дятлову упоминаются записи одной из девушек о том что
Дятлов им хамил, фактоид, о котором я раньше не слышал, и беглый
разговор с Железными Мозгами такого не подтверждает.
Что в ретроспективе наводит на следующую мысль. Предположим, по какой-то
причине сценарий "власти скрывают" еще в до-ИИ эру могли разыграть прямо
противоположным образом. Прилежно записать все, что видели, плюс добавить
фактоидов полуфантастического свойства. А поскольку в отличие от
спектроскопии модель по упаковке всего сказанного нам весьма неустойчива,
то попытка задействовать все фактоиды приводит к версиям типа ракитинской
про америкасних шпионов; она объясняет мало-мальски все по отдельности,
но вывод делает абсолютно фантастический.
Метод вброса хорош тем, что сам факт того, что масса свидетелей чего-то
не видели, ровным счетом ничего не говорит, отсутствие чего-либо логически
недоказуемо. А определить что именно вбросили представляется нереальным,
поскольку любую мало-мальски реалистичную версию можно раскорячить на
любой subset, а если на все, то получится Ракитин.
Я не исключаю, впрочем, что можно замутить факультативный проект с чтением
уголовного дела, cross-referencing, поискам того что не попало в материалы и
грамотным использованием ИИ, но из реальных людей мало кто за это способен
взяться даже теоретически.
К лавинной версии я отношусь с большой долей скепсиса.