Статьи

Оценка аналитических способностей и системного мышления — по материалам митапа от 12 февраля 2026 года

В большинстве программ оценки персонала тесты аналитических способностей считаются почти обязательным инструментом. Их используют в массовом подборе, программах кадрового резерва и оценке потенциала.

Но что именно мы измеряем этими тестами — интеллект, мышление или лишь часть когнитивных способностей? И достаточно ли этого, чтобы прогнозировать эффективность человека в сложных профессиональных ролях?

Почему в оценке персонала так часто измеряют аналитические способности

Если посмотреть на большинство программ оценки персонала — от массового подбора до программ развития кадрового резерва — тесты аналитических способностей почти всегда оказываются среди ключевых инструментов.

Почему именно они так прочно закрепились в практике HR?

Главная причина — исследования валидности. В организационной психологии давно изучают, насколько разные методы оценки способны предсказывать реальные рабочие результаты. В частности, анализируется связь между результатами тестов и такими показателями, как эффективность в работе или способность к обучению.

По данным разных исследований, корреляция между результатами тестов когнитивных способностей и рабочей результативностью находится примерно в диапазоне 0,3–0,5. Если перевести эту статистику на более понятный язык, это означает, что различия в результатах тестов могут объяснять до 25% различий в эффективности сотрудников.

Классическое исследование Шмидта и Хантера (1998) оценивало эту связь примерно на уровне 0,5. Более поздний мета-аналитический пересмотр Сакетта и коллег (2021), который использовал более строгие статистические поправки и новые массивы данных, дал более сдержанную оценку — около 0,3. Это означает, что прогностическая сила тестов способностей остаётся значимой, но всё же несколько более умеренной, чем предполагалось ранее.

Для поведенческих наук это все еще довольно высокий показатель. В то же время важно понимать, что тесты объясняют лишь часть различий между людьми. Оставшиеся 75% могут быть связаны с другими факторами: мотивацией, опытом, личностными особенностями, организационным контекстом и многими другими переменными.

Тем не менее тесты когнитивных способностей по-прежнему считаются одним из самых сильных одиночных предикторов рабочей эффективности. Мета-аналитические исследования методов отбора персонала показывают, что среди отдельных инструментов оценки именно когнитивные тесты демонстрируют одну из наиболее устойчивых прогностических связей с результатами работы.

Кроме научных оснований, есть и более практические причины их популярности.
Во-первых, такие тесты быстры и относительно недороги. С их помощью можно протестировать сотни и даже тысячи кандидатов за короткое время — что особенно важно в массовом подборе или программах набора молодых специалистов.
Во-вторых, они стандартизированы. Тесты проводятся по одинаковой процедуре и оцениваются по единым правилам, что создает ощущение объективности и научности оценки.

Поэтому неудивительно, что когнитивный компонент вошел практически во все известные модели потенциала — например, в frameworks Korn Ferry, Hogan, Saville, Talent Q и других.

Во многих таких моделях потенциал фактически рассматривается как сочетание двух ключевых составляющих. Первая — мотивация: желание человека достигать результата, развиваться, брать на себя более сложные задачи. Вторая — способности, то есть возможность эти задачи решать. Именно поэтому тесты аналитических способностей на протяжении десятилетий остаются одним из самых распространенных инструментов оценки персонала.

Однако за этой практикой стоит важный вопрос: что именно мы измеряем, когда говорим об «интеллектуальных способностях»?

Что именно мы называем интеллектуальными способностями

Тема измерения интеллекта создает некоторую иллюзию простоты. Кажется, что всё довольно очевидно: интеллект — это то, насколько быстро, глубоко и качественно человек думает. Но как только начинаешь разбираться, оказывается, что всё устроено гораздо сложнее. Одно дело — интеллект, другое — мышление, третье — IQ.

В психологии существует множество теорий интеллекта, и почти каждая из них предлагает свою структуру. Общего определения, которое устраивало бы всю научную и профессиональную среду, до сих пор нет.

Например, одна из известных моделей — теория множественных интеллектов Говарда Гарднера. В ней предполагается, что у человека не один интеллект, а несколько различных типов: логико-математический, лингвистический, музыкальный, телесно-кинестетический и другие. Ценность этой идеи в том, что она показывает: способности человека могут проявляться в очень разных областях, и сводить их к единому показателю не всегда корректно.

Однако в HR мы обычно решаем гораздо более прикладные задачи. Когда компания выбирает сотрудников или формирует кадровый резерв, ее интересует довольно конкретный вопрос: насколько человек сможет справляться со сложными задачами и учиться новому.

Большинство тестов когнитивных способностей, используемых в оценке персонала, разработаны в рамках психометрической концепции g-фактора (general intelligence) — идеи о существовании общего фактора интеллекта. Согласно этой модели, за различными когнитивными способностями стоит некоторое общее основание.

Предполагается, что если мы можем приблизиться к измерению этого общего фактора, то сможем делать достаточно надежные прогнозы о том, как человек будет справляться с интеллектуальными задачами.

На практике в оценке персонала чаще всего измеряется не сам g-фактор, а так называемый GMA (General Mental Ability) — совокупность базовых когнитивных способностей: вербальных, числовых и логических. Именно на этой логике построено большинство тестов аналитических способностей. Однако важно понимать: даже такие тесты — это лишь приближение. g-фактор остается теоретическим конструктом — своего рода «глубинной переменной», к которой мы можем только косвенно подступиться.

Интересно, что похожая ситуация наблюдается и в другой области, где сегодня активно обсуждают интеллект — в сфере искусственного интеллекта.

Если присмотреться к этой области, можно заметить, что термин «искусственный интеллект» тоже довольно размытый. Им называют самые разные вещи: алгоритмы рекомендаций, системы распознавания изображений, языковые модели, генерацию текстов и многое другое.

За десятилетия развития технологии одни и те же принципы машинного обучения находили всё новые применения — и почти каждое из них в какой-то момент называли «искусственным интеллектом».

Поэтому сегодня разработчики стараются говорить точнее и описывать не абстрактный «интеллект», а конкретные типы систем. Например, широко распространенные Large Language Models (LLM) — большие языковые модели, которые умеют работать с текстом и языком.

При этом в технологической индустрии появился еще один термин — Artificial General Intelligence (AGI). Им обозначают гипотетическую систему, которая могла бы решать широкий спектр задач на уровне человека или лучше него. Но пока это скорее концепция будущего, чем существующая технология.

В этом смысле ситуация парадоксально похожа на историю с g-фактором в психологии: и там, и там речь идет о теоретическом конструкте, который помогает описывать сложные явления, но пока не имеет прямого способа измерения.

Как сегодня измеряют мышление в оценке персонала

Сегодня в оценке персонала существует довольно широкий набор инструментов для измерения когнитивных способностей. Однако большинство из них построено вокруг одной и той же логики — оценки General Mental Ability (GMA).

Чаще всего такие тесты представляют собой комбинацию двух или трех типов заданий: вербальных, числовых и абстрактно-логических. Предполагается, что через измерение этих базовых способностей можно приблизиться к оценке общего фактора интеллекта — g-factor.

Такие тесты сравнительно просты в администрировании, стандартизированы и легко масштабируются, поэтому на рынке существует большое количество подобных инструментов.

При этом в последние годы появляются и другие инструменты, которые пытаются выйти за пределы классического GMA-подхода и измерять отдельные аспекты интеллекта. Например, некоторые методики фокусируются на критическом мышлении, скорости обработки информации или социальном интеллекте. Появляются также инструменты для оценки креативности или системного мышления.

Как эти тесты используются на практике

На практике тесты способностей чаще всего выполняют довольно прагматичную функцию — фильтрацию больших выборок кандидатов.

Например, в массовом подборе или в программах набора молодых специалистов устанавливается пороговый балл, и кандидаты ниже него выбывают из воронки. При большом количестве откликов это позволяет быстро сократить выборку.

Другой сценарий — ранжирование кандидатов. Например, при отборе аналитиков, консультантов или специалистов в IT результаты тестов могут использоваться как один из факторов принятия решения.

Тесты способностей также применяются в программах кадрового резерва, HiPo и succession planning — как один из элементов оценки потенциала.

Когда тесты начинают использовать слишком широко

Из-за своей простоты и удобства тесты когнитивных способностей нередко начинают применять слишком широко. Инструмент, созданный для конкретной задачи — например, для фильтрации больших выборок кандидатов — постепенно превращается в универсальный элемент любой оценки и используется просто потому, что «так принято».

В результате возникают типичные ограничения. Тест может излишне отсекать кандидатов на специфические роли, где важнее профессиональное или системное мышление — например, в маркетинге или продуктовых функциях. Кроме того, возникает риск переоценки самого балла: высокий результат начинает восприниматься как признак того, что человек «умный» и, следовательно, будет успешен.

Есть и этический аспект. В программах кадрового резерва или оценки потенциала результаты тестов требуют аккуратной обратной связи: непрохождение порога может восприниматься как сигнал «ты недостаточно умный» и демотивировать сотрудников.

Поэтому в практике оценки персонала такие тесты редко используются изолированно. Постепенно сформировался своего рода «золотой стандарт» диагностической батареи:

В этой конфигурации тест становится одним из элементов более комплексной оценки, а не самостоятельным инструментом принятия решения. Он позволяет оценить когнитивный потенциал — скорость и точность работы с информацией и способность решать новые задачи. Личностные опросники помогают понять поведенческие особенности человека: стиль взаимодействия, устойчивость к стрессу и мотивационные факторы. Структурированное интервью добавляет контекст — опыт кандидата, логику его решений и способы решения рабочих задач.

Куда может развиваться оценка мышления

Если посмотреть на современные исследования в когнитивной психологии и нейронауке, можно заметить важный сдвиг: современная наука всё меньше поддерживает представление о фиксированном и неизменном IQ.

Вместо этого внимание смещается к более сложной картине мышления. Исследования всё чаще рассматривают не только уровень когнитивных способностей, но и структуру мышления и способность человека развиваться.

Например, активно изучаются несколько направлений.

Нейропластичность — способность мозга учиться и перестраиваться на протяжении всей жизни. Поэтому всё больше внимания уделяется не только текущему уровню способностей, но и learning agility — способности быстро осваивать новые задачи и адаптироваться к изменениям.

Метакогниция — способность человека наблюдать за собственным мышлением, замечать ошибки, корректировать стратегии решения задач и учиться на опыте.

Исполнительные функции — когнитивный контроль: способность удерживать цель, переключаться между задачами и управлять сложными процессами мышления.

Когнитивные стили — различия в том, как люди обрабатывают информацию: например, мыслят более индуктивно или дедуктивно, эмпирически или гипотетически.

Наконец, появляется еще один интересный фактор — развитие искусственного интеллекта. По мере того как ИИ всё лучше справляется с задачами анализа данных и поиска решений, становится всё важнее понимать, в чём именно человеческое мышление остается уникальным.

Системное мышление как следующий шаг диагностики

Во многих моделях лидерских компетенций сегодня фигурируют такие требования, как стратегическое мышление, работа с неопределенностью, управление сложностью или кросс-функциональное взаимодействие.

Однако большинство классических тестов способностей оценивают совсем другой тип задач — задачи с одним правильным ответом.

В реальном бизнесе ситуация чаще всего выглядит иначе. Правильного ответа может не существовать, а решение требует соединения разрозненных факторов, построения гипотез и учета взаимосвязей внутри системы.

Поэтому всё чаще возникает вопрос: можно ли измерять не только общий уровень когнитивных способностей, но и способ организации мышления?

Одним из возможных направлений развития может стать оценка того, что условно можно назвать Systemic Mental Ability (SMA) — системной способности мышления.

Речь идет о таких параметрах, как:

ментальные модели, которыми человек описывает реальность;
стиль мышления — линейный или системный, детальный или целостный;
способность к синтезу — умение объединять разрозненные данные в единую картину;
учет взаимосвязей и обратных связей в сложных системах;
уровень абстракции — способность переходить от деталей к метауровню;
метакогниция — осознание собственных мыслительных стратегий.

Иначе говоря, речь идет о переходе от измерения скорости и точности решения задач к пониманию того, как именно человек мыслит.

Возможно, именно здесь лежит следующий этап развития диагностики в HR — инструменты, которые смогут оценивать не только «мощность» мышления, но и его структуру и системность.

Бонус: как сегодня измеряют «интеллект» у искусственного интеллекта

Интересно, что проблема измерения интеллекта активно обсуждается и в другой области — разработке искусственного интеллекта.

Чтобы сравнивать возможности различных генеративных моделей, независимые исследовательские группы создают специальные бенчмарки — наборы тестов, проверяющих разные типы когнитивных задач. Одной из таких инициатив является проект Artificial Analysis, который сравнивает модели в одинаковых условиях.

В этих тестах проверяются различные способности моделей: знания в разных областях, логическое рассуждение, решение математических задач, программирование, работа с длинными текстами и следование сложным инструкциям. Например: MMLU-Pro, Humanity’s Last Exam (HLE), GPQA Diamond, SciCode, LiveCodeBench.

Итоговый результат модели рассчитывается как среднее значение по нескольким таким тестам.

Интересно, что даже самые мощные современные модели показывают довольно умеренные результаты. Планку 50% успешных ответов в этих бенчмарках удалось преодолеть лишь недавно — и только наиболее крупным и ресурсоемким моделям.

При этом большинство моделей, с которыми пользователи сталкиваются в повседневной жизни — чат-боты, голосовые ассистенты и клиентские сервисы — показывают значительно более низкие показатели, часто около 20–25%.

Это означает, что до создания универсальной системы, которая могла бы стабильно решать широкий спектр задач на уровне человека, пока ещё довольно далеко. И даже в области машинного интеллекта мы видим ту же проблему, что и в психологии: интеллект оказывается сложным явлением, которое трудно свести к одному числу или одному тесту.

Источники:

Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings. Psychological Bulletin, 124(2), 262–274.
Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2021). Revisiting meta-analytic estimates of validity in personnel selection: Addressing systematic overestimation and advancing validity generalization. Journal of Applied Psychology, 106(9), 1344–1359.

2026-03-12 11:20 Метод