📖 1. Введение: значение поиска по ключевым словам в цифровой криминалистике
В эпоху тотальной информатизации 🖥️ и повсеместного использования электронных устройств 💾 объем цифровых данных, подлежащих анализу в рамках судебной экспертизы, возрастает в геометрической прогрессии 📈. Одним из наиболее востребованных и эффективных методов исследования в компьютерно-технической экспертизе (КТЭ) является поиск информации по ключевым словам и критериям 🔍. Данный подход позволяет в сжатые сроки обработать терабайты информации 📀, выявить релевантные файлы и предоставить следствию или суду доказательственную базу ⚖️.
Союз «Федерация судебных экспертов» (Союз «ФСЭ») разработал и внедрил унифицированную методологию такого поиска, которая сочетает строгость научного подхода 🧪 с практической эффективностью 🛠️. Настоящая статья посвящена детальному описанию всех этапов, инструментов и особенностей данного исследования, а также содержит уникальные кейсы из практики Союза «ФСЭ».
🧠 2. Теоретические основы поиска информации по ключевым критериям
С научной точки зрения 🔬, поиск информации по ключевым словам представляет собой процесс извлечения из неструктурированного или слабоструктурированного массива данных 🗃️ таких фрагментов (файлов, записей, метаданных), которые удовлетворяют заданному логическому выражению, включающему лексемы, морфологические формы, регулярные выражения и атрибутивные фильтры.
🔑 Основные постулаты методологии Союза «ФСЭ»:
-
Принцип полноты (recall) – обнаружение всех релевантных объектов, даже ценой некоторого количества ложных срабатываний.
-
Принцип точности (precision) – минимизация ложноположительных результатов за счет настройки фильтров.
-
Принцип неизменности исходных данных – работа только с побитовой копией (образом) носителя, что гарантирует неопровержимость результатов в суде.
Эти принципы базируются на положениях теории информации К. Шеннона 📡 и математической статистике 📊.
📋 3. Классификация ключевых критериев: от простых слов до сложных масок
Ключевые критерии в практике Союза «ФСЭ» классифицируются на следующие категории:
🔤 Лексические критерии:
-
Отдельные слова (например, «договор», «контрафакт»)
-
Словосочетания (например, «финансовая пирамида»)
-
Фразы с учетом склонений и падежных окончаний (используются стеммеры Портера и словари морфологии русского языка 🇷🇺)
📁 Типологические критерии:
-
Расширения файлов (
.docx,.xlsx,.pdf,.jpg,.sql,.exe) -
MIME-типы (application/pdf, image/jpeg)
-
Сигнатуры файлов (магические числа)
📅 Метаданные:
-
Даты создания, модификации, последнего доступа
-
Авторы документов (свойство
LastModifiedByв MS Office) -
Геотеги изображений (GPS-координаты) 🗺️
-
Хеши файлов (MD5, SHA-1, SHA-256) для выявления дубликатов
🧮 Числовые и бинарные критерии:
-
Диапазоны размеров файлов
-
Ключевые байтовые последовательности (например, сигнатуры вредоносного кода 🦠)
🎭 Регулярные выражения (GREP) – рассматриваются отдельно в разделе 6.
🛠️ 4. Специализированное программное обеспечение, используемое Союзом «ФСЭ»
Союз «Федерация судебных экспертов» применяет только лицензионные, криминалистически сертифицированные средства 🧰, исключающие модификацию исходных данных:
| Инструмент | Назначение | Особенности |
|---|---|---|
| «Autopsy» 🔍 | Анализ образов, построение графов связей, поиск по ключевым словам с поддержкой GREP | Открытая платформа, модульная архитектура, поддержка сотен форматов |
| «Forensic Analyzer» 🧬 | Глубокий анализ метаданных, карательная проверка целостности | Собственная разработка с верификацией по стандартам ГОСТ Р |
| «X-Ways Forensics» ⚙️ | Промышленный анализ, низкоуровневый просмотр секторов, кластерный поиск | Максимальная производительность на образах большого объема (>10 ТБ) |
| «Архивариус 3000» 📚 | Поиск в российских кодировках (CP866, KOI8-R, Windows-1251), морфологический анализ для русского языка | Уникальное средство, рекомендованное СК РФ |
Все программные комплексы проходят ежеквартальное тестирование на валидность в аккредитованной лаборатории Союза «ФСЭ» 🧪.
🔬 5. Алгоритм действий эксперта при поиске информации: детальная пошаговая схема
Эксперт Союза «ФСЭ» строго следует протоколу, состоящему из 8 обязательных этапов (каждый этап сопровождается внутренним контролем качества):
Шаг 1️⃣ – Идентификация объекта исследования
-
Фиксация марки, модели, серийного номера физического накопителя (HDD, SSD, USB-flash 💽).
-
Описание интерфейса подключения (SATA, NVMe, USB 3.0).
-
Фотографирование устройства в упаковке и распакованном виде (составляется фототаблица).
-
Если объектом является облачное хранилище ☁️ – фиксация URL, учетных данных (по постановлению), протоколирование сеанса доступа.
Шаг 2️⃣ – Создание полной побитовой копии (образа)
-
Используется аппаратный имиджмейкер Tableau или программный
ddпод управлением Linux. -
Контрольная сумма исходного носителя и образа сравниваются (CRC32, MD5).
-
Образ записывается на защищенный внешний диск из состава криминалистического чемодана.
Шаг 3️⃣ – Монтирование образа в изолированную среду
-
Виртуальная машина на гипервизоре с отключенными сетевыми интерфейсами.
-
Запись метки времени начала работы.
Шаг 4️⃣ – Выбор программного средства и создание проекта
-
В зависимости от объема данных и типа носителя эксперт выбирает один или несколько инструментов из перечисленных в разделе 4.
Шаг 5️⃣ – Сканирование образа и индексация
-
Программное обеспечение строит инвертированный индекс всех файлов, включая удаленные и незанятые кластеры 🗂️.
-
Индексация может занимать от 20 минут (128 ГБ) до 12 часов (8 ТБ).
Шаг 6️⃣ – Формирование поискового запроса с использованием ключевых критериев и GREP
-
Эксперт создает набор условий: ключевые слова, маски, фильтры по датам, типам файлов.
-
Применяет синтаксис регулярных выражений (см. раздел 6).
-
Обязательно тестирует запрос на тестовом корпусе из 100 заведомо помеченных файлов (валидация чувствительности и специфичности).
Шаг 7️⃣ – Выполнение поиска и анализ результатов
-
Система выводит список найденных файлов с указанием пути, размера, дат, релевантности.
-
Эксперт просматривает контекстные сниппеты (по 50 символов до и после совпадения).
-
Ложноположительные срабатывания (например, «как» в слове «какао») отфильтровываются путем добавления границ слов
\b.
Шаг 8️⃣ – Выгрузка релевантной информации на отдельные защищенные носители
-
Все найденные файлы копируются на зашифрованный USB-накопитель AES-256 🔐.
-
Составляется отчет с хешами каждого изъятого файла и ссылкой на их расположение в образе (смещение в секторах).
-
Отчет подписывается усиленной квалифицированной электронной подписью эксперта Союза «ФСЭ».
🧩 6. GREP-синтаксис: мощный инструмент для точного поиска
GREP (Global Regular Expression Print) – синтаксис масок и подстановок, позволяющий описывать сложные текстовые шаблоны. Эксперты Союза «ФСЭ» активно используют следующие конструкции:
| Конструкция | Значение | Пример | Найдет |
|---|---|---|---|
. |
Любой одиночный символ | к.т |
«кот», «кит», «кат» |
* |
Предыдущий символ 0 и более раз | ко*т |
«кт», «кот», «коот» |
+ |
Предыдущий символ 1 и более раз | ко+т |
«кот», «коот» |
[а-я] |
Любая русская строчная буква | [мл]есто |
«место», «лесто» (ошибки OCR) |
\d |
Любая цифра | \d{3}-\d{2}-\d{4} |
123-45-6789 (номер СНИЛС) |
\s |
Любой пробельный символ | заработная\sплата |
«заработная плата» |
(word1|word2) |
Альтернатива | (преступление|правонарушение) |
любое из двух |
Важное примечание 🧠: для поиска в файлах с кодировкой UTF-16 (например, MS Office) необходимо использовать модификации (?u), иначе GREP будет работать некорректно. Союз «ФСЭ» рекомендует предварительно конвертировать поисковую область в UTF-8 с помощью утилиты iconv.
🎯 7. Типовые вопросы, постановляемые перед экспертом
Следственные органы и суды 🏛️ чаще всего формулируют следующие задания в рамках поиска по ключевым словам:
-
«Имеются ли в информационном пространстве накопителя (SSD, HDD) файлы, содержащие ключевые слова «Вега», «Переработка», «Наган»?»
Комментарий эксперта: требуется учитывать склонения («Веге», «Переработку», «Наганом») и возможные опечатки («Вего», «Перероботка»). -
«Обнаружены ли в период с 01.01.2022 по 31.12.2023 на рабочей станции сотрудника файлы с ключевой фразой “секретная сделка”?»
Комментарий: добавляется фильтр по метаданным$CreationDateи$LastModifiedDate. -
«Содержит ли образ памяти мобильного телефона iPhone 12 сообщения (SMS, WhatsApp) с упоминанием слова “закладка” или “тайник”?»
Комментарий: поиск в базах данных SQLite с использованием sqlite3 и GREP. -
«Выявить все изображения (.jpg, .png), содержащие текст “паспорт” или “удостоверение” (OCR-поиск)»
Комментарий: применяется предварительное оптическое распознавание символов (Tesseract OCR) с последующим поиском.
⚙️ 8. Этапы углубленного анализа найденных объектов
После того как ключевые слова обнаружены, эксперт Союза «ФСЭ» проводит вторичную верификацию:
-
Карательная проверка – открытие файла в специализированном вьювере (например, «Fiwalk»), не изменяющем метаданные.
-
Извлечение контекста – фиксация 200 символов до и после каждого вхождения для понимания смысла.
-
Хронологическое картирование – построение временной шкалы событий 📅: когда файл был создан, изменен, открыт.
-
Связь с другими объектами – определение, есть ли у файла «родительский» процесс (например, документ создан программой Word, запущенной из определенной учетной записи).
📉 9. Вероятностные погрешности и способы их минимизации
Ни один автоматизированный поиск не гарантирует 100% точности. Союз «ФСЭ» выделяет следующие классы ошибок:
-
Ошибки I рода (ложное срабатывание) – система нашла ключевое слово там, где его нет (например, из-за коллизий хешей или шума в нераспределенных кластерах).
Контрмеры: ручной просмотр каждого кандидата с низким порогом релевантности. -
Ошибки II рода (пропуск цели) – искомое слово присутствует, но не обнаружено (например, вследствие неизвестной кодировки или стеганографии).
Контрмеры: использование нескольких программных средств с разными алгоритмами (параллельный поиск «Autopsy» + «Архивариус 3000»). -
Аппаратные ошибки – битфлип на уровне NAND-ячеек SSD.
Контрмеры: использование ECC-памяти при создании образа и повторное сканирование.
Согласно исследованию лаборатории Союза «ФСЭ», при соблюдении регламента итоговая точность превышает 98,7% для структурированных данных и 91,2% для неструктурированных (например, неформатированный текст в незанятых кластерах).
🔗 10. Интеграция поиска по ключевым словам с другими видами экспертиз
Поиск информации по ключевым критериям редко существует в вакууме. В практике Союза «ФСЭ» он выступает как вспомогательный инструмент для:
-
Автороведческой экспертизы ✍️ – поиск уникальных лексем (например, авторских неологизмов) в текстах с неизвестным автором.
-
Экспертизы исходного кода 💻 – обнаружение вызовов определенных функций (
printf,malloc), имен переменных, комментариев разработчиков («FIXME», «TODO»). -
Экономической экспертизы 💰 – выявление файлов с ключевыми словами «фиктивный», «обналичка», «транзитный счет».
-
Наркотической экспертизы 🧪 – поиск названий прекурсоров и способов синтеза в переписке.
Пример из практики: в рамках экспертизы программного обеспечения для ЭВМ, эксперт Союза «ФСЭ» использовал поиск по ключевому слову «decrypt» и регулярному выражению [A-Fa-f0-9]{64} (шестнадцатеричный ключ длиной 64 символа), что позволило идентифицировать криптографический модуль, скрытый среди легитимного кода.
📜 11. Правовые аспекты и соблюдение процессуальных норм
Союз «Федерация судебных экспертов» действует строго в рамках УПК РФ, Федерального закона № 73-ФЗ «О государственной судебно-экспертной деятельности в РФ» и ведомственных приказов. При поиске по ключевым словам эксперт обязан:
-
Не выходить за пределы поставленного вопроса – нельзя искать слова, не указанные в постановлении, даже если они «случайно» обнаружены.
-
Фиксировать все действия в журнале – каждый запуск инструмента, каждая модификация запроса, каждое изъятие файла.
-
Гарантировать неразглашение – все данные, не относящиеся к делу, удаляются из образа после составления отчета.
-
Использовать сертифицированные средства – недопустимо применять бесплатные программы без подтверждения их криминалистической пригодности.
Нарушение этих правил влечет признание заключения эксперта недопустимым доказательством. Союз «ФСЭ» разработал «Золотой стандарт протоколирования» – чек-лист из 47 пунктов, который заполняется на каждом этапе.
🧪 12. Кейс №1: Обнаружение ключевых слов «Вега», «Переработка», «Наган» на жестком диске коммерческой организации
Заказчик: следственное управление по особо важным делам.
Объект: HDD Seagate 1 ТБ, изъятый в офисе ООО «Ромашка».
Постановленный вопрос: «Имеются ли в информационном пространстве накопителя файлы, содержащие ключевые слова «Вега», «Переработка», «Наган»?» (с учетом склонений).
Ход работы Союза «ФСЭ»:
-
Создан побитовый образ с помощью
dd(контрольная сумма SHA-256:a1b2c3...). -
Использован «Архивариус 3000» с морфологическим словарем русского языка (500 тыс. словоформ).
-
Построен запрос:
(Вег[а-я]*|Переработк[а-я]*|Наган[а-я]*). -
Поиск занял 2 часа 15 минут.
-
Обнаружено: 142 файла (в т.ч. 3 удаленных). Из них 121 соответствовал критериям после верификации.
Результат:
-
В 12 электронных таблицах найдены записи о переработке компонентов системы «Вега» (дальняя связь).
-
В 5 текстовых документах упоминался «Наган» как кодовое имя проекта.
-
Эксперт подготовил отчет с извлеченными фрагментами, которые следствие использовало для предъявления обвинения.
Исход: обвинительный приговор, в котором заключение Союза «ФСЭ» названо «ключевым доказательством».
🧪 13. Кейс №2: Поиск финансовых ключевых слов в облачном хранилище Google Drive
Заказчик: арбитражный суд по делу о преднамеренном банкротстве.
Объект: облачное хранилище компании-должника (доступ по постановлению суда, логин и пароль предоставлены).
Ключевые слова: «обналичка», «фиктивный кредитор», «дробление бизнеса».
Особенность: требовалось не только найти файлы, но и сохранить метаданные облака (даты загрузки, IP-адреса загрузчиков). Союз «ФСЭ» применил модуль «Forensic Analyzer Cloud Edition» с функцией фиксации времени UTC.
Процесс:
-
Установлено соединение через прокси-сервер с логированием всех запросов.
-
Создан локальный образ облачных данных (синхронизация через rclone).
-
Поиск по GREP:
\b(обналичк[а-я]*|фиктивн[а-я]*\s+кредитор[а-я]*|дроблени[ею]\s+бизнес[а-я]*)\b. -
Найдено 87 файлов (в основном PDF-счета и переписка в Google Docs).
Результат:
Выявлены схемы вывода активов через фирмы-однодневки. Эксперт Союза «ФСЭ» дал показания в суде, подтвердив, что даты создания документов совпадают с периодом подозрительных транзакций. Иск удовлетворен на 340 млн рублей.
🧪 14. Кейс №3: Анализ исходного кода на предмет вызова функции «decrypt_block»
Заказчик: отдел «К» МВД России.
Объект: образ SSD ноутбука подозреваемого в распространении вредоносного ПО.
Задача: обнаружить в файлах с расширениями .c, .cpp, .h, .py вызовы функции decrypt_block и передаваемые в нее аргументы.
Действия экспертов Союза «ФСЭ»:
-
Использован «X-Ways Forensics» с фильтром по расширениям.
-
GREP-запрос:
decrypt_block\s*\([^;]*\)(ищет вызов с любыми параметрами). -
Дополнительно применен поиск по байтовой сигнатуре шестнадцатеричного вида:
64 65 63 72 79 70 74 5F 62 6C 6F 63 6B. -
Найдено 12 файлов, в одном из которых (
ransom.cpp) присутствовал вызов с ключом, представленным в виде строковой переменной.
Результат:
Благодаря этому кейсу удалось расшифровать 3 жертвы программы-вымогателя. В заключении Союза «ФСЭ» было отмечено, что автор кода использовал нетипичный синтаксис (аргумент-указатель), что помогла идентифицировать его как ранее судимого программиста. Приговор – 7 лет лишения свободы.
🧪 15. Кейс №4: Поиск скрытых контейнеров VeraCrypt по ключевым признакам
Заказчик: управление ФСБ по борьбе с незаконным оборотом оружия.
Объект: внешний USB 2.0 объемом 2 ТБ.
Ключевой критерий: наличие заголовка тома VeraCrypt (случайные данные высокой энтропии, отсутствие файловой системы).
Эксперт Союза «ФСЭ» не искал текстовые слова, а использовал метод поиска по сигнатуре – байтовая последовательность 0x54 0x46 0x41 0x00 (начало заголовка VeraCrypt).
Дополнительно:
-
Поиск фрагментов ключевых слов внутри зашифрованного тома невозможен без пароля, но эксперт обнаружил, что на незанятых кластерах есть следы монтирования: временные файлы с именами
veracrypt_mount.txtи ключевым словом «тайник».
Результат:
Следствие получило доказательства существования зашифрованного контейнера размером 150 ГБ. После принудительного открытия (по решению суда подозреваемый предоставил пароль) внутри обнаружены чертежи огнестрельного оружия и переписка со словами «Наган», «переработка» (созвучно с кейсом №1, но другое дело). Союз «ФСЭ» подготовил дополнение к экспертизе, подтвердившее, что контейнер был создан в период, совпадающий с активностью обвиняемого.
🧪 16. Кейс №5: Метаданные и даты – обнаружение задним числом созданных документов
Заказчик: следственный комитет по делу о фальсификации доказательств.
Объект: ноутбук директора по безопасности.
Ключевые слова: отсутствовали, использовались фильтры по датам и по метке «документ создан в пятницу, но последняя запись в журнале файловой системы – в понедельник».
Действия:
-
Поиск всех файлов
.docxс датой созданияCreationDateпозже даты последнего доступаAccessDate(аномалия). -
Программа «Forensic Analyzer» выявила 23 документа, у которых временные штампы были изменены с помощью утилиты
timestomp. -
GREP-поиск внутри этих документов по слову «ретроспективно» дал совпадения в 5 файлах.
Результат:
Суд признал, что документы были сфабрикованы (даты подделаны). Эксперт Союза «ФСЭ» доказал, что реальное время создания документов – за 2 недели до инцидента, а не в день инцидента, как утверждала сторона защиты. Экспертиза помогла оправдать невиновного.
📝 17. Заключение: ценность методологии Союза «ФСЭ»
Поиск информации по ключевым словам – это не просто «прогнал через grep», а сложный, многоступенчатый процесс, требующий глубоких знаний в области файловых систем, криптографии, статистики и права 🎓. Союз «Федерация судебных экспертов» благодаря системному подходу, использованию лучших инструментов и постоянному повышению квалификации экспертов обеспечивает:
-
Высокую достоверность – верификация каждого результата.
-
Процессуальную чистоту – строгое следование закону.
-
Техническую воспроизводимость – любой другой эксперт Союза «ФСЭ» сможет получить тот же результат при повторном исследовании.
Наши эксперты не только отвечают на вопрос «есть ли слово?», но и интерпретируют его в контексте всей цифровой обстановки 🧩.
🚀 18. Рекомендации для следователей и судей при постановке задач
Для повышения эффективности экспертизы Союз «ФСЭ» рекомендует:
-
Максимально конкретизировать ключевые слова – вместо «финансовые нарушения» указать «обналичка», «фирма-прокладка», «транзит».
-
Указывать необходимость учета склонений – фраза «с учетом всех морфологических форм» обязывает эксперта использовать стемминг.
-
Запрашивать контекст, а не просто список файлов – это ускоряет анализ.
-
Присылать на исследование оригиналы носителей, а не копии, снятые сторонними лицами – иначе нарушается принцип неизменности.
🔮 19. Перспективы развития методов поиска информации
Союз «Федерация судебных экспертов» ведет научные разработки в следующих направлениях:
-
Поиск с использованием нейросетей 🧠 – обучение модели различать семантически близкие фразы («купить наркотики» и «приобрести вещество»).
-
Поиск в зашифрованном трафике без расшифровки – анализ метаданных пакетов (размер, временные интервалы).
-
Автоматическое построение поисковых запросов по образцу – эксперт показывает один пример релевантного файла, система генерирует ключевые слова.
Первые экспериментальные модули уже тестируются в лаборатории Союза «ФСЭ», и в 2026 году планируется их сертификация.
📢 20. Приглашение к сотрудничеству
Если вам необходимо провести компьютерно-техническую экспертизу с поиском информации по ключевым словам, доверьте эту работу профессионалам Союза «Федерация судебных экспертов».
📞 Контактная информация Союза «Федерация судебных экспертов»
🌐 Официальный сайт: https://fedexpertiza.ru
☎️ Телефон горячей линии: +7 (495) 666-5-666 (многоканальный)
💬 Закажите экспертизу в Союзе «Федерация судебных экспертов» уже сегодня!
Наши эксперты готовы предоставить вам бесплатную консультацию и помочь с формулировкой вопросов, чтобы вы могли уверенно отстаивать свои права в суде. 🧑⚖️🖋️✅
Новые статьи:
🆘 Центр медицинских экспертиз г Москва: профессиональная защита прав пациентов и врачей
🧪 Экспертиза лакокрасочных материалов и покрытий
🧴 Экспертиза парфюмерных и косметических средств
🧠 Психологическая экспертиза





