Follow

Филологическая (лингвистическая) экспертиза в открыто-доступной разведке — это набор методов анализа текста, которые позволяют по языковым признакам установить или подтвердить:

- авторство текста
- регион/страну/город носителя языка
- социокультурный профиль автора (возраст, пол, образование, профессия)
- факт фальсификации или редактирования текста
- использование бот-ферм, троллей, ИИ-генерации
- психологический портрет и даже некоторые биографические данные

Это один из самых мощных и одновременно недооценённых инструментов OSINT, особенно в русскоязычном сегменте.

#### Основные направления филологической экспертизы в OSINT

1. **Идиолект и авторский почерк**
- характерные словоупотребления, любимые обороты
- частотность редких слов и конструкций
- синтаксические предпочтения (например, любовь к причастным оборотам или к «который» вместо деепричастий)
Инструменты: AntConc, Sketch Engine, LancsBox, собственные скрипты на Python (stylo, nltk)

2. **Диалектология и геолингвистические маркеры**
Русский язык очень сильно различается по регионам:
- «курей» vs «кур» (Кубань vs центр России)
- «шо»/«шоу» vs «что» (Украина/юг России)
- «по-над» vs «над» (Поволжье, Сибирь)
- белорусские и прибалтийские субстратные влияния
- кавказский акцент в письменной речи («да» в конце предложения, «бери» вместо «возьми»)

3. **Социолект и возрастные маркеры**
- молодёжный сленг 2015–2018 гг. vs сленг 2023–2025 гг.
- профессиональный жаргон (военные, IT, медики, силовики)
- «ватный» vs «либеральный» новояз

4. **Обнаружение ИИ-генерированного текста** (очень актуально с 2023 года)
Признаки ChatGPT/YandexGPT/Kandinsky/Gemini в русском:
- избыточная вежливость и политкорректность
- повторяющиеся шаблоны «Важно отметить, что…», «Следует подчеркнуть…»
- неестественная частотность слов «аспект», «контекст», «парадигма»
- отсутствие диалектных и сниженных элементов даже в «неформальном» стиле
Инструменты-детекторы: GPTZero, Originality.ai, ZeroGPT, HuggingFace open-source detectors (русский пока слабо, но обучается)

5. **Обнаружение «троллинга под чужую культуру»**
Классические ошибки иностранцев, пишущих «от лица русских»:
- неправильное употребление вида глагола (особенно совершенный вид в будущем)
- «в Украине» вместо «на Украине» у старшего поколения
- «позвони мне по телефону» вместо «позвони мне»
- «я живу в Россия»

6. **Хронологическая привязка текста**
По появлению новых слов и конструкций можно датировать текст с точностью до 1–3 лет:
- «повесточка» — после февраля 2022
- «мобилизация» в новом значении — с сентября 2022
- «СВО» как аббревиатура — с 2022

#### Практические приёмы и инструменты (2025 год)

- Корпусный анализ: Национальный корпус русского языка (ruscorpora.ru), Aranea, Sketch Engine
- Стилометрия: пакет R «stylo» (очень точно определяет авторство даже на 300–500 словах)
- Поиск по точным фразам в кавычках в Telegram-каналах и ВК-группах
- Сравнение с известными текстами подозреваемого (соцсети, старые статьи)
- Анализ пунктуации и орфографии (очень индивидуален: кто-то всегда ставит тире, кто-то — дефисы)

#### Кейсы, где филологическая экспертиза решает задачу

- Установление, что «анонимный телеграм-канал» ведёт тот же человек, что и старый ЖЖ 2014 года
- Доказательство, что «украинский националист» на самом деле пишет из Подмосковья (по фразе «пойти в магазин» вместо «пойти в крамницу»)
- Выявление, что пресс-релизы «разных» организаций написаны одним копирайтером (одинаковые редкие слова)
- Доказательство фейка: текст «от лица беженца из Мариуполя» использует лексику, появившуюся только в 2023 году

Филологическая экспертиза — это когда по 100–200 словам текста ты можешь сказать, из какого города человек, сколько ему лет, какое у него образование и даже курит он или нет (по частотности частицы «блин» и матерным конструкциям).

В 2025 году это один из немногих методов OSINT, который почти не поддаётся маскировке — можно сменить IP, аватарку, ник, но идиолект выдаёт с потрохами.

Если нужно — могу разобрать конкретный текст или канал на примерах.

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.