Игорь Нежданов Дебютант

Анализ текстовой информации

Первичный анализ информации уже начат на этапе ее оценки и даже раньше — на этапе ее получения. Присвоение определенных атрибутов конкретной информации уже ведет к структурированию данных и как следствие к их анализу (к структуризации и категоризации).
Процесс собственно анализа информации описан ниже.
Реферирование информации.
Мы уже попробовали реферирование на предыдущем этапе, когда удаляли из сообщения элементы, не несущие прямой информационной нагрузки (в интересах конкретного проекта).
Реферирование особенно полезно в случае большого объема информации из разных источников (СМИ, БД, опер установки и т. п.) и при необходимости дальнейшего цитирования. Но реферирование всегда ориентировано на объект интереса, т. е. тот кто реферирует — определенным образом сам искажает информацию, поэтому лицу, проводящему реферирование, важно понимать зачем он это делает (какова конечная цель) и для кого он это делает (особенности восприятия информации потребителем рефератов). Последнее важно для наиболее точной и полной передачи информации (вопрос согласованности каналов обмена информацией).
Реферирование заключается в выборке из всего массива информации ключевых моментов и их фиксировании. Если были выполнены все предыдущие этапы — то реферирование уже сделано. Умение быстро составить качественный реферат достаточно непростое свойство. В настоящее время появились программы берущие на себя данную функцию.
Сопоставление информации
Это ни что иное как нахождение в тексте данных указывающих на связь с вашими интересами (время, место, участники и т. п.), а также на связь с иными данными. Частично вы это уже сделали, приняв решении о релевантности данного информационного блока и сохранив его. Теперь необходимо четко описать выявленные связи. Данный этап имеет важное значение для последующего использования материала и осуществляется в два приема:
 — систематизация сведений — разбиение всего массива информации на блоки по какому то признаку — выделение фактов;
 — собственно сопоставление — поверхностный анализ с целью выявления явных и возможных связей с объектом изучения и с иными «кусочками» информации;
 — фиксация этих связей.
При использовании компьютерного анализа такие связи можно выявлять по датам, по действующим лицам, по месту свершения события, по названиям, по сферам интересов, по телефонам и т. д. Работая в ручную можно выявить и неявно выраженные связи.

Например
Сфера наших интересов — Общество изучения НЛО
Мы получили сообщение
«08.047.2001 в 300 милях южнее острова Гренландия пропал авианесущий крейсер Слава. Последний сеанс связи состоялся в 7:00 по Гринвичу и носил эпизодический характер. Было получено три обрывка передаваемой информации, содержание которых не разглашается. Как стало известно нашему источнику, в этих отрывках сообщалось о множестве квакеров в непосредственной близости от корабля и необъяснимых перебоях в работе бортовой аппаратуры. После чего связь прервалась, а космические системы слежения перестали фиксировать корабль. В тот же Вячеслав Иванов, председатель общества Изучения НЛО, направил Президенту Р Ф В. В. Путину письмо с требованием незамедлительно предоставить для изучения имеющиеся у военного ведомства материалы о так называемых „квакерах“, аномалиях, неоднократно зафиксированных в мировом океане Российскими подводниками. В данном послании, в частности говорится, что замалчивание этих фактов является одной из основных причин гибели людей и вся ответственность за это лежит на военных и на президенте России. Интерес к данному происшествию проявляют спецслужбы всех ведущих держав. В предыдущих заявлениях В Иванов заметил, что в области изучения подобных феноменов его организация тесно сотрудничает с Британской МИ-6 и Американским ЦРУ.»

Что указывает на то, что данное сообщение нам интересно?
 — прямое указание Общества изучения НЛО;
Далее выясняем, что может идентифицировать это общество или иначе говоря стать его смысловым синонимом?
 — поскольку олицетворением Общества является его руководитель В Иванов, то он автоматически становится объектом изучения;
 — далее мы видим явный интерес общества к феномену Квакеров;
 — также просматривается связь Общества с МИ-6 и ЦРУ, хотя она может оказаться блефом.
После этого начинаем поиск подтверждающей или опровергающей информации в доступном массиве по выявленным фактам и признакам:
 — информация о И Иванове
 — информация о феномене квакеров
После сбора сопоставляем полученную информацию и:
 — подтверждаем или опровергаем данные;
 — обогащаем свои знания об объекте интереса.
Попробуйте проделать то же самое с информацией по ЮАИЗ, приведенной ранее. Предположим, что сфера наших интересов — собственно ЮАИЗ. Определите идентификаторы нашего объекта интереса. Выявите прямые связи ЮАИЗ и кратко их охарактеризуйте. Выявите из текста характеристики ЮАИЗ. Найдите в доступном для вас информационном массиве (оптимальный вариант — Интернет) подтверждения выявленным связям и характеристикам.

Синтез данных
Синтез данных — наиболее важная процедура обработки информации — логическое объединение элементов информации, внешне не обладающих связями, в систему единой направленности. Здесь упор делается на выдвижение обоснованной гипотезы. На этом этапе работы с информацией решаются следующие задачи:
 — установление связей между разрозненными элементами и укладывание их в единую логическую схему (например описательная модель объекта или модель поведения);
 — формулирование на основе полученных моделей гипотезы;
 — определение потребностей в недостающих сведениях и постановка задачи по их нахождению;

Наиболее используемые варианты синтеза:
 — Описание;
 — Причинно — следственный анализ;
 — Гипотетический метод.

Описание и его методы.
Описание производится в рамках той задачи, которую аналитик ставит перед собой. Описание служит лишь умозрительному познанию, показу различных сторон изучаемого объекта или события.
С помощью описания информация приводятся к такому виду, который позволяет использовать ее в качестве материала для объяснения происходящего. Описание это не более чем модель описываемого предмета.
Описывать событие — значит отвечать на вопросы о его качественных и количественных сторонах. Эти вопросы формулируются очень просто: «какой?, какое?, какая?, сколько?» и т. д. Поэтому описание отличается от простой констатации фактов, которая лишь отвечает на вопросы: «что?», «где?», «когда?». При простой констатации фактов сотрудник показывает наличие или отсутствие некоего события. А при описании он обращает внимание на свойства явления или объекта.
Главное при описании заключается в характеристике объекта интереса, то есть в выяснении качеств, а особый интерес при этом уделяется качествам, свойственным только этому объекту, либо узкому кругу объектов. Иными словами тому, что выделяет его из общей массы подобных. Аналитик прежде всего должен выявить те особенные качества явления, которые дают наиболее полное представление об исследуемой стороне этого предмета. Чем детальнее, правильнее в этом смысле описание, тем больше сведений дает оно о том, что описывается.

Например
Берем тоже сообщение и тот же объект интереса — Общество изучения НЛО.

«08.047.2001 в 300 милях южнее острова Гренландия пропал авианесущий крейсер Слава. Последний сеанс связи состоялся в 7:00 по Гринвичу и носил эпизодический характер. Было получено три обрывка передаваемой информации, содержание которых не разглашается. Как стало известно нашему источнику, в этих отрывках сообщалось о множестве квакеров в непосредственной близости от корабля и необъяснимых перебоях в работе бортовой аппаратуры. После чего связь прервалась, а космические системы слежения перестали фиксировать корабль. В тот же Вячеслав Иванов, председатель общества Изучения НЛО, направил Президенту Р Ф В. В. Путину письмо с требованием незамедлительно предоставить для изучения имеющиеся у военного ведомства материалы о так называемых „квакерах“, аномалиях, неоднократно зафиксированных в мировом океане Российскими подводниками. В данном послании, в частности говорится, что замалчивание этих фактов является одной из основных причин гибели людей и вся ответственность за это лежит на военных и на президенте России. Интерес к данному происшествию проявляют спецслужбы всех ведущих держав. В предыдущих заявлениях В Иванов заметил, что в области изучения подобных феноменов его организация тесно сотрудничает с Британской МИ-6 и Американским ЦРУ.»

Опишите Общество изучения НЛО, исходя из данных предложенных в рассмотренном информационном блоке. Какими качествами (свойствами) обладает наш объект интереса, исходя из данного сообщения?
 — руководитель Общества И Иванов;
 — Общество занимается изучением необъяснимых феноменов, по крайней мере внешне;
 — Общество имеет доступ к секретной информации министерства обороны;
 — руководитель Общества не боится громких заявлений и старается привлечь внимание (к себе, к Обществу, к проблеме);
 — Общество проявляет значительный интерес к тому же событию, что и спецслужбы ведущих держав;
 — вероятна связь между Обществом и МИ-6 и ЦРУ.

Группировка данных.
Этот метод заключается в упорядочивании данных по определенным признакам. Группировка позволяет связать разрозненные факты в единую систему, соответствующую тому или иному предположению, рабочей гипотезе и т. п. Группировка может производиться по разным признакам в зависимости от задачи, поставленной автором. Например по датам, по месту происшествия, по связи с неким объектом.

Типологизация данных.
Типологизация это поиск устойчивых сочетаний свойств исследуемых ситуаций, процессов, событий, феноменов. Например, признаки, характеризующие какую то группу людей в зависимости от их отношения к религии, места в системе управления обществом, взаимоотношения с силовыми структурами, социального статуса и других отличительных свойств.

Наиболее используемый способ группировки данных состоит в том, что составляется блок-схема описания объекта интереса. Сначала формируются укрупненные блоки. Затем, внутри этих блоков формируются группы, а внутри них уже ячейки. Например наш объект интереса некое предприятие Х. Исходя из наших интересов мы составляем укрупненную блок-схему:
1 блок — идентифицирующие данные
2 блок — структура
3 блок — имущество
Далее детализируем эти блоки. Возьмем для примера 3 блок «Имущество»:
1 группа — недвижимость
2 группа — ценные бумаги
3 группа — денежная масса
3 группа — долговые обязательства
Затем составляем ячейки. Возьмем для примера 1 группу «Недвижимость»:
1 ячейка — жилые здания
2 ячейка — производственные сооружения (цеха)
3 ячейка — складские помещения
4 ячейка — земля
5 ячейка — станки
Таким образом формируется структура описания объекта. После того как эта структура создана можно переходить собственно к группировке данных. Каждый новый информационный блок изучается с целью выявления в нем информации, которая подходит под описание како либо из ячеек. Если такая выявляется, то она переносится в эту ячейку с обязательным указанием атрибутов информационного блока, из которого была извлечена. Вполне возможно, что в одну ячейку может попасть несколько цитат из разных информационных блоков. Если они не противоречат друг другу — возможно их объединение. Если есть противоречие, то необходима дополнительная проверка для установления истины. По окончании такого исследования получается достаточно лаконичное и четкое описание интересующего вас объекта.

А теперь практическое задание — составьте описание компании ВТФК, основываясь на приведенных ниже информационных блоках. Исходите из того, что все три блока достоверны.
«24.08.1997 года корпорация ВТФК заключила соглашение с рядом Японских и Китайских компаний о совместной работе по созданию единой информационной системы Азии. Целью данного проекта является объединение информационных систем стран Азии в общую схему и преодолении, существующих в настоящее время ограничений в использовании Интернета в данном регионе. Такими ограничениями Петров С. Ю. (президент корпорации ВТФК) назвал отсутствие доступа к глобальной паутине в ряде регионов, низкая пропускная способность Интернета и невозможность нормального ориентирования в информационном пространстве региона. В настоящее время уже разрабатывается проект по организации точек доступа в ряде удаленных провинций Китая. Помимо этого планируется запуск спутников связи. К проекту уже проявили интерес правительство Индии и Ирана. Со слов Петрова С. Ю. работы по созданию глобальной Азиатской информационной системы не менее чем на 50% финансируются правительством России. Кроме того Петров С. Ю. заметил, что данное предприятие пользуется поддержкой и ряда депутатов Госдумы и изложенное выше дает ему право утверждать о гарантированном успехе. Не далее как в 1999 году он планирует запустить основные узлы системы на территории России, Китая и Японии.»

«Сегодня (10.09.1997) в Госдуме рассматривался законопроект о „Свободе электронной информации“. Суть его заключается в предоставлении значительных налоговых послаблений организациям, вкладывающим свои средства в развитие информационной инфраструктуры Росси. С законодательной инициативой выступил комитет Госдумы по информации, а депутат Сивоконь А. М. (председатель этого комитета) произнес эмоциональную речь в поддержку Россиских предпринимателей, не жалеющих сил и средств на развитие данной отрасли экономики.»

«Сивоконь А. М., депутат Госдумы Р Ф, до выдвижения являлся генеральным директором ООО „Инфо-Маркет“ (с 1993 по 1996 года). ООО „Инфо-Маркет“ финансировало предвыборную компанию господина Сивоконь А. М., ООО „Инфо-Маркет“ создано в 1991 году Петровым С. Ю., входит в состав корпорации ВТФК и осуществляет продажу комплектующих для информационных систем. Петров С. Ю. долгое время работал в Институте Востока и занимался проблемами информатизации. В развитии своего предприятия явно пользовался поддержкой силовых структур. Неоднократно оказывал финансовую поддержку ряда целевых программ ФСБ»

Причинно — следственный анализ и его методы.
Причинная зависимость это связь явлений, одно из которых порождает другое. Первое явление называется причиной, а второе следствием. Во времени причина всегда предшествует следствию. Но причинно-следственную связь нельзя сводить к простой последовательности событий. Из того, например, что самолет взлетает после того как в него загружают багаж, не следует, что факт появления багажа на борту есть причина полета воздушного судна.

Логические методы причинно-следственного анализа
Метод исключения
Суть этого метода заключается в том, что, анализируя сложный комплекс причинно-следственных отношений, можно обнаружить непосредственную причину путем исключения всех предполагаемых обстоятельств (реально не влияющих, хотя и присутствующих), способных вызвать сходные события, кроме одного фактора, который после тщательной проверки и принимается за причину изучаемого явления.
Метод сходства
Использование метода сходства обусловлено тем, что интересующие события, причину которых аналитик хочет установить, возникают в самых разных обстоятельствах, но при этом всегда при наличии одного и того же фактора. Сущность этого метода сводится к следующему: если наблюдаемое событие возникает в различных обстоятельствах, но при наличии одного общего фактора, то этот фактор и есть причина происходящего. Используя данный метод, можно изучить разные условия возникновения одного и того же события и вычислить из них один и тот же общий фактор, вызывающий это явление.
С определенной долей вероятности можно утверждать, что этот фактор и есть причина, интересующая аналитика.
Метод одного различия
Сей метод сводится к сопоставлению случая, когда интересующее событие наступает, со случаем, когда оно не наступает. В обоих случаях должны быть одни и те же условия, за исключением одного, которое в одном из случаев отсутствует. Иначе говоря — если в одних и тех же обстоятельствах при наличии какого-то фактора событие наступает, а при его отсутствии исследуемое явление не происходит, то этот фактор и есть причина изучаемого явления.

Гипотетический метод
Началом объяснения причины события чаще всего становится гипотеза. Под гипотезой понимается неким образом обоснованное, но нуждающееся в более глубоком доказывании предположение о причине исследуемого аналитиком факта. Гипотеза представляет собой умозаключение, в котором есть неизвестные элементы. Создавая гипотезу, пользуются аналогией, индуктивным, дедуктивным методами. Часто, при выяснении причины исследуемых событий аналитик прибегает к аналогии. Создавая гипотезу аналитик, фактически, пытается объяснить почему так, а не иначе, вписав в свою гипотезу все собранные факты по делу.

Возьмите для проработки приведенные выше три информационных блока о компании ВТФК. Выделите гипотезы, объясняющие некоторые стороны существования компании ВТФК.
У вас должны быть выделены, помимо прочего, следующее:
 — связь Петров — Сивоконь, или система лоббирования интересов компании ВТФК посредством удовлетворения потребностей депутата;
 — взаимосвязь работы корпорации ВТФК и налоговые послабления.

Моделирование
Построение модели некоего объекта или события достаточно трудоемкий процесс, но в конце пути получается отличный инструмент прогнозирования. На самом деле моделированием, как и анализом каждый из нас занимается постоянно. Просто это происходит неосознанно. Что такое моделирование ситуации — это построение некой виртуальной копии объекта изучения с соблюдением определенных нами правил. Эти правила зависят от глубины изучения объекта-оригинала и от желаемой точности в копировании свойств.

Есть три основных метода моделирования:
 — экспертные системы;
 — статистический метод;
 — самообучающиеся алгоритмы.
Экспертные системы просто хранят в себе знания экспертов об определенной области. Эти знания сформулированы в виде правил. Например:
 — если на улице идет дождь — возьми зонтик и надень галоши;
 — если цена на нефть, золото и доллар резко пошла вверх — готовься к кризису;
 — если на складе запас товара превышает трех месячный объем продаж — закупки приостановить.
Это наиболее простой способ построения моделей — простой для понимания и для реализации. Его простота позволяет использовать практически в любых сферах деятельности человека.
Статистический метод заключается в накоплении статистических данных по исследуемому процессу и описание, на основе этих данных, происходящих изменений. У него есть некоторые ограничения — данный метод требует серьезных познаний в статистике (математике) и пригоден для структурированной информации, например информации выраженной в цифрах.
Самообучающиеся алгоритмы (наиболее известный вариант — нейронные сети) это некое сильно упрощенное подобие организации человеческого мозга. Есть масса мини-объектов между которыми можно построить неограниченное количество связей. Именно организация этих связей и есть описываемая модель, А работа с подобными системами сводится к тому, что мы вливаем в эту сеть историю изучаемого процесса. Система выбирает закономерности и формирует модель процесса. Постепенно, методом проб и ошибок, эта модель оттачивается и получается необходимый инструмент.
Например берем историю болезни пациентов, перенесших инфаркт. Предполагаем, что вероятность рецидива зависит от состояния больного. Формализуем данные — выявляем зависимости состояния пациентов от некоторых, определенных заранее показателей (температура, давление, пульс, вес, рост, пол). Вносим эти данные в нейросеть — фактически вводим исходные данные и выходные данные, плюс некие вероятные зависимости или правила. Изначально для системы все показатели равнозначно влияют на вероятность рецидива — результат получается не очень хороший. Далее нейросеть начинает менять зависимости так, чтобы свести ошибку к минимуму, пол влияет средне, вес минимально, а давление значительно. Меняя зависимости аналогичным образом много раз, нейросеть находит такие зависимости, которые сводят ошибку к минимуму. Модель готова.
Самообучающиеся алгоритмы — наиболее приемлемый метод для построения моделей на основе неструктурированной информации (текстовой информации). Но данный метод имеет свои особенности и сложности. Перед внесением данных в нейросеть их нужно тщательно обработать удалив «мусор». Иначе внеся «мусор» на входе — получите «мусор» и на выходе. В первую очередь необходимо выбрать основополагающие свойства оригинала. Те свойства, которые оказывают максимальное воздействие на интересующие нас стороны существования объекта изучения. Например мы хотим смоделировать поведение генерального директора компании Х, назовем его «Мистер Х». В первую очередь нужно четко определить для чего нужна эта модель, иначе она окажется очень громоздкой. Например это нужно для понимания того, как он отреагирует на начало демпингования нашей компании на общем рынке. Для него такая ситуация будет некоторым стрессом или кризисом. Поэтому можно говорить о том, что мы хотим понять как Мистер Х поведет себя в стрессовой или кризисной ситуации. Теперь необходимо определить от чего зависит его поведение: от погоды, от курса доллара, от высказываний Президента Р Ф, от настроения жены и т. п., и какие ресурсы он при этом может или попробует привлечь: административный, финансовый, криминальный и т. п. Что бы это понять необходимо проследить его поведение (именно с точки зрения наличия кризисных и стрессовых ситуаций) на некотором, достаточном для выводов, отрезке времени, т. е. получить упорядоченный во времени перечень изменений его поведения и таким же образом упорядоченный перечень изменений возможных факторов и стилей поведения. Имея такие перечни можно находить зависимости и строить предположения. Затем проверять эти предположения и в конечном счете получится довольно устойчивая модель поведения Мистера Х в кризисных или стрессовых ситуациях. Имея такую модель уже гораздо проще ответить на вопрос о том, как он себя поведет в том или ином случае, в том числе и в случае демпинга.

Приемы анализа

Построение последовательности событий.
(Исторический метод)
Данный метод является одним из наиболее простых, но не смотря на свою простоту именно этот метод позволяет быстро понять что происходит, именно с него начинается изучение той или иной области, того или иного объекта. Суть его несложна — все поступающие данные выстраиваются по времени описываемых событий. После чего определяется что за чем следует, какой факт какое событие предопределяет, что чему сопутствует и т. п. Иначе говоря восстанавливается хронология событий. Это один из наиболее эффективных и используемых приемов обработки информации.
При построении цепочки событий, особенно если аналогично рассматриваются и параллельные происшествия, становиться многое понятно. Используя данный метод можно выяснить как развивались события, что за чем следует и что чему предшествует, можно выявить определенные закономерности.
Разновидности данного метода используются для исследования потоков товаров — откуда, куда, через кого и когда проходил товар (или груз, или информация). Результатом такого исследования становится диаграмма событий. Сами события располагаются вдоль выбранной оси (горизонтальной или вертикальной), на которой есть разметка времени. А от предшествующего события к последующему ведет стрелка. С помощью такой визуализации удобно отображать большие объемы информации, выявлять аномалии и отклонения, находить «скопления» событий и т. п.
Для тренировки постройте последовательность событий для истории корпорации ВТФК на основании приведенных выше трех информационных блоках.
Выявление связей.
Этот метод можно охарактеризовать как определение всего, что так или иначе связано с изучаемым объектом или событием. Такие связи могут быть явными и неявными. К явным относятся прямо установленные, то как учредитель — учрежденный, продавец — покупатель, родственники и т. п. К неявным относятся те связи, которые нельзя доказать фактами, но которые могут существовать. Например один юридический адрес у нескольких организаций может указывать на то, что они созданы одной юридической конторой, а на основе этого можно предположить и более значимую связь, которая безусловно требует дополнительной проверки. Неявные связи не являются фактами, но они указывают на то, в каком направлении нужно вести поиск. А это уже задание оперативникам.
Оптимальным представлением выявленных связей является визуальная форма — диаграмма связей. Объекты, между которыми выявлены связи, обозначаются разными геометрическими фигурами — в зависимости от принятых условностей. Например человек — круг, а организация — прямоугольник. А связи — линиями. Если исследовать таким образом телефонные контакты или почту, можно учитывать направление связи используя для обозначения связи стрелки, а не линии. В центре такой диаграммы удобнее всего располагать объект с наибольшим количеством связей с другими объектами.

Выявление силы связей.
Данный прием хорошо иллюстрируется анализом телефонных контактов. Все контакты (связи) между объектами сортируются в зависимости от того между кем они возникают. Затем оцениваются по частоте возникновения либо по продолжительности действия. На основе данных о силе связей строятся гипотезы и вырабатываются рекомендации для дальнейшего поиска.
Таким образом хорошо анализировать детализацию телефонных контактов. Если у вас есть такая детализация за определенный период вы можете определить с каким абонентом у исследуемого наиболее тесные контакты, с кем контакты в нерабочее время, с кем в рабочее. Если такую статистику сравнить со статистикой одного из контактеров исследуемого лица, то можно выявить еще и их общие контакты, и их плотность.

Например
Иванов за исследуемый период общался:
 — с Петровым 4 раза
 — с Сидоровым 2 раза
 — с Сергеевым 7 раз
Напрашивается вывод о том, у Иванова с Сергеевым наиболее плотные контакты. Далее можно строить гипотезы и собирать дополнительную информацию.
Необходимо выделить несколько типов силы связей:
 — частота;
 — плотность;
 — стабильность.
В примере с телефонными переговорами частота обозначает сколько раз осуществлялся контакт. Плотность указывает продолжительность разговоров. А стабильность описывает регулярность таких контактов — раз в день, пять раз в день или раз в неделю.
Если данные о силе связей нанести на диаграмму связей, получится еще более информативный документ. Силу связи можно обозначать толщиной и/или формой линии, или указанием силы связи цифрами на самой линии или рядом с ней. Цифра может обозначать выбранный вами признак: количество контактов, длительность контактов, или их плотность и т. п.
Резюмирование текста.
На предыдущих этапах вы попробовали реферирование, а теперь используем близкий по приемам метод — резюмирование. Технология следующая. Исследуемый текст читается три раза.
При первом прочтении выделяются слова, несущие основную смысловую нагрузку — ключевые слова — они выделяются. Это могут быть имена, названия, даты, профессиональные выражения и т. п.
При втором прочтении внимание концентрируется на ключевых словах, при этом выделяются короткие, не содержащие ничего лишнего словообразования (словосочетания), отражающие основные мысли исследуемого текста и характеризующие ключевые слова — также выделяются.
На третьем прочтении внимание обращается только на выделенные словообразования и на их основе строятся простые, краткие предложения, описывающие смысл сообщения. После чего делается вывод об основном смысле изучаемого текста.
Есть второй способ резюмирования — текст делится на законченные блоки (например абзац) и содержание этих блоков пересказывается в одном предложении.
Существует и еще один способ — табличный. Он используется, в основном, для приведения к единому виду большого количества сходных по тематике информациооных блоков. Изначально определяются, интересующие исследователя признаки. Затем составляется унифицированная форма объединения информации — обычно таблица (отсюда и название метода). После этого из каждого информациооного блока выделяются признаки соответствующие выделенным признакам и заносятся в таблицу. Например, мы хотим таким образом обработать информацию о «заказных» убийствах. Определяем, что существенными для нас являются следующие данные: способ убийства, место убийства, причина убийства. Исходя из этого обрабатываем имеющуюся информацию — разносим выявленные признаки в соответствующие ячейки таблицы. Далее к обработанной таким образом информацией можно применить и статистические методы, но изначально проводится подготовка текста — резюмирование. Фактически это структуризация информации.

В процессе обработки текста (в том числе и резюмировании) не забывайте о своей конечной цели. Старайтесь понять как (каким образом) данный информационный фрагмент может вам помочь, в чем он будет полезен, как его можно и нужно использовать. В конечном счете потребителю вашего труда (если это не вы сами) нужно с минимальными затратами времени получить ответ на свой вопрос, а не массу сопутствующего материала. Хороший пример приводит Герберт Майер в своей книге по Бизнесразведке:

«Представте, что сейчас середина 80-х. Есть НАТО и есть Варшавский договор. Есть ФРГ и есть ГДР. Вы смотрите передачу по телевизору где-то в Америке. Вдруг передача прерывается новостями. „Восстание в ГДР. Потсдам закрыт для всех, телефонная связь прервана, по неподтвержденным данным было два десятка столкновений с полицией. СССР ничего не комментирует, но скорее всего отреагирует быстро и жестко.“
Это сырой материал — факты как они есть. Большинству людей это просто новость по тому, что она никак не влияет на их жизнь. А теперь попробуйте представить в каком виде эта информация должна попасть потребителям так или иначе зависящим от подобных событий.
Премьер-министру Франции. Восстание в ГДР будет подавлено. На час дня сегодня запланирована экстренная встреча послов, и нас будут принуждать осудить действия СССР по подавлению восстания. Вероятно войска НАТО будут приведены в боевую готовность, но это демонстрация силы и не более того. Угрозы интересам Франции нет.
Президенту США. Есть слабые признаки того, что восстание перекинется на другие города ГДР. Следует ожидать требований канцлера ФРГ воздержаться от резких заявлений, поскольку он опасается, что такие высказывания спровоцируют Советы на полномасштабный ввод войск в ГДР. А это ФРГ считает для себя крайне опасным.
Министру иностранных дел Таиланда, прибывшему в Вашингтон на встречу с Президентом США. В связи с событиями в ГДР надо ожидать, что встреча будет на полчаса — час короче чем запланирована. Вероятно, нам следует перенести обсуждение важных вопросов, поскольку американцы сегодня будут слишком заняты, для конструктивного и длительного общения.
Директору фирмы ХХХ (машиностроительная компания из Огайо). Эти события в ГДР могут нам сильно навредить. Подписанный с ГДР договор о поставке насосов для газопровода с бюджетом в 7 млн долларов и одобренный Сенатом США может оказаться разорванным из-за эмбарго, которое вероятно будет введено в отношении ГДР.»

Потребителю информации в ряде случаев и подробности событий не нужны — ему нужна информация для решения его насущных проблем и ничего лишнего. Все максимально приземлено и заточено под интересы заказчика. Такая обработка информации это попытка ограниченными ресурсами добиться максимального результата. Это забота о заказчике, о его времени, которое очень дорого стоит.

Анализ сценариев
В данном случае, основываясь на существующих положении дел и тенденциях, аналитик пытается нарисовать картину развития ситуации. Наиболее распространен способ, при котором рассматривается три варианта развития событий: пессимистический, реалистический и оптимистический сценарии.
Перед тем как начать описывать сценарии нужно тщательно изучить силы влияющие на исследуемый объект (или ситуацию):
 — что за силы могут влиять, посредством чего происходит влияние,
 — с какой активностью происходит влияние,
 — устанавливаются причинно-следственные связи самой процедуры влияния.
А в процессе описания сценариев полезно иметь перед глазами список этих сил. Обычно написание сценариев начинается с вопроса типа «если объект Х почувствует, что его компания теряет рынок, что он предпримет?» Не видите никакого сходства с самонастраивающимися алгоритмами? Анализ сценариев схож по своей методе с нейронными сетями, но ограничен всего тремя вариантами (максимум, минимум и оптимум). Но здесь также необходимо определить факторы, влияющие на объект изучения, сила, с которой это влияние происходит и что обычно происходит при таком влиянии. И только после этого можно начинать предполагать, а что же будет в дальнейшем.

Автор Нежданов Игорь Юрьевич

Еще что нить полезное можно найти на сайте Аналитическая разведка

Опубликовано на личной странице 04.07.2007
Дата первой публикации 04.07.2007

ШколаЖизни.ру рекомендует

Комментарии (16):

Чтобы оставить комментарий зарегистрируйтесь или войдите на сайт

Войти через социальные сети:

  • Я эту статью в закладки добавила - может пригодиться. Но текст действительно тяжел для восприятия... Поэтому лично мне понятно, почему такой низкий балл и почему материал оставили в личном архиве.
    Как Вы думаете, какую книгу с большим удовольствием прочитают: учебник по физике или "Занимательную физику" Перельмана? Ответ сам собой напрашивается.
    Писать о серьезных и сложных вещах на ШЖ можно и даже нужно. Но, скорее, не в стиле учебника, а в стиле "Занимательной физики".

     
  • Теперь и Вы мне нравитесь!Не только ваши статьи.

    Почти без иронии.
    Я со своим грёбаным пер-фек-циониз-мом рискую в девках
    засидеться. А вы и ваш подход к делу ,а главное реакция на комменты!-
    меня вдохновляют.

     
  • Супер,Игорь! Мне понравилось!

    Что именно:
    1. Ваш подход к делу.
    (Я, как дура, после регистрации в ШЖ пару месяцев
    изучаю требования редакции,
    читаю опытных авторов,
    консультируюсь с отличниками Школы,
    коспектирую замечания редактора к другим статьям,
    если по-простому: провожу процесс собственного анализа информации для структуризации и категоризации,занимаюсь реферированием информации,обнаружением методов сходства с целью выявления явных и возможных связей с объектом )
    2. Ваша безусловная честность.(Можно было бы себе хоть 4-ку поставить.)
    Только одно пожелание - вы не пробовали сделать анализ текстовой информации редакции ШЖ?

     
    • Анализ всегда делается для чего то. по этому анализировать ШЖ нужно с какой то целью. У меня пока такой цели нет.

       
      • Люба Мельник Люба Мельник Бывший модератор 5 июля 2007 в 15:30

        А если целью поставить - научиться писать читаемые статьи?

         
        • У каждого произведения своя аудитория. Если кто то не может осилить арифметику это не значит , что алгебра и тригонометрия никому не нужны. Мне и в голову не приходило, что человеку далекому от моей темы эти статьи покажутся хорошими. Как в прочем и мне абсолютно безразличны статьи про кулинарию или про отвращение как основу нравственности. Так что вопрос - читаемые кем статьи? Ведь статьи специализированные. По этому и читать их будут специалисты (в данной области). И я совершенно не рассчитываю , что статья понравиться всем. Если из 100 посмотревших один заинтересуется... - для моей узкой специализации это будет хорошо. Но судя по публикациям в периодике - интерес проявит бОльшее колличество читателей.

           
          • Люба Мельник Люба Мельник Бывший модератор 5 июля 2007 в 16:56

            Ну-с, почитаем.
            "Первичный анализ информации уже начат на этапе ее оценки и даже раньше – на этапе ее получения"
            Вот у вас, Игорь, и не получается дать читателю возможность информацию из вашей статьи воспринять ее "на этапе ее получения".
            Интерес к теме есть, безусловно, потому все комментаторы сюда и пришли - именно эти - о которых вы пишете: "Если из 100 посмотревших один заинтересуется". И получили щелчок по носу.
            Статьи "специализированные" - "По этому и читать их будут специалисты (в данной области)". Занятная логика. А зачем специалистам в ЭТОЙ области ТАКИЕ СПЕЦИАЛИЗИРОВАННЫЕ статьи читать? Они ж специалисты, а вы, как говорите, написали учебное пособие - для специалистов будущих, так ведь? А читатели здесь - специалисты в самых разных областях, и пишут о том, что их интересует - и отнюдь не всегда по темам, близким им профессионально.
            Конечно, чтобы популяризировать такие темы, вообще чтобы популяризировать - нужен особый талант. Далеко не у всех он есть. Далеко не все внятно могут сложные вопросы осветить для широкой аудитории.
            Вы, придя сюда с желанием опубликовать статью, наверное, знакомились с требованиями к публикациям. Там об объеме ведь сказано - кажется, до 4 тыс. знаков. У вас - 32 тысячи.
            Так вот, если не удается популярно раскрыть тему - можно было хотя бы реферативно ее изложить. Чтоб людям понятнее было, чтобы они, заинтересовавшись, на ваш сайт сходили и в подробностях ту же работу увидели. Но вы же просто загнали это пособие сюда целиком.
            Этак снобистски у вас получилось: "Мне и в голову не приходило, что человеку далекому от моей темы эти статьи покажутся хорошими".
            Хорошая статья - это статья на любую тему, но только - ХОРОШО сделанная. Учебное пособие читают те, кому это необходимо. Как бы ни был плохо написан учебник, если обучающий его обучаемым навязывает - обучаемые прочтут. Статьи же читают те, кому это интересно.
            Такое представление информации губит всякую читательскую инициативу.
            Вообще, соглашусь, что учебники надо загонять в и-нет. Хоть учебник по рус. языку класса для пятого...
            Кто то - надо кто-то
            В прочем - надо впрочем
            По этому - поэтому
            статья понравиться - надо: статья (что сделает?) понравится
            Про синтаксис не берусь и говорить.

             
            • Знание русского языка журналистом это безусловно показатель хороший. А вот использование этого знания для самоутверждения это показатель вовсе не очень хороший. Такой способ используется в основном когда нет других аргументов.

              То, что вы сходили по ссылке - замечательно. Но учебного пособия там нет. Видимо вы были невнимательны. Учебное пособие значительно бОльше по объему и содержит гораздо больше материала.

              Теперь о популяризации. Для меня нет цели нести идеи в массы, а тем более упражняться в словесности. Публикую все это для того, что бы Те, кто идет за мной не тратили много времени на поиск того, что уже есть.

              Щелчка по носу тоже пока не ощутил. Ни одного комента по сути - только по форме.Форма важна когда нужно прорекламировать не нужный товар. А это не тот случай.

               
              • Люба Мельник Люба Мельник Бывший модератор 5 июля 2007 в 17:27
                Вот приедет барин

                Да что вы бранитесь.
                Я ж не о том печалюсь, что ваш текст не зарифмован! Знание родного языка на школьном уровне - показатель безусловно хороший для любого. Особенно для тех людей, которые этим языком пользуются при общении - русским письменным. Тем более, сам текст исполнен грамотно.
                Тем более что и речь в тексте - об анализе текстовой информации. Форма тоже несет информацию о тексте.
                Щелчок по носу вы не ощутили - так не о вас и речь. Это ощущают читатели - между прочим, заранее к автору настроенные весьма доброжелательно, и вы, наверное, это ощутили, хоть в малой степени. И приходят сюда именно за знаниями, а не в надежде насладиться формой.
                Потому и высказываются не по сути, а по форме: единственное это, о чем здесь можно говорить.
                Я прекрасно поняла, что цель - привлечь потенц. читателей к тому ресурсу, на котором тот же текст уже опубликован.
                Успеха в поиске Тех, кто идет за вами!

                 
  • Тема, наверняка, полезная. Меня привлекли слова "анализ", "текст", "информация". Но есть это "сырое мясо" - извольте, зубы сломать можно.
    В лучшем случае, статья пойдет в архив, если автор не улучшит для читателя.

     
  • Не смог дочитать до конца
    Что-то по-научному - мне не понять

     
  • Чует мое сердце, что в статье - кладезь полезной информации, но добывать ее оттуда... Игорь, пощадите! Ведь сейчас, чтобы понять и оценить статью, нужно срочно ее распечатать, потом проанализировать каждое предложение и абзац - в общем, с монитора такое читать - мука мученическая.

     
  • Люба Мельник Люба Мельник Бывший модератор 4 июля 2007 в 22:08

    Интересно, поднимется ли у кого рука - вообще ставить за это оценку?

     
  • Хм... кто-то что-то говорил про формат "глянцевого журнала"... Сложные вещи пишите, однако... такое бы в учебник... и две ссылки на свой сайт... реклама? ;)

    Оценка статьи: 1

     
    • Так учебное пособие уже в издательстве.... А расширенное издание по данной теме вышло в конце июня в издательстве Ось-89. А на счет ссылок - не без этого.