ИНФОРМА́ТИКА
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
Книжная версия:
Электронная версия:
ИНФОРМА́ТИКА, наука о методах и процессах сбора, хранения, обработки, анализа и оценивания информации, обеспечивающих возможность её использования для принятия решений. Предметом И. является общенаучное абстрактное понятие «информация» и методы её представления, преобразования и использования. Объектами И. являются: исходная информация – символы, сигналы, изображения, тексты, т. е. совокупность данных, доступных для использования; реализации и модели информации – результат применения к исходной информации методов предварит. обработки (обеспечивающих её приведение к виду, допускающему возможность использования математич. методов обработки, анализа и оценивания информации); математич. методы преобразования информации; реализации математич. методов преобразования информации в виде программ для ЭВМ; результаты обработки, анализа и оценивания информации, содержащие как решения, так и обработанную информацию, необходимую для их принятия.
И. связана с философией через учение об информации как общенаучной категории и через теорию познания; с математикой через математич. модели, математич. логику и теорию алгоритмов; с лингвистикой через формальные языки и знаковые системы. И. связана также с информации теорией и кибернетикой.
Информация – одно из наиболее общих понятий науки, обозначающее некоторые сведения, совокупность к.-л. данных, сообщений, знаний и т. п., которые были зарегистрированы, классифицированы, объединены (взаимосвязаны) или интерпретированы в рамках некоторой структуры т. о., чтобы они приобрели определённый смысл или значение. Информация, переносимая сигналом, как правило, имеет некоторый смысл, отличный от смысла самого факта поступления сигнала. Информацию можно рассматривать как филос. категорию, связанную со свойством отражения, присущего всей материи. Отражение не сводится к простому физич. взаимодействию двух объектов. Информация связана со свойством объектов, явлений и процессов порождать многообразие состояний, которые посредством отражения передаются от одного объекта к другому и запечатлеваются в его структуре.
При изучении информации возникают проблемы в технич., семантич. и прагматич. аспектах. Технич. проблемы посвящены вопросам точности, надёжности, скорости передачи сигналов. Семантич. проблемы связаны с вопросом о том, как точно можно передавать смысл текста с помощью кодов. Прагматич. проблемы связаны с тем, насколько эффективно информация влияет на поведение адресата. Понятие информации, подобно понятию энергии в физике, является одним из осн. понятий кибернетики – науки об общих законах получения, хранения, передачи и преобразования информации в сложных управляющих системах. При этом под управляющими системами понимают не только технич., но и любые биологич. и социальные системы. В науке 19 в. использовались гл. обр. четыре осн. понятия – материя, энергия, пространство и время. Кибернетика, добавив к ним понятие информации, расширила прежнее миропонимание. С появлением кибернетики и понятия информации совр. картина мира обрела более целостный характер. Материальные процессы – это процессы переноса и преобразования вещества и энергии, протекающие в пространстве и во времени. Кибернетика ввела в науч. оборот новую для науки область реального мира – информац. процессы, происходящие в системах управления разл. природы.
Исторический очерк
И. начала формироваться в 1960-х гг. в связи с появлением сложных прикладных задач большой размерности, не поддающихся анализу с помощью методов классич. математики (космич. исследования, разработка ядерного оружия, стратегич. и тактич. планирование воен. действий, анализ разнородной разведывательной информации). Эти задачи требовали описания изучаемых процессов в терминах сбора, хранения, обработки, анализа и оценивания информации и принятия управленч. решений или прогнозирования.
Специфич. особенностью И. является то, что в течение определённого периода её становления параллельно развивались два направления, каждое из которых именовалось «И.». Ныне под И. как наукой понимается направление, именуемое в англоязычной лит-ре «informatics» или «computer science». Др. направление, посвящённое изучению структуры и общих свойств объективной (научной) информации, закономерностям и технологии её функционирования в обществе, иногда называют документалистикой (документальной И.) или автоматич. анализом документов. Оно развивается с нач. 20 в., возникнув в связи с увеличившейся потребностью в эффективных методах сбора, обработки, хранения, поиска и распространения науч. информации. Можно считать, что И. зародилась в библиотековедении, когда появилась необходимость рационализировать деятельность проф. (спец.) библиотек в условиях информац. взрыва. Первым шагом в организационном оформлении И. было создание в 1895 Междунар. ин-та библиографии (Брюссель), ставшего в 1938 гл. проф. организацией специалистов по И. под назв. «Междунар. федерация по информации и документации» (Fédération Internationale d’Information et Documentation – FID). Создателем этого института – бельг. учёным П. Отле были очерчены контуры будущей науч. дисциплины. Первоначально для её назв. был использован термин «документация» (documentation). При этом документ понимался как некий материальный объект, содержащий закреплённую в нём информацию и использующийся на практике для хранения и передачи в пространстве и времени. Этот термин, однако, неудобен для наименования науч. дисциплины тем, что многозначен и акцентирует внимание на материальном носителе информации (в то время как всё большее значение приобретали «недокументальные» информац. процессы). В англоязычной лит-ре с кон. 1940-х гг. в том же значении стали употреблять выражение «научная информация» (scientific information), и в 1958 была проведена междунар. конференция по науч. информации. Автономизация И. в совр. понимании началась в кон. 1950-х гг. и активно продолжалась в течение 1960–70-х гг. Интенсивное развитие и совершенствование вычислит. техники и многочисл. примеры её растущего влияния на жизнь общества заставили начать серьёзно считаться с этим явлением. В 1957 нем. специалист в области вычислит. техники К. Штайнбух ввёл термин «И.» в ст. «Informatik: Automatische Informationsverarbeitung» («Информатика: автоматическая обработка информации»). Англ. термин «informatics» обычно (не совсем точно) отождествлялся с «вычислит. науками» («computer science»), он был одновременно и независимо применён У. Бауэром. Считалось, что в отличие от «вычислит. наук» И. – наука более теоретическая и, следовательно, более математизированная. Термин был составлен из комбинации слов «information» (информация) и «automation» (автоматика) и предназначен для обозначения науки, посвящённой автоматич. обработке информации. Он вошёл в употребление в Европе, за исключением Великобритании, где в осн. преобладало понимание, соответствующее термину «computer science» (наука о вычислениях). В 1962 отеч. учёный А. А. Харкевич предложил дать науке новое наименование: информология, или И. («информация» плюс «автоматика»). Осн. положения и принципы этой науч. дисциплины впервые были систематически изложены в монографии рос. учёных А. И. Михайлова, А. И. Чёрного и Р. С. Гиляревского («Основы научной информации», 1965). В 1968 она была переиздана в переработанном и дополненном виде под назв. «Основы информатики». После этого термин «И.» стал употребляться вместо термина «документация». Предлагался ряд определений предмета И.: И. – изучение феномена ЭВМ (амер. учёные А. Ньюэлл, А. Перлис и Г. Саймон, 1967); И. – изучение алгоритмов (Д. Кнут, США, 1968); И. – изучение информац. структур (П. Уагнер, США, 1968); И. – изучение и преодоление сложности (нидерл. учёный Э. Дейкстра, 1969). В дальнейшем все эти направления вошли в предмет информатики.
Франц. термин «informatique» был предложен в 1962 Ф. Дрейфусом и сопровождён переводами на англ. «informatics» и итал., исп. и португ. «informatica» для обозначения процессов использования ЭВМ для хранения и обработки информации. Франц. Об-во прикладной вычислит. техники (Société d’Informatique Appliquée) приняло термин «informatique» в качестве обозначения области своих интересов – проблем разработки и применения ЭВМ. Фактически к 1970-м гг. сложились две независимые науч. дисциплины, именовавшие себя И. Исследовали они, однако, две разные стороны одного феномена информации – содержательный смысл и технич. средства создания, накопления и распространения знаний. Понимание единства двух областей знания пришло в ходе развития информационных технологий. С одной стороны, обработка смысловой информации стала проводиться почти исключительно с помощью ЭВМ, с другой – повышение эффективности вычислит. систем потребовало учёта смыслового содержания данных. В 1987 А. П. Ершов, благодаря которому в рус. яз. вошло понимание термина «И.» в значении «программирование для ЭВМ», дал более широкое его определение: «Предметом информатики как науки является изучение законов, методов и способов накопления, передачи и обработки информации – прежде всего с помощью ЭВМ».
В целом в И. изучается информация, практика её обработки и техника, связанная с информац. системами; исследуются структуры, поведение и взаимодействие естеств. и искусств. систем, хранящих, обрабатывающих и передающих информацию; развиваются собств. концептуальные и теоретич. основания.
Информатика и новые методы научного познания
К нач. 1970-х гг. окончательно оформилась кибернетика как наука физико-математич. профиля с собств. предметом исследования – т. н. кибернетич. системами, представляющими собой абстракцию сложных систем, изучаемых широким спектром естеств., технич. и социальных наук. Выявляя общие аспекты в системах столь разл. природы, кибернетика ввела общий и притом принципиально новый метод их изучения. Это т. н. метод машинного эксперимента, промежуточный между классич. дедуктивным и классич. экспериментальным методами. Спектр проблем, доступных исследованию кибернетич. методами, по сравнению с классич. математич. методами, значительно шире. Метод машинного эксперимента стал мощным универсальным методом науч. познания в результате появления быстродействующих универсальных ЭВМ. Он основан на использовании формализованных описаний процессов и явлений – математич. моделей, в т. ч. их важного класса, т. н. имитационных моделей. Моделирование математическое было известно и применялось до возникновения кибернетики и И. Использование имитационных моделей, однако, было невозможно до появления понятия информации, концепции информационного анализа и ЭВМ.
Структура и состав информатики
И. можно рассматривать как совокупность методов и подходов кибернетики, теории формальных систем и документалистики. Она в значит. степени базируется на методах математич. кибернетики и методах математич. моделирования, которые тесно связаны с методом машинного эксперимента, в частности с имитационными моделями. Эти модели, по существу, являются переложением на машинный язык описаний моделируемых систем. Таким способом прежде всего начали решаться задачи анализа больших сложных систем. ЭВМ являются для них осн. инструментом исследований и, будучи сами большими сложными системами, выступают в качестве важного объекта исследований. Отличаясь теми или иными специфич. свойствами, большие системы могут изучаться информац. методами, специально приспособленными к системам соответствующих классов. Так возникли и продолжают развиваться специализир. прикладные разделы кибернетики и И.: технич., экономич., биологич., медицинские, военные.
В отличие от кибернетики, осн. предметом которой стало изучение информац. процессов управления и связи в больших сложных системах, развитие И. связано с проблемами извлечения, преобразования и использования информации с целью автоматизации принятия интеллектуальных решений, исключающей человека из этого процесса. В связи с этим в И. систематически изучаются алгоритмич. процессы, обеспечивающие описание и преобразование информации: теория, анализ, построение, эффективность, реализация и применение алгоритмов. Особый теоретич. и практич. интерес составляет проблема, связанная с тем, какие процессы поддаются эффективной автоматизации.
И. имеет достаточно сложную структуру, и пока не достигнуто полного согласия относительно направлений исследований и разделов, являющихся её неотъемлемыми частями.
Математический аппарат информатики
включает её математич. основы, теорию вычислений, алгоритмы и структуры данных.
Становление И. проходило под существенным влиянием тенденций развития собственно математики, «математизации» разл. областей науки, проникновения математич. методов во многие сферы практич. деятельности, быстрого прогресса вычислит. техники. Процесс математизации сопровождался возникновением ряда новых математич. дисциплин (алгоритмов теория, теория информации, исследование операций, игр теория), составляющих существенную часть аппарата теоретич. И. На основе задач теории управляющих систем, комбинаторного анализа, графов теории, теории кодирования развивалась дискретная математика, также являющаяся одним из осн. математич. средств информатики.
В состав И. входит значит. часть математич. методов кибернетики. Ряд математич. методов и направлений, возникших и развивавшихся в рамках кибернетики, вошёл затем в И. Это, в частности, относится к автоматов теории и теории логич. сетей. К теории автоматов примыкают теории формальных языков и грамматик, составляющие основу общей теории знаковых систем. Эти теории имеют дело с дискретной информацией и её преобразованиями, составляющими основу построения теории любых систем управления.
В И. используются математическая логика – алгебра логики, логич. выводы, формальные доказательства; чисел теория; графов теория; типов теория; категорий теория; вычислительная геометрия – исследование алгоритмов решения задач, сформулированных в геометрич. терминах. Важную роль в И. играет теория вычислений, в которую входят теория автоматов, где исследуются логич. структуры для решения задач; теория вычислимости, в которой устанавливается, что может и что не может быть вычислено, в т. ч. на совр. ЭВМ; теория вычислительной сложности; теория квантовых вычислений; алгоритмизация, анализ алгоритмов; программирование.
Связь И. с математикой не ограничивается лишь использованием в И. математич. методов. Математика и И. имеют общие области исследования. Так, алгоритмы, изучающиеся в математич. теории алгоритмов, могут рассматриваться как некоторые формализованные системы и могут исследоваться в И. Подход к изучению алгоритмов и возникающие при этом задачи в математике и в И. существенно отличаются. Для математики алгоритм является прежде всего одним из фундам. понятий, и гл. задача состоит в изучении общих свойств этого понятия, для чего необходимо свести его определение к миним. числу простейших фундам. понятий и операций. Задача И. – разработать практически удобные методы синтеза конкретных систем и алгоритмов. Указанная практич. направленность приводит к необходимости разработки достаточно удобных для пользования процедурно- и проблемно-ориентированных алгоритмич. языков. Вместо характерного для математики интереса к принципиальной возможности установления эквивалентности в тех или иных классах алгоритмов, в И. наиболее важно создание аппарата, удобного для фактич. выполнения эквивалентных преобразований алгоритмов. Вместо простейшей формы представления информации в виде слов в абстрактном алфавите И. изучает сложные структуры данных, необходимые для эффективной реализации алгоритмов на ЭВМ.
Методы информатики
включают алгоритмизацию, математич. моделирование и программирование. Алгоритмизация, заимствованная И. из математич. кибернетики, является одним из её важнейших инструментов и представляет собой составление математич. описания (математич. модели) изучаемого объекта, процесса или явления, т. е. реализацию причинно-следственных связей и др. закономерностей в виде направленного процесса обработки информации по формальным правилам. Источником исходной информации для алгоритмизации служат теоретич. и эксперим. данные, а также эвристич., неформальные сведения об изучаемом процессе. Алгоритмизация информац. процессов предполагает их точное описание на точно построенных искусственных языках – информационно-логических и алгоритмических, т. е. искусств. языках, предназначенных для представления соответствующих алгоритмов.
Формализация, являющаяся необходимым условием алгоритмизации (в частности, с помощью построения формализованных языков, тезаурусов и онтологий для представления некоторой содержательной области), и алгоритмизация (представление некоторого процесса обработки информации в виде детерминированного предписания алгоритма) требуют использования строгих понятий. Б. ч. наук и областей исследований (за исключением математики, механики, математич. лингвистики и некоторых др.) ещё не достигла уровня, позволяющего строить на имеющихся знаниях формальные системы и алгоритмы в математич. смысле этого понятия, т. е. они не подготовлены для уточнения систем своих понятий методом построения формализованных языков. Сложность формализации и алгоритмизации, с которой сталкивается И., связана также с уточнением смысла выражений науч. и естеств. языков – с вопросами семантики. Считается, что перспективным является такое уточнение семантики, которое опирается на алгоритмич. методы, причём оперирование абстрактными понятиями заменяется оперированием символами как конструктивными объектами. Подобное уточнение семантики является необходимым условием автоматизации интеллектуальной деятельности. Эти сложности формализации существенно затрудняют использование И. в ряде естеств. наук (биология, геология, мед. науки и пр.) и особенно в гуманитарных науках.
Математическое моделирование – один из важнейших инструментов И. в процессе получения знаний в результате обработки информации. Этот метод заключается в замене исходных объектов их математич. моделями и в проведении с ними вычислит. экспериментов, в результате которых определяются искомые характеристики и свойства объектов. Математическое (шире – информационное) моделирование к.-л. объекта состоит в разработке и использовании триады «модель – алгоритм – программа». Её построение даёт в руки исследователя инструмент, который вначале отлаживается и тестируется путём сравнения результатов, полученных в пробных вычислит. экспериментах, с результатами натурных экспериментов. После установления адекватности триады исходному объекту проводятся вычислит. эксперименты, дающие все требуемые знания о поведении объекта.
Программирование – в самом общем смысле – процесс создания любых программ для ЭВМ, реализующих математич. методы преобразования информации, т. е. изучение принципов построения и функционирования программ для ЭВМ, а также используемые методы и технич. приёмы. Программирование включает: разработку алгоритмов (использование методов теории алгоритмов для решения прикладных задач); разработку программ для ЭВМ (использование языков программирования для реализации алгоритмов); формальные методы (описание и исследование свойств программ с помощью математич. методов); языки программирования и компиляторы (компиляция и интерпретация – преобразование программ для ЭВМ); формальные языки для представления алгоритмов; архитектуры систем (разработка, реализация, оптимизация и верификация вычислит. систем); структуру и построение ЭВМ (описание вычислит. архитектур в виде электронной и электрич. схем); операционные системы (системы управления исполнением программ ЭВМ, обеспечивающие возможность практич. использования вычислит. системы); базы данных.
Функциональные и прикладные разделы информатики
В И. традиционно включаются распознавание образов, изображений анализ, искусственный интеллект, информационные технологии, документальная И., машинная графика, системы автоматизации проектирования, автоматизация науч. исследований, интеллектуальный анализ данных, информационно-телекоммуникационные системы, многозадачные, параллельные и распределённые вычислит. системы, человекомашинные системы.
Распознавание образов как науч.-технич. направление возникло и сформировалось в связи с необходимостью решать задачи анализа и оценивания неполной, противоречивой, семантически насыщенной информации, которая также может содержать помехи, с помощью вычислительно эффективных математич. методов. Исходной информацией в задачах распознавания образов служат числовая, символьная и экспертная информация, изображения, речь, сигналы, тексты, документы, чертежи и произвольные комбинации указанных разновидностей исходных данных. Методы и средства, созданные и разрабатываемые в рамках распознавания образов, предназначены для решения прикладных интеллектуальных задач принятия решений, диагностики, идентификации и прогнозирования (технич. диагностика, неразрушающий контроль, дистанционное зондирование, экологич. мониторинг, прогнозирование и диагностика в медицине, планирование и поиск в геологии, прогнозирование в химии, автоматизация науч. исследований). Особенность таких задач – невозможность использования классич. математич. (аналитич.) моделей для формализации и представления исходных данных, которые обычно неполны, противоречивы, слабо структурированы, неформализованы, нечётки. В основе их решения лежат модели, связанные с процедурами анализа и оценивания информации о задаче, гл. обр. прецедентов, косвенных характеристик, доступных для измерения, логич. и физич. ограничений, контекстных и пр. знаний. Математич. постановка задач распознавания образов, прогнозирования, анализа и понимания изображений и сигналов не зависит от предметной области и специфич. вида объекта анализа. Методы распознавания образов составляют основу информац. анализа и обеспечения, являющегося осн. функцией применения совр. вычислит. техники в пром-сти, науч. исследованиях, экономике и социальной сфере.
Анализ изображений. Начиная с 1960-х гг. б. ч. приложений в распознавании образов связана с анализом изображений. Роль изображения в качестве объекта анализа и оценивания определяется его специфич. информац. свойствами. Основным в анализе изображений является извлечение из них знаний и данных, необходимых для принятия и автоматизации интеллектуальных решений. Развитие математич. теории анализа изображений идёт по пути её алгебраизации на основе алгебраич. подхода к задачам распознавания и классификации и его специализации на случай представления исходной информации в виде изображений – дескриптивной теории анализа изображений, а также разработки алгебр изображений. Трудности решения задач анализа изображений определяются необходимостью обеспечить некоторый баланс между противоречивыми факторами: целью анализа, природой зрительного восприятия, методами и средствами регистрации, формирования и хранения изображений, допустимыми математич. и вычислит. средствами анализа. Осн. противоречие связано со специфич. информац. природой собственно изображения и формальными (символьными) методами анализа. Методы и средства анализа изображений используются в прикладных интеллектуальных задачах принятия решений, диагностики, идентификации и прогнозирования.
Искусственный интеллект. Предмет этого раздела И. – разработка и исследование систем, демонстрирующих наличие собственного «интеллекта» или способных к автономному поведению; в нём изучаются методы решения на ЭВМ таких когнитивных задач, с которыми человек пока справляется лучше. Для достижения этой цели используются методы представления и вывода при оперировании знаниями и методы решения задач на основе использования поиска. Как научные, так и технич. аспекты искусств. интеллекта основываются на гипотезе, согласно которой процессы, обеспечивающие разумное поведение, могут моделироваться набором символов и набором механизмов, порождающих временну́ю последовательность структур, построенных из этих символов. В программах ЭВМ эти символьные структуры используются для представления знаний проблемной области и знаний о решаемой задаче. Выделение и использование обоих видов указанных знаний и синтез представляющих их структур являются гл. проблемами искусств. интеллекта. В 1990-х гг. в области прикладных интеллектуальных систем усилия сосредоточились на создании систем следующих классов: системы интеллектуального управления, интеллектуальные системы автоматизации проектирования и системы для работы со зрительными сценами. При этом ранее созданные экспертные системы и системы, связанные с обработкой естеств. языка, вошли составными частями в системы интеллектуального управления и интеллектуальные системы автоматизации проектирования.
Системы автоматизации проектирования. Интеллектуальные системы автоматизации проектирования требуют для своего развития решения следующих осн. задач: создания спец. представлений знаний, в которых единообразным способом фиксируется информация о символьно-математич. описаниях и об образном представлении знаний вместе с процедурами, осуществляющими преобразования «образ – текст – образ», разработки спец. логич. систем, основанных на отношениях «часть – целое», «система – подсистема», «цель – подцель» и т. п.; решения в рамках таких систем вопросов о достижимости цели и планировании пути к цели; создания моделей когнитивной графики, предназначенных для генерирования подсказок на начальных этапах проектирования, при формировании принципиальных решений, относящихся к объекту проектирования.
Интеллектуальный анализ данных – процессы обнаружения в имеющихся данных нетривиальных, практически полезных и ранее неизвестных знаний, необходимых для принятия решений в разл. сферах человеческой деятельности. В этих процессах используют методы распознавания образов, классификации и прогнозирования. Интеллектуальный анализ данных находит применение везде, где ведётся сбор и накопление информации в электронном виде, в первую очередь в пром-сти и бизнес-аналитике.
Информационные технологии – область применения результатов И., охватывающая широкий класс областей деятельности, относящихся к технологиям управления и обработки данных на ЭВМ. Обычно под информац. технологиями понимают вычислит. технологии. Их основу составляет совокупность средств и методов сбора, обработки и передачи данных (первичной информации) для получения информации нового качества о состоянии объекта, процесса или явления (информац. продукта). Информац. технологии являются процессом, состоящим из чётко регламентированных правил выполнения операций и действий разной степени сложности над данными, хранящимися в ЭВМ.
Документальная И. – раздел И., в котором изучаются методы и процессы сбора и хранения науч. информации. Первоначально предмет этой науч. дисциплины включал следующие информац. процессы: создание документов, в которых регистрируются и публикуются новые открытия, идеи, результаты экспериментов и др. значимые формы отражения действительности; сбор этих документов в библиотеках и музеях; анализ документов для краткого, но исчерпывающего описания их содержания; «систематическое перераспределение», при котором схожие сведения из разных документов сводятся в тематич. хранилища на основе глобальной классификации знаний; синтез обобщающих документов, в которых всё оригинальное из каждой исходной работы сводится в общую объективную картину науч. знания.
Эти этапы работы с информацией составляют осн. содержание документальной И., которая модифицируется под влиянием новых достижений науки и техники. Объектом исследования в документальной И. является «научная информация», понимаемая в широком смысле как информация, полученная методами объективного (научного) познания и используемая во всех сферах обществ. жизни, а не только в науке как таковой. В этом смысле науч. информация противопоставляется, в частности, «художественной информации» и объединяется с деловой информацией в сфере бизнеса.
В документальной И., исследующей закономерности научно-информац. деятельности, ныне выработаны специфич. идеи и методы: описание содержания документа ключевыми словами; координатное индексирование; использование дескрипторов как классов условно эквивалентных ключевых слов; информационно-поисковый тезаурус как средство представления знаний; инверсная организация поисковых массивов; избирательное распространение информации о релевантных документах; интерактивный поиск информации; ранжирование документов по степени релевантности; автоматич. классификация документов по содержанию; анализ библиографич. ссылок для поиска информации и наукометрич. задач; законы роста, рассеяния и старения публикаций, их информац. ценности.
Роль И. обусловлена тем, что информация становится важным видом ресурсов, дополняющим и во многом заменяющим традиц. ресурсы – материю и энергию.