ИНФОРМАЦИО́ННАЯ СИСТЕ́МА
-
Рубрика: Технологии и техника
-
-
Скопировать библиографическую ссылку:
ИНФОРМАЦИО́ННАЯ СИСТЕ́МА, организационно упорядоченная совокупность программно-аппаратных и др. вспомогательных средств, обеспечивающая возможность надёжного долговременного хранения больших объёмов информации, поиска и обработки данных в соответствии с требованиями предметной области (которая моделируется И. с.), а также поддерживающая удобный интерфейс с пользователями системы. Включает компьютерное и коммуникационное оборудование, программное обеспечение, информац. ресурсы. Разработку и дальнейшее накопление информации в И. с. выполняют группы работников (системные программисты и системные администраторы), обеспечивающие администрирование и сопровождение программных и аппаратных средств хранимой информации, сбор и накопление информационных ресурсов в определённой предметной области. Хотя сама идея И. с. и некоторые принципы их организации возникли задолго до появления компьютеров (напр., библиотеки, архивы), компьютеризация в сотни раз повысила эффективность И. с. и расширила сферы их применения.
И. с. – неотъемлемая часть совр. инструментария информац. обеспечения разл. видов деятельности и наиболее активно развивающихся информационных технологий. Как правило, типовые программные компоненты, входящие в состав И. с., включают интерфейс пользователя, прикладную логику обработки данных, средства управления данными. И. с. широко применяются во всех областях человеческой деятельности: в науке (системы обработки эксперим. данных, системы математич. и имитационного моделирования и др.), гос. управлении (автоматизир. системы подсчёта результатов выборов, переписи населения и др.), экономике (бухгалтерские системы, расчёт бизнес-проектов и др.), образовании (напр., системы поддержки дистанционного обучения), связи (напр., услуги мобильной телефонной связи поддерживаются И. с.) и др. Интернет также является информац. системой.
Архитектура
В зависимости от масштаба применения и функциональных особенностей И. с. могут иметь разл. программно-аппаратную архитектуру: централизованную, файл-серверную, клиент-серверную или интегрированную.
Централизованная архитектура характеризуется тем, что хранение и управление данными, а также выполнение всех прикладных функций И. с. производится на одном выделенном компьютере, оснащённом несколькими терминалами, через которые пользователи получают доступ к информац. системе.
Файл-серверная архитектура предполагает, что для непосредственного хранения файлов данных используется выделенный компьютер (файл-сервер), к которому по локальной сети подключены клиентские рабочие станции, служащие как для управления данными, так и для поддержки приложений, т. е. той части И. с., осн. назначение которой – выполнение прикладных функций, требуемых в данной области, и поддержка интерфейса с пользователями.
В клиент-серверной архитектуре выделяется отд. компьютер (как правило, сервер базы данных), служащий для хранения и управления данными со структурой, свойственной данной И. с., а также иногда для выполнения части прикладных функций. К этому серверу баз данных по локальной сети подключаются клиентские рабочие станции, на которых выполняется логика приложений И. с. и обеспечиваются интерфейсы пользователей. Развитием клиент-серверной архитектуры является т. н. трёхзвенная архитектура, в которой между сервером баз данных и клиентскими рабочими станциями устанавливается дополнительный сервер приложений, выполняющий прикладные функции И. с. При такой конфигурации И. с. клиентские рабочие станции отвечают только за поддержку интерфейсов пользователя.
В интегрированной архитектуре нет явного разделения компонентов И. с. на серверные и клиентские (возможно, кроме серверов баз данных). Любой компонент И. с. в такой архитектуре может выступать в зависимости от ситуации как сервер или как клиент любого др. компонента. Интегрированная архитектура И. с., частным случаем которой является сервис-ориентированная архитектура, т. е. запись, указывающая начальную (исходную) точку полномочий (start of authority – SOA), позволяет решать задачи интеграции И. с. и создания т. н. унаследованных систем (возникающих, напр., при слиянии организаций), а также проблемы, появляющиеся при переходе на новые программно-аппаратные средства организации И. с. Кроме того, при использовании И. с., основанных на интеграционной архитектуре, проще и дешевле всего можно добиться увеличения пропускной способности путём добавления соответствующей аппаратуры при изменении требований в прикладной области. Развитием идей SOA явились «облачные» среды – центры данных, предоставляющие клиентам разнообразные услуги – от предоставления в аренду реальных или виртуальных вычислительных средств до обеспечения платного доступа к СУБД или даже готового приложения. Использование облачных сред позволяет организациям отказаться от поддержки собственной инфраструктуры И. с. В 21 в. в архитектуре информационных систем проявились тенденции к применению массивно-параллельных или распределённых серверных средств и переносу многих компонентов И. с. как можно ближе к данным, на сторону сервера баз данных. Такие архитектуры обеспечивают высокую пропускную способность И. с., а также возможность их горизонтальной масштабируемости при росте объёмов данных.
Проектирование и разработка
На этапе проектирования собираются и анализируются разл. требования, предъявляемые к И. с. со стороны её будущих пользователей, определяются логич. структура и архитектура И. с., выделяются осн. компоненты и др. Для проектирования И. с. чаще всего применяются методологии, технологии и инструментальные средства проектирования, основанные на использовании языка UML (unified modeling language – унифицированный язык моделирования). В UML определён набор т. н. диаграммных нотаций, т. е. средств, позволяющих визуально отображать разл. аспекты структуры и поведения проектируемой информац. системы.
При создании И. с. могут применяться разл. программные средства, но, как правило, обязат. компонентом И. с. является к.-л. система управления данными, в большинстве случаев – система управления базами данных (СУБД). Используя только средства СУБД, можно построить простую клиент-серверную И. с. (в которой на клиентских рабочих станциях будут выполняться лишь компоненты СУБД, поддерживающие интерфейсы пользователей с базами данных).
В более сложных случаях, когда в И. с. должна реализовываться обработка данных, характерная для к.-л. области применения, требуется разработка спец. прикладных программ, которые могут размещаться (в зависимости от выбранных архитектуры и структуры И. с.) в клиентских рабочих станциях, на серверах приложений или на серверах баз данных. Для разработки приложений И. с. можно использовать разл. языки программирования (Java, С++, C#, PHP и т. п.), поддерживаемые инструментальными средами разработки. Напр., системы класса ERP (enterprise resource planning – планирование ресурсов предприятия) позволяют создавать интегрированные внутриорганизационные И. с. Обычно такие системы представляют собой наборы модулей, которые ориентированы на автоматизацию к.-л. вида деятельности предприятия (напр., управление кадрами, финансами и др.) и работают с общей базой данных. В этом случае создание И. с. сводится к настройке модулей системы класса ERP в соответствии со спецификой организации или внешних условий её функционирования.
Для построения аналитич. И. с. обычно используются программные средства проектирования и управления хранилищами (datawarehouse) и витринами (data mart) данных, готовые приложения оперативной аналитич. обработки данных On-line Analytical Processing (OLAP) или интеллектуального анализа данных (data mining), а также средства разработки таких приложений.
Для поддержки работы приложений И. с. с неструктурированными данными (текстами произвольного формата, графическими, аудио- или видеоданными) используются спец. средства информац. поиска, которые встраиваются в СУБД или функционируют в виде отд. поисковых механизмов над файловыми системами (именно в таком виде они обычно применяются в И. с., предназначенных для массового использования в среде Интернет).
Для создания И. с. с интегрированной архитектурой используются программные продукты категории промежуточного программного обеспечения (middleware). В состав промежуточного программного обеспечения, предназначенного, напр., для поддержки архитектуры SOA, входят продукты, которые обеспечивают возможность описания процессов внутри- или межорганизационной деятельности предприятия и автоматич. поддержку выполнения этих процессов на стадии функционирования И. с. Однако для описания таких процессов и верификации описаний требуются дополнит. усилия разработчиков информац. системы.
Особое внимание при построении любой И. с. уделяется информац. безопасности, для поддержания которой применяются спец. технические (аппаратные, программные) и организац. средства. В разных И. с. к обеспечению безопасности предъявляются разл. требования, направленные на достижение целостности информации (на основе которой принимаются решения); защищённости информации от случайных и умышленных искажений; доступности информации (а также соответствующих прикладных служб) в любой момент, когда в ней возникает потребность; конфиденциальности (т. е. информация должна быть доступна только тем, кому она предназначена).
По сфере применения и используемым технологиям различают транзакционные И. с., системы поддержки принятия решений (аналитические и экспертные) и информационно-поисковые системы.
Транзакционные И. с. применяются в предметных областях, в которых для выполнения требуемых функций нужно руководствоваться текущим информац. наполнением системы, но при выполнении функций эта информация изменяется (системы – бронирования билетов, банковские, бухгалтерские, управления складами и т. д.). Транзакционные И. с. опираются на использование СУБД с поддержкой транзакционных свойств атомарности наборов операций, выполняемых в рамках одной транзакции (последовательность элементарных, атомарных операций); согласованности хранимой в системе информации после завершения любой транзакции; изолированности транзакций (данные, изменяемые к.-л. операцией внутри транзакции, становятся видны др. транзакциям только после завершения данной транзакции); долговечности данных (в системе гарантированно сохраняются данные, помещённые в неё любой завершённой транзакцией).
К системам поддержки принятия решений (decision support systems – DSS) относятся информац.-аналитич. системы (ИАС) и экспертные системы (ЭС). ИАС представляют собой тип И. с., в которых с помощью сложных запросов по определённым расчётным алгоритмам производятся обработка, отбор и анализ информации (данных), находящейся в системе. ИАС можно использовать для общей реорганизации бизнес-процессов, повышения качества деловой информации, поддержки стратегич. планирования и достижения оптимальных решений и др. Эффективная обработка и объединение информации достигаются применением спец. инструментов извлечения, преобразования и загрузки данных. Эффективное хранение информации обеспечивается наличием в составе ИАС целого ряда разл. источников данных, напр. спец. хранилищ данных (Data Warehouse), накапливающих информацию (из разных источников за большой период времени) и обеспечивающих к ним оперативный доступ. Анализ данных осуществляется при помощи совр. инструментов (программ) делового анализа данных. ЭС отвечают на запросы пользователей (специалистов в данной предметной области), исходя из содержащейся в них информации и набора правил, называемых экспертными знаниями (поскольку эти правила обычно формируют на основе опросов людей-экспертов), а также выдают возможные варианты (рекомендации) принятия решений. Имеется и др. подход к построению экспертных систем, при котором ЭС сама накапливает экспертные знания путём самообучения.
Информационно-поисковые системы (ИПС) предназначены для поиска информации в больших (возможно, распределённых) хранилищах неструктурированных данных (как правило, текстовых документах, реже в хранилищах графич. изображений, аудио-, видеоданных и др.). Осн. критерии качества работы ИПС – релевантность поиска (соответствие между желаемой и действительно полученной информацией), учёт морфологии языка (при поиске в текстовых документах). Большинство совр. пользователей ИПС ищут информацию на веб-сайтах, но существуют также системы, способные искать файлы на FTP-серверах (File Transfer Protocol – протокол передачи данных, с помощью которого можно обмениваться файлами с др. пользователями), информацию о товарах в интернет-магазинах, а также информацию в группах новостей USENET (всемирная доска объявлений). Осн. традиц. принципом работы текстовых ИПС является поиск по ключевым словам (с учётом морфологии), однако активно развиваются методы семантич. поиска, в котором помимо целевых документов используются онтологии, обеспечивающие семантич. связи между сущностями предметной области и позволяющие получать ответы на сложные смысловые поисковые запросы.
Следует отметить, что приводимая классификация по сфере применения в достаточной степени условна. Крупные И. с. часто обладают признаками всех перечисленных выше классов. Кроме того, корпоративные И. с. масштаба предприятия обычно состоят из ряда подсистем, относящихся к разл. сферам применения.
С начала 21 в. в связи с взрывообразным ростом данных во всех областях человеческой деятельности обострилась проблема «больших данных» (big data), с которой приходится сталкиваться разработчикам всех видов И. с. Требуется выбирать такие инфраструктурные средства разработки И. с., которые обеспечивали бы эффективное и экономически целесообразное масштабирование этих систем при росте объёмов данных. Одним из признанных подходов к обеспечению такой масштабируемости является применение технологий массивно-параллельных или распределённых систем, узлы которых не используют общих ресурсов (основной и внешней памяти) и общаются только путём передачи сообщений по связывающей их сети. И. с., основанные на таком подходе, обладают горизонтальной масштабируемостью, т. е. способностью сохранять или даже повышать показатели производительности при росте объёмов данных за счёт добавления дополнительных узлов. Горизонтально масштабируемые транзакционные информационные системы могут основываться на массивно-параллельных транзакционных СУБД, сохраняющих данные только в основной памяти и поддерживающих все традиционные свойства транзакций за счёт репликации данных (сохранения нескольких копий всех данных в разных узлах системы). Альтернативным вариантом является использование распределённых СУБД категории NoSQL, опирающихся на использование распределённых файловых систем, позволяющих применять в одной И. с. тысячи вычислительных узлов и жертвующих во благо живучести и доступности данных поддержкой некоторых традиционных свойств транзакций.
Аналогично, горизонтально масштабируемые аналитические И. с. могут опираться на использование массивно-параллельных аналитических СУБД, сохраняющих данные во внешней памяти, эффективно разделяющих данные между узлами используемого кластера и обеспечивающих производительное параллельное выполнение аналитических запросов. Альтернативным вариантом является использование технологий типа Map/Reduce, которые позволяют разделять данные, сохраняемые в распределённой файловой системе, между тысячами узлов распределённой системы и обрабатывать их в каждом узле программами, явно создаваемыми разработчиками И. с. [циклы разделения (map) и обработки (reduce) могут повторяться].
История развития
Появление И. с. в 1950-х гг. связано с созданием компьютера общего назначения UNIVAC I (1951, США), разработанного Дж. П. Эккертом (США) и Дж. У. Мокли (США). Этот компьютер отличался от ранее доминировавших на рынке обработки бизнес-данных вычислит. машин компании «IBM» наличием устройств внешней памяти на магнитных лентах, что обеспечило его широкое применение в складских, бухгалтерских и науч. приложениях. И. с. на основе UNIVAC I были созданы в правительственных (Бюро переписи населения, вычислит. центры командования сухопутных войск и воен.-возд. сил) и коммерческих (компании «General Electric», «U. S. Steel» и др.) организациях США.
В 1960-x гг. функция И. с. была проста: диалоговая обработка запросов, хранение записей, бухгалтерский учёт и дp. электронная обработка данных (electronic data processing – EDP). Позднее, в связи c появлением концепции управленческих (менеджерских) И. с. (management information systems – MIS), была добавлена функция, позволяющая обеспечивать пользователей отчётами, необходимыми для принятия управленч. решений (information reporting systems). В 1970-x гг. стало oчeвиднo, чтo жёcткo зaдaнныe фopмы пoдгoтoвки peзyльтaтoв oтчётoв нe oтвeчaют тpeбoвaниям пользователей. Тогда появилась концепция систем поддержки принятия решений DSS. Эти системы должны были обеспечить пользователей специализир. и интерактивной поддержкой процессов принятия решений. В 1980-x гг. с повышением мощности ПК, созданием разл. пакетов прикладных программ и развитием телекоммуникац. средств связи т. н. конечные пользователи (end user computing) получили возможность самостоятельно (без посредничества специализир. информационных служб) использовать вычислительные ресурсы для решения задач, связанных с иx профессиональной деятельностью. Кpyпным дocтижeниeм стало coздaниe и пpимeнeниe cиcтeм и мeтoдoв иcкyccтв. интeллeктa (artifical intellegence – AI) в И. с. Экcпepтныe cиcтeмы (expert systems – ES) и cиcтeмы бaз знaний (knowledge-based systems) определили нoвyю poль И. с. – обеспечение пользователя кaчecтвeнными peкoмeндaциями в предметных oблacтяx. В кон. 1980-х гг. получила развитие концепция стратегич. роли И. с. (strategic information systems – SIS).
В СССР в 1950-е гг. компьютеры применялись в основном в военных целях. Под руководством А. И. Китова был создан первый в СССР отдел ЭВМ (1952) и вычислительный центр №1 МО СССР (1954); им разработана ЭВМ М100 (1958–59) – самая мощная в СССР и одна из мощных на то время в мире (100 тыс. операций в секунду), на базе которой создана одна из первых информационных систем (комплекс Даль-111 под рук. Ю. Я. Базилевского; 1955–59), предназначенная для оперативной обработки информации, поступающей с РЛС, и решения задач селекции и распределения целей, наведения на них средств ПВО путём выработки для них команд управления. В 1958 под рук. Г. В. Кисунько создана первая в мире экспериментальная система противоракетной обороны – система «А-35». В 1958–60 в Ереванском НИИ математических машин (ЕрНИИММ) спроектировали первую в СССР ЭВМ, полностью собранную на полупроводниковых приборах, – универсальную малогабаритную ЭВМ «Раздан-2» (главный конструктор Е. Л. Брусиловский), на базе которой был создан первый в СССР подвижный вычислительный центр военного назначения (1963–68) – мобильный ВЦ «Платформа».
В сер. 1960-x – 1970-х гг. на ряде предприятий СССР созданы и успешно применялись локальные автоматизир. системы управления (АСУ), прообразы совр. корпоративных И. с. Напр., в 1965–67 под рук. В. М. Глушкова разработана первая в СССР система АСУ «Львов», внедрённая на Львовском телевизионном заводе «Электрон». В кон. 1960-x – нач. 1970-х гг. также под рук. Глушкова была создана типовая система «Кунцево», внедрённая на Кунцевском радиозаводе (г. Москва). Впервые в СССР в ЕрНИИММ был спроектирован и создан информационно-вычислительный комплекс «Маршрут-1» (1971), предназначенный для автоматизации билетно-кассовых операций Московского железнодорожного узла (главный конструктор – А. Т. Кучукян).
Расширение областей применения И. с. задерживалось в связи с тем, что выпускавшиеся в СССР разнообразные ЭВМ были несовместимы на программном и аппаратном уровнях, а также недостаточно надёжны. Для решения этой проблемы в кон. 1960-х гг. руководством СССР было принято решение о замене всех отеч. разработок компьютеров ср. класса на семейство ЕС ЭВМ (Единая система ЭВМ, созданная государствами СЭВ и Кубой в 1968; первая модель ЕС-1020 сдана в эксплуатацию в 1971), основанных на архитектуре мейнфрейма (больших универсальных ЭВМ) IBM 360. Во 2-й пол. 1970-х гг. в качестве генеральной линии для мини- и микроЭВМ была утверждена архитектура СМ ЭВМ (Система малых ЭВМ), созданная на базе архитектуры PDP-11 компании «Digital Equipment».
В 1970–80-е гг. технич. базу АСУ составляли, как правило, именно модели ЕС и СМ ЭВМ. В АСУ нового поколения в единое целое интегрировались задачи автоматизир. проектирования новых изделий (САПР), технологич. подготовки производства (АСПП), автоматизации испытаний готовых изделий и автоматизации организац. управления предприятием. Комплексные АСУ были разработаны и внедрены на Ульяновском авиац. заводе, Минском тракторном заводе и др. Однако по ряду причин (прежде всего из-за недостаточной надёжности) крупномасштабное производство компьютеров серий ЕС и СМ ЭВМ не привело к массовому распространению И. с. в организациях и на предприятиях СССР.
В нач. 1990-х гг. в связи с появлением в России рынка ПК происходила массовая автоматизация предприятий за счёт использования «кустарных» автономных программных бухгалтерских систем, систем управления складами и др. К сер. 1990-х гг. на большинстве предприятий начался переход к использованию признанных в мире архитектур И. с. и программных средств их построения.
Огромное влияние на увеличение масштабов применения И. с., на их архитектуру и методы организации оказало создание и быстрое развитие технологий Интернета (см. Поиск информации в Интернете).