Подпишитесь на наши новости
Вернуться к началу с статьи up
 

ИНФОРМАЦИО́ННО-ПОИСКО́ВЫЕ СИСТЕ́МЫ

  • рубрика

    Рубрика: Химия

  • родственные статьи
  • image description

    В книжной версии

    Том 11. Москва, 2008, стр. 491

  • image description

    Скопировать библиографическую ссылку:




Авторы: О. В. Кириллова

ИНФОРМАЦИО́ННО-ПОИСКО́ВЫЕ СИС­ТЕ́МЫ (ИПС) по хи­мии, ав­то­ма­ти­зи­ро­ван­ные по­ис­ко­вые сис­те­мы, реа­ли­зо­ван­ные на сред­ст­вах элек­трон­ной вы­чис­лит. тех­ни­ки и пред­на­зна­чен­ные для сбо­ра, по­ис­ка, об­ра­бот­ки, хра­не­ния и вы­да­чи поль­зо­ва­те­лям хи­мич. ин­фор­ма­ции по за­дан­ным кри­те­ри­ям. Мно­го­об­ра­зие объ­ек­тов хи­мии и слож­ность её язы­ка при­ве­ли к вы­де­ле­нию ИПС по хи­мии в са­мо­сто­ят. класс ин­фор­мац. сис­тем. ИПС пред­став­ля­ет со­бой со­во­куп­ность ин­фор­ма­ци­он­но-по­ис­ко­во­го язы­ка (язы­ков), про­грамм­ных средств и пра­вил пе­ре­во­да тек­стов на этот язык (ин­дек­си­ро­ва­ния), обес­пе­че­ния по­ис­ка и кри­те­ри­ев со­от­вет­ст­вия. Ма­те­риа­ли­зо­ван­ное пред­став­ле­ние об ИПС вклю­ча­ет в се­бя ин­фор­мац. мас­си­вы, их но­си­те­ли (маг­нит­ные, оп­ти­че­ские и т. п.), про­грамм­ные и тех­нич. сред­ст­ва. Осн. ин­фор­мац. мас­си­ва­ми ИПС яв­ля­ют­ся ба­зы дан­ных (БД) и бан­ки дан­ных (БнД), а так­же ин­фор­мац. мас­си­вы спе­циа­ли­зир. ин­тер­нет-сис­тем. В за­ви­си­мо­сти от ха­рак­те­ра ин­фор­ма­ции, вклю­чае­мой в БД, раз­ли­ча­ют до­ку­мен­то­гра­фич., или до­ку­мен­таль­ные, ИПС (ДИПС; со­дер­жат биб­лио­гра­фич. опи­са­ния, клю­че­вые сло­ва, ре­фе­ра­ты ста­тей из жур­на­лов и сбор­ни­ков, мо­но­гра­фий, па­тен­тов, стан­дар­тов, от­чё­тов о н.-и. ра­бо­те и т. д.); фак­то­гра­фич. ИПС (ФИПС; со­дер­жат уни­фи­ци­ров. фак­то­гра­фич. дан­ные об объ­ек­тах пред­мет­ной об­лас­ти, свой­ст­вах ма­те­риа­лов и ве­ществ, струк­тур­ные фор­му­лы со­еди­не­ний, урав­не­ния хи­мич. ре­ак­ций, дан­ные фи­зи­ко-хи­мич. ис­сле­до­ва­ний, све­де­ния об об­лас­тях при­ме­не­ния, стои­мости и др.); до­ку­мен­таль­но-фак­то­гра­фич. (ин­те­г­ри­ро­ван­ные) ИПС. Боль­шин­ст­во ИПС по хи­мии пред­став­ле­ны в Ин­тер­не­те или рас­про­стра­ня­ют­ся на твёр­дых маг­нит­ных но­си­те­лях (CD-ROM, DVD и др.).

Клю­че­вой ин­фор­мац. со­став­ляю­щей в ИПС по хи­мии яв­ля­ет­ся объект – хи­мич. ве­ще­ст­во. Ин­фор­ма­ция о хи­мич. ве­ще­ст­вах мо­жет быть пред­став­ле­на в ви­де про­стых тек­сто­вых ха­рак­те­ри­стик (на­зва­ние, си­но­ни­мы, мо­ле­ку­ляр­ная фор­му­ла и др.), чи­сло­вых зна­че­ний кон­крет­ных свойств, ре­фе­ра­тов и пол­но­тек­сто­вых ста­тей, гра­фи­че­ских и/или таб­лич­ных, оп­тич., УФ-, ИК-, ЭПР-, ЯМР- и др. спек­тров или за­ви­си­мо­стей, пло­ских и трёх­мер­ных изо­бра­же­ний и т. д. Глав­ной и спе­ци­фи­че­ской яв­ля­ет­ся ин­фор­ма­ция о струк­ту­ре мо­ле­кул хи­мич. со­еди­не­ний. Осн. спо­со­бом пред­став­ле­ния струк­ту­ры мо­ле­ку­лы хи­мич. со­еди­не­ния яв­ля­ет­ся струк­тур­ная фор­му­ла. Струк­тур­ная фор­му­ла – гл. ис­точ­ник ин­фор­ма­ции о струк­ту­ре мо­ле­ку­лы кон­крет­но­го хи­мич. со­еди­не­ния и его од­но­знач­ный иден­ти­фи­ка­тор. Спо­со­бом пред­став­ле­ния хи­мич. ин­фор­ма­ции в па­мя­ти ЭВМ и вне её слу­жат фор­ма­ты дан­ных. Наи­бо­лее круп­ны­ми раз­ра­бот­чи­ка­ми фор­ма­тов дан­ных в химии счи­та­ют­ся сле­дую­щие за­ру­беж­ные ин­фор­мац. цен­тры: Chemical Abstracts Service (CAS), Molecular Design Limited (MDL), Daylight, TRIPOS. Осн. фор­ма­та­ми дан­ных яв­ляют­ся ли­ней­ные ко­ды (SLN/SMILES, SYBYL, Вис­вес­сера и др.), тек­сто­вые фай­лы ASCII (MOL, SDF, RDF и др.), фай­лы фор­ма­тов XML (CML).

По­иск (иден­ти­фи­ка­ция) хи­мич. ве­ществ в ИПС мо­жет про­из­во­дить­ся на ос­но­ве срав­не­ния разл. ха­рак­те­ри­стик и свойств: ре­ги­ст­рац. ко­дов, на­зва­ний и си­но­ни­мов, мо­ле­ку­ляр­ных дан­ных (мас­са, фор­му­ла, струк­ту­ра), биб­лио­гра­фич. дан­ных и др. Клю­че­вой яв­ля­ет­ся за­да­ча по­ис­ка хи­мич. ве­ществ по струк­тур­ной фор­му­ле. Для реа­ли­за­ции по­ис­ка струк­тур­ной хи­мич. ин­фор­ма­ции при­ме­ня­ют­ся спе­ци­аль­но раз­ра­бо­тан­ные ин­фор­ма­ци­он­но-по­ис­ко­вые язы­ки (клас­си­фи­ка­то­ры, спра­воч­ни­ки, сло­ва­ри, те­зау­ру­сы, руб­ри­ка­то­ры и т. п.) и ал­го­рит­мы об­ра­бот­ки, ре­шае­мые как стан­дарт­ны­ми сред­ст­ва­ми сис­тем управ­ле­ния БД, так и спе­циа­ли­зир. про­грамм­ны­ми при­ло­же­ния­ми. В об­щем слу­чае ал­го­рит­мы об­ра­бот­ки струк­тур­ной хи­мич. ин­фор­ма­ции ос­но­ва­ны на об­ра­бот­ке мо­ле­ку­ляр­ных гра­фов. Раз­ра­бот­ка пер­вых ал­го­рит­мов, ре­шаю­щих про­бле­му изо­мор­физ­ма гра­фа, от­но­сит­ся к 1950–60-м гг. Эти ал­го­рит­мы бы­ли ос­но­ва­ны на при­ме­не­нии по­атом­но­го со­пос­тав­ле­ния мо­ле­ку­ляр­ных гра­фов хи­мич. ве­ществ (ал­го­рит­мы Рэя и Кир­ча, Уль­ма­на). Ал­го­ритм Уль­ма­на ос­но­ван на ис­поль­зо­ва­нии ре­кур­сив­но­го ал­го­рит­ма, ме­то­ди­ки глу­бо­ко­го про­смот­ра и бу­лев­ских мат­риц, хра­ня­щих со­стоя­ние со­пос­тав­ле­ния гра­фов; ал­го­ритм Уль­ма­на адап­ти­ро­ван для по­ис­ка по фор­му­лам Мар­ку­ша. Для уве­ли­че­ния про­из­во­ди­тель­но­сти (ско­ро­сти) по­ис­ка в боль­ших ИПС ис­поль­зу­ет­ся ме­тод пред­ва­рит. фильт­ра­ции на ос­но­ве разл. де­ск­рип­то­ров мо­ле­ку­ляр­ной струк­ту­ры (то­по­ло­гич. ин­дек­сы, фи­зи­ко-хи­мич. де­ск­рип­то­ры, струк­тур­ные де­ск­рип­то­ры), пре­об­ра­зо­ва­ния струк­ту­ры в ре­ду­ци­ро­ван­ный граф по­сред­ст­вом за­ме­ще­ния оп­ре­де­лён­ных боль­ших струк­тур спец. мет­ка­ми. На за­вер­шаю­щем эта­пе до­пус­ка­ет­ся при­ме­не­ние ал­го­рит­мов по­атом­но­го со­пос­тав­ле­ния.

Струк­тур­ная ин­фор­ма­ция в совр. ИПС (БД) мо­жет быть пред­став­ле­на как в ви­де обыч­ных хи­мич. струк­тур для ин­ди­ви­ду­аль­ных со­еди­не­ний, так и в ви­де фор­мул Мар­ку­ша для обоб­щён­ных струк­тур (ха­рак­те­ри­зу­ют­ся пе­ре­мен­ны­ми мо­ле­ку­ляр­ны­ми за­мес­ти­те­ля­ми-ра­ди­ка­ла­ми, пе­ре­мен­ны­ми мес­та­ми за­ме­ще­ния и ко­личе­ст­вом групп за­ме­ще­ний, об­щи­ми и ча­ст­ны­ми на­зва­ния­ми за­мес­ти­те­лей). Пре­иму­ще­ст­вен­ное рас­про­стра­не­ние фор­му­лы Мар­ку­ша по­лу­чи­ли в па­тент­ной об­лас­ти, где их ис­поль­зо­ва­ние по­зво­ля­ет су­ще­ст­вен­но рас­ши­рить и за­щи­тить пра­ва ав­то­ров но­вых хи­мич. со­еди­не­ний. Фор­му­лы Мар­ку­ша мо­гут при­ме­нять­ся как гиб­кие клас­си­фи­ка­то­ры хи­мич. ве­ществ. Су­ще­ст­ву­ют три круп­ные об­ще­дос­туп­ные (ком­мер­че­ские) ИПС для по­ис­ка Мар­куш-струк­тур: Derwent World Patents Index (WPI), CAS MARPAT, INPI Merged Markush Service (MMS) в со­труд­ни­че­ст­ве с Derwent Information Ltd. (Markush DARC).

ИПС раз­ли­ча­ют­ся ох­ва­том (чис­лом) об­ра­ба­ты­вае­мых ис­точ­ни­ков (на­пол­не­ни­ем), струк­ту­рой дан­ных, функ­цио­наль­ны­ми и по­ис­ко­вы­ми воз­мож­но­стя­ми. Наи­бо­лее круп­ные ДИПС по хи­мии: в России – БД Хи­мия ВИНИТИ РАН (Все­рос. ин-т на­уч. и тех­нич. ин­фор­ма­ции РАН; пополнение – 120 тыс. до­ку­мен­тов/год); за рубежом – БД Chemical Abstracts (Chemical Abstracts Service, США; пополнение – 1 млн. до­ку­мен­тов/год, от­но­сит­ся к по­ли­те­ма­тич. БД), БД Index Chemicus (Thomson Scientific, США; вклю­ча­ет ок. 2,5 млн. хи­мич. струк­тур, опуб­ли­ко­ван­ных в лит-ре с 1993). Cущественная часть хи­мич. ин­фор­ма­ции вклю­че­на в по­ли­те­ма­тич. БД– Science Citation Index (SCI, Thomson Scientific, США), SCOPUS (El­sevier, Ни­дер­лан­ды), от­чё­тов о НИОКР и дис­сер­та­ций (Все­рос. на­уч.-тех­нич. ин­фор­мац. центр, Рос­сия), па­тент­ные БД (Фе­де­раль­ный ин-т пром. соб­ст­вен­но­сти, Der­went, Europatent). Осн. фак­то­гра­фич. ре­сур­сом для со­про­во­ж­де­ния хи­ми­ко-син­те­тич. ис­сле­до­ва­ний яв­ля­ет­ся ИПС Cross­Fire Beilstein, в об­лас­ти ме­тал­ло­ор­га­нич. и не­ор­га­нич. химии – CrossFire Gmelin (вклю­ча­ет лит-ру на­чи­ная с 1772). Зна­чит. часть за­ру­беж­ных БД по хи­мии пред­став­ле­на в Ин­тер­не­те в он­лай­но­вых сис­те­мах-аг­ре­га­то­рах элек­трон­ных ин­фор­мац. ре­сур­сов: STN International, DIALOG и др., а так­же на плат­фор­мах из­да­тельств (MDL, Elsevier, CAS и др.).

Наи­бо­лее круп­ные и спе­циа­ли­зир. пол­но­тек­сто­вые ИПС – кол­лек­ции по хи­мии, нау­кам о ма­те­риа­лах и др. смеж­ным об­лас­тям на ин­тер­нет-плат­фор­мах El­sevier (ScienceDirect), Wi­ley (пол­но­тек­сто­вые и фак­то­гра­фич. ИПС: e-EROS – Encyclopedia of Reagents for Organic Synthesis, e-Proxemis – Organic Reactions, Organic Syntheses, Organic-Chemical Drugs и др.). Зна­чи­тель­но чис­ло про­блем­но ори­ен­ти­ро­ван­ных и уз­ко­те­ма­тич. хи­мич. ИПС.

В Ин­тер­не­те ДИПС по­лу­ча­ют но­вое раз­ви­тие, вы­хо­дят за рам­ки БД и пре­об­ра­зу­ют­ся в ин­фор­мац. сис­те­мы с рас­ши­рен­ным спек­тром функ­цио­наль­ных воз­мож­но­стей и ус­луг. При­ме­ры но­вых ти­пов ИПС – SciFinder, ChemNet и др. Боль­шие воз­мож­но­сти по­ис­ка БД и хи­мич. ин­фор­ма­ции в це­лом пре­дос­тав­ля­ют по­ис­ко­вые ин­тер­нет-сис­те­мы Scirus, Google, MSN и др., для Рунета – Yan­dex, Rambler, Google.ru. Боль­шое ко­ли­че­ст­во хи­мич. ин­фор­ма­ции на­хо­дит­ся в Ин­тер­не­те в от­кры­том дос­ту­пе.

Зна­чит. часть ИПС име­ет пе­чат­ные ана­ло­ги в ви­де ре­фе­ра­тив­ных жур­на­лов и ин­дек­сов: ре­фе­ра­тив­ный ж. «Хи­мия» ВИНИТИ РАН, Chemical Abstracts, ChemInform (Wiley), Chemistry Citation Index (Thomson) и др.

Лит.: Влэ­дуц Г. Э., Гей­ван­дов Э. А. Ав­то­ма­ти­зи­ро­ван­ные ин­фор­ма­ци­он­ные сис­те­мы для хи­мии. М., 1974; Гордон А., Форд Р. Спут­ник хи­ми­ка. Фи­зи­ко-хи­ми­че­ские свой­ст­ва, ме­то­ди­ки, биб­лио­гра­фия. М., 1976.

Вернуться к началу