Гордукалова Галина Феофановна –
профессор кафедры документоведения и информационной аналитики, доктор педагогических наук
(Санкт-Петербургский государственный университет культуры и искусств)Истоки библиометрии связываются с количественным измерением авторского наследия мыслителей Древнего мира. Выделены ее типовые и специальные задачи, российский опыт 18 века, соотношения с наукометрией, вебометрией, алтметрикой и др. Cовременное содержание библиометрии определяется как количественное отображение изменяющихся связей между объектами в локализованном информационном поле по избранным индикаторам. Тенденции развития показаны на основе анализа журнала “Scientometrics”.
Библиометрия – количественное измерение параметров определенной части документального потока для выявления тенденций его развития или отраженного в нем знания об объекте.
Результаты исследований документального потока (ДП) полезны для издателей и библиографов; историков, исследователей и организаторов науки; инженеров по информации и аналитиков разной специализации; модераторов контента в информационных хранилищах и менеджеров по управлению знаниями.
Задачи библиометрии. Современное содержание библиометрии можно определить как количественное отображение изменяющихся связей между единицами информации об объекте в локализованном предметном и информационном поле по избранным индикаторам.
В ДП активно исследуются любые динамические характеристики; семантическая, издательская и авторская структуры потока; закономерности его развития – темпы роста годового потока, темпы старения в нем документов, закономерности рассеяния публикаций из периодических изданий, дублирования и фрагментарности документов в потоке.
Прикладное исследование позволяет выполнять следующие типовые задачи:
• оценивать темпы развития предметной области,
• выявлять ведущих специалистов, организации и страны с определенной оценкой их вклада в развитие отрасли знания, тематического направления,
• выделять зарождающиеся направления и аспекты изучения локальных объектов, а также прогнозировать отдельные параметры реального и цитируемого ДП.
Специалисты решают и более узкие прикладные задачи. Например, реконструкцию интеллектуальной истории научного коллектива, мониторинг слияний и поглощений на рынке научной периодики. Прослеживается динамика рейтингов отдельных организаций и периодических изданий, их видимость в сети и т.д.
Для изучения избирается любая тематически однородная часть мирового потока литературы, микропоток отдельных видов документов – статей, патентов, новостных или рекламных сообщений за определенный период времени, сайтов и т.д.
Выделенный микропоток документов может измеряться и анализироваться на разных уровнях:
• потокографический – изменение параметров структур реального или цитируемого потока, картографирование – отображение связей между документами или ссылками, выделенных по разным структурным признакам – тематике, вида документов, автора, времени опубликования и т. д.;
• документографический– библиографический анализ единичных документов для их идентификации, индексирования, отбора и оценки;
• текстографический – формализованный частотный анализ текстов документов, фрагментов, фактов из них с разными прикладными целями – на уровне ключевых слов и даже внетекстовой информации. Широко используется для разработки рубрикаторов и онтологий, мониторинга новостных потоков, выявления тенденций развития объекта.
Современная библиометрия строится на применении двух основных групп методов:
• библиографические методы – поиск, отбор и систематизация источников информации для точного формирования анализируемых массивов документов и ссылок;
• количественные методы – частотный анализ текстов, корреляционный, факторный, кластерный анализ, метод главных компонент и др.
Из сочетания формальных и содержательных методов формируются сложные аналитические технологии картографирования, контент-анализа, интент-анализа, информационного моделирования объектов, технологий оценки вклада ученых, организаций, журналов, стран и т.д.
Для обозначения прикладных исследований документального потока остается общепринятым термин «библиометрия» с параллельным использованием понятий наукометрия, информетрия, вебометрия и др. Чтобы разобраться в их хитросплетении, важно увидеть объект и историю его измерений.
Документальный поток как объект библиометрии. Со времен Древнего мира для обозначения множества книг использовались понятия «библиотека», «литература», позже – «книжный рынок». Интуитивное восприятие безбрежности «книжного моря» ощущается в Лаврентьевской летописи за 1037 год: книги – это «рекы, напояющие вселенную», «книгам бо есть несчетная глубина…».
Первый опыт введения понятия «книжный поток» в библиотечную лексику был предпринят Н. А. Рубакиным в обозрении «Книжный прилив и книжный отлив» (1909 г.). Благодаря длительным исследованиям сложилось представление о документальном потоке как о целостном, длительно существующем явлении:
Документальный поток (ДП)– это непрерывно развивающееся, целостное множество семантически связанных документов, являющееся уникальным средством хранения, накопления и передачи знания о внешнем мире. ДП – интеллектуальная память цивилизации, искусственно созданная система, которая приобрела в процессе развития собственные структуры (тематическую, издательскую, видовую, языковую, ценностные связи между документами и др.), собственные закономерности развития – темпы роста, старения, степень рассеяния, дублирования и др. Поток масштабен, почти неисчислим, пространственно распределен, охватывает источники информации всех времен и народов. Поэтому в основе библиометрии лежит главное правило: при любом измерении качество его результатов связано с четкими границами анализируемого потока.
Основные события в истории библиометрии. Термин «библиометрия» был введен в широкое использование английским ученым Аланом Притчардом в 1969 г. для обозначения любых количественных измерений «написанной информации»– вместо многозначного термина «статистическая библиография»[1].
Европейские специалисты связывают появление библиометрии с измерениями потока через книготорговые каталоги в Лейпциге в XVII в. Однако, первые количественные измерениямы находим в измеренииавторского наследия мыслителей Древней Греции и других центров цивилизации. Подсчитывались два основных показателя – количество книг автора и количество строк (иногда слов) в рукописях: Диоген Лаэртский сообщил, что труды Аристотеля составляют 400 книг из 445270 строк. В I веке грамматик Дадим написал 3500 работ, а Марцил – 14 книг, 150 переводных и 100 оригинальных свитков [2].
В России возможность получения нового знания на основе изучения и измерения потока литературы была предсказана уже первыми теоретиками библиографии. В.Г. Анастасевич (1811, 1820), B.C. Сопиков (1813), Г.Л.Х. Бакмейстер (1772) полагали, что изучение постоянно изменяющейся совокупности книг позволит судить о «недостатках» книжного рынка и «дальнейшем развитии науки». Первое количественное изучение потока в России было проведено членами Петербургской академии А.К. Шторхом и Ф.П. Аделунгом в 1807 г. на основе составленного ими указателя «Систематизированное обозрение литературы в России в течение пятилетия с 1801–1806 г.» (СПб, 1810). Первая часть указателя – «Российская литература» – принадлежит А. Шторху и содержит в себе роспись 1254 книг и 232 журнальных статей по разделам. Ф. Аделунгом составлена вторая часть – «Иностранная литература в России» (773 книги), которые были проанализированы статистически.
|
|
Андрей Карлович Шторх (1766–1835) – экономист, историк и библиограф, академик (1804) и вице-президент Петербургской академии наук (1830). В 1799 г. Был назначен учителем великих княжон, позднее преподавал курс политической экономии великим князьям. Первая работа по статистике («Gemдlde von St.-Petersburg», Riga, 1793) была переведена на французский, шведский и английский языки. Автор широко признанного учебника по политической экономии. |
Федор Павлович Аделунг (1768–1843) – историк, лингвист, библиограф, член-корреспондент Петербургской академии наук с 1809 г. Составил библиографические указатели санскритского языка, иностранных карт России с 1306 по 1699 гг., сводный труд «Критико-литературное обозрение путешественников по России до 1700 г. и их сочинений». |
На основе количественного анализа А. Шторх и Ф. Аделунг показали «сколько сочинений напечатано в каждом роде» – по видам изданий, жанрам произведений, языкам издания, месту печатания, авторству, названию журналов, а также с каких языков сделаны переводы. Был измерен авторский коллектив: 366 писателей 19 сословий, из которых «10 князьев, 6 графов, 3 министра». Авторы рассматривались по ученому званию, сословию (10 студентов, 1 вольный крестьянин), полу и национальности – «5 женщин, из них одна немка». Впервые было показано распределение статей по названиям журналов и даже сделана попытка рекомендаций и «претензий».
Очевидно, что авторами выдвигались масштабные аналитические задачи с желанием регулярно проводить количественный анализ потока новой литературы, полагая «усмотреть из оного состояние каждой особенной науки», «сравнить один период с другими и через сравнение это видеть прирашение или ущерб».
В странах, где уже с конца XVII в. стал осуществляться учет печатной продукции по разным признакам, накапливалась и анализировалась книготорговая статистика, строились планы международного учета печатной продукции. Проводились единичные отраслевые исследования в области химии, сравнительной анатомии, геофизике и др. Методический прорыв был осуществлен в 1934 г., когда английский документалист С. Брэдфорд дал свою формулировку закономерности рассеяния публикаций в периодических изданиях[1], историк науки Д. Прайс в 1956 г. предложил экспоненциальную модель роста потока научных публикаций, Р. Бартон и Р. Кеблер в 1960 г. нашли измеритель скорости старения публикаций. С этого времени начинается новый этап развития библиометрии, в том числе и для потока цитированной литературы.
В России теоретико-методические основы количественного изучения документального потока заложили работы В.В. Налимова, А.И. Михайлова, А.И. Черного и Р.С. Гиляревского, Л.С. Козачкова, Д.Ю. Теплова и других специалистов (см. табл. 1). К началу 1980-х гг. первопроходцы осуществили новаторские и масштабные исследования в разных отраслях знания –в области химии (В.В. Налимов, Ю.В. Грановский); металлургии (Г.В. Гедримович); физики твердого тела, конденсаторостроения, высокомолекулярных соединений, литературоведения (О.М. Зусьман, Г.Ф. Гордукалова). Анализ потока цитированной литературы осваивали С.Г. Кара-Мурза, И.В.Маршакова и другие специалисты. Сейчас весьма активно ведутся исследования в библиометрических центрах Москвы, Санкт-Петербурга, Новосибирска, Тамбова, Казани.
Таблица 1
Ключевые работы в области количественного изучения документального потока за 1969–1988 гг.
Год издания |
Библиографическое описание издания |
Основное нововведение |
1969 |
Налимов В. В., Мульченко З. М. Наукометрия. Изучение развития науки как информационного процесса. М. : Наука, 1969. 192 с. |
Впервые анализируется информационная модель науки. Введено понятие «наукометрия», рассмотрены основные закономерности развития информационных потоков, приведены результаты многоаспектного анализа потока для конкретного научного направления. |
1973 |
Воробьев Г. Г. Документ: информационный анализ. М. : «Наука», 1973. 264 с. |
Первая монография об анализе документальной информации, использовано понятие «документальный шлейф», впервые в отечественной литературе рассмотрены информационные свойства документов (Гл.2). |
1976 |
Михайлов А. И., Черный А. И., Гиляревский Р. С. Научные коммуникации и информатика. М. : Наука, 1976. 436 с. |
Впервые обобщен опыт зарубежных исследователей потока научной информации, описаны закономерности развития потока, используемые математические модели. |
1978 |
Козачков Л. С. Системы потоков научной информации. Киев : Наук. думка, 1978. 199 с. |
Впервые в тексте использован термин «документальные потоки», обобщен методический опыт количественных исследований, в том числе с использованием автоматизированной информационной системы. |
1980 |
Грановский Ю. В. Наукометрический анализ информационных потоков в химии. М. : Наука, 1980. 141 с. |
Впервые изложены результаты многоаспектного анализа потока литературы в области химии, показана возможность их содержательной интерпретации. |
1983 |
Документальные потоки по естествознанию и технике и проблемы библиографии : сб. науч. тр. / ЛГИК ; науч. ред. Г. В. Гедримович. Л., 1983. 167 с. |
Впервые понятие «документальные потоки» внесено в название книги. Приведены результаты многолетних исследований микропотоков документов разной тематики, предложена методика анализа периодических изданий, ориентированная на оценку межотраслевых связей. |
1983 |
Хайтун С. Д. Наукометрия: состояние и перспективы. М. : Наука, 1983. |
Впервые детально описан комплекс и возможности методов математической статистики для изучения закономерностей развития потоков научной информации, показана роль лингвистических методов, в том числе сленгового анализа. |
1986 |
Мотылев В. М. Старение научно-технической литературы. Л. : Наука, 1986. 160 с. |
Впервые в стране исследуется теоретические и методические проблемы изучения закономерности старения, раскрывается его сущность, механизм, формы проявления. |
1988 |
В. И. Информетрия // Итоги науки и техники. М. : ВИНИТИ, 1988. Т. 10. 190 с. |
Первый обзор количественных исследований, ориентированных на использование методов математической статистики при измерении потоков информации. Введение в обиход отечественной науки термина «информетрия». |
1988 |
Маршакова И. В. Система цитирования научной литературы как средство слежения за развитием науки. М. : Наука, 1988. 288 с. |
Впервые и фундаментально характеризуются в России возможности и индикаторы для анализа потока цитируемой литературы. Детально описан опыт подготовки и анализа указателя ссылок на научную литературу «Science Citation Index» – (SCI), выходящего в США с 1963 г. |
Соотношение терминов. Предложенное А. Притчардом в 1969 г. обозначение «библиометрия» быстро распространилось, но в этом же году вышла в свет монография В.В. Налимова, в название которой вошло понятие «наукометрия», а затем стало использовать во всем мире для обозначения метрических исследований в науковедении. Понятие «информетрия» привнесено в профессиональный словарь отечественных специалистов В.И. Горьковой, благодаря подготовленному обзору количественных исследований под названием «Информетрия» (М., 1988). В период 1960–1980 гг. многие отрасли знания обрели свой метрический раздел – эконометрия, биометрия, технометрия, социометрия.
Более тридцати лет велась научная дискуссия о соотношении понятий «библиометрия», «наукометрия», «информетрия», благодаря которой были сделаны следующие выводы:
• обобщающим является термин «библиометрия»;
• термин «наукометрия» обозначает прикладные исследования потока научной информации с учетом его специфики;
• «информетрия» понимается как теория измерения количественных (в том числе семантических) характеристик информации, но в методическом отношении, как правило, не выходит за границы библиометрических исследований.
Не оправдала себя и попытка разграничить эти термины по кругу используемых методов, закрепив за информетрией сложные методы статистической обработки данных. В содержании международного журнала “Scientometrics”, а также в российских электронных журналах “Informetrics.ru”, “Biometrica” (г.Томск) одновременно используются все три термина, что подтверждает их смысловое единство. Выбор термина остается за авторами исследования, он определяется их специальностью, уровнем подготовки к подобным работам, задачами исследования.
Возникновение в системе электронных коммуникаций родственных терминов сетеметрия, вебометрия, киберметрия в конце 1990-х гг.не осложняет ситуацию, поскольку во всех случаях применяются инструменты и методы библиометрии, но только по отношению к машиночитаемым документам.
Содержательно эти три терминапока четко не разграничиваются в использовании. В дальнейшем возможна некоторая их специализация: термин «сетеметрия» может закрепиться за любыми измерениями в сети, в том числе и для сугубо технических нужд провайдеров, работы серверов; «вебометрия» будет обозначать измерение и результаты многоаспектного анализа веб-ресурсов. «Киберметрия», а точнее – близкое ему новое понятие, сможет со временем претендовать на всесторонний, полностью автоматизированный анализ потоков машиночитаемой информации как в сети, так и в масштабных базах данных локального доступа. В любом случае библиометрическое измерение параметров электронной части документального потока будет осуществляться через выявление в нем информационных профилей и структур.
Современные направления развития библиометрии. В настоящее время в стране и за рубежом активно обсуждаются следующие проблемы развития количественных измерений потока информации:
• индикаторы и инструменты проведения вебометрических исследований;
• веб-цитирование как фактор видимости вузов;
• развитие биобиблиометрии, позволяющей акцентировать внимание на авторской структуре потока;
• новые методики оценки вклада в науку;
• сложные приемы динамического картирования реального потока по запросам;
• возможность корректного использования веб-статистики и многие другие.
Направления работы, а главное – используемые массивы и методы зарубежных исследователей выявлялись нами на основе анализа публикаций международного журнала Scientometrics за 2010-2011 гг. (Табл. 2). В трех первых томах журнала за 2014 г. авторами рассматриваются, преимущественно, разработка карт «инфраструктуры знаний», карты предвыборной компании, карт на основе одновременного использования данных наукометрии и вебометрии, сетевой анализ стержневых ссылок среди университетов и т.д.
Таблица 2
Основные направления зарубежных прикладных исследований документального потока в 2010–2011 гг.
Цель и направление исследования |
Область знания, изучаемая структура потока или закономерность. Используемые методы, статистические модели |
Сравнительный ретроспективный анализ тематических направлений |
Библиометрический анализ двух микропотоков за 30 лет. |
Дополнительная и альтернативная медицина, Китай |
|
Ретроспективный анализ базы данных |
Глубокая ретроспекция анализа потока и визуализация основных направлений исследований |
База данных Medline, 1965-2005 |
|
Сравнительный ретроспективный анализ тематических направлений |
Библиометрический анализ микропотока 1970-е-2010 гг. на примере семи видов рыб |
Измерение семантической целостности научных областях |
Семантическая структура научной литературы |
Библиометрические, классификационные методы |
|
Выявление точек роста и распространения знаний |
Географическая, языковая, организационно-фирменная структуры |
Эволюция создания и распространения знаний, Тайвань |
|
Анализ новых фронтов исследований |
Тематическая структура |
Проявление новых тенденций в развитии знаний |
|
Исследование тематических профилей |
Тематическая структура микропотоков |
Инновационная тематика в сравнении со стабилизированной |
|
Отслеживание исследований и разработок |
Организационно-фирменная структура |
Библиометрический анализ патентов на лекарства в «Orаnge Book» |
|
Изучение корпоративного роста |
Анализ потока патентов, построение семантических сетей патентов, Китай |
Построение карты совместного производства знания |
Организационно-фирменная структура потока совместных патентов, Китай |
Изучение порядка авторства |
Авторская структура |
Соавторство в научных публикациях |
|
Анализ авторского научного наследия |
Авторский микропоток публикаций |
«Библиометрическое путешествие» |
|
Исследование публикационной активности авторов |
Закономерность связи двух индикаторов: чем выше звание и должность авторов, тем выше их продуктивность |
Анализа динамики научно-исследовательского сотрудничества |
Организационно-фирменная структура, ее изменения для африканских региональных инновационных систем |
Оценка публикационной активности стран |
Географическая структура |
Научные публикации стран Балтии |
|
Библиографические исследования изданий на иврите |
Языковая структура – микропоток документов на одном языке |
Библиометрический анализ |
|
Оценка продуктивности научно-технических программ |
Документальный шлейф публикаций и ссылок по программам Евросоюза |
Оценка качества научных исследований |
Индексы цитирования |
Анализ тенденций развития тематического направления |
Основные публикации об исследованиях графена |
Библиометрический анализ |
|
Оценка развития базы данных научных исследований за 10 лет |
Анализ количественных параметров базы данных по библиометрическим индикаторам |
Сравнительный анализ динамики роста диссертаций |
Динамика роста диссертаций в потоке |
Восемь областей исследования |
|
Пересмотр закономерности старения |
Закономерность старения |
Измерение научного влияния на ссылки |
Моделирование процесса распространения ссылок для оценки ее жизненного цикла с прогнозом |
Механизм и факторы цитирования |
|
Сравнение рейтингов университетов на основе ссылок |
Влияние национального языка на рейтинговые оценки |
Изучение научного сообщества |
Географическая структура потока цитированной литературы (ПЦЛ), Бразилия |
Индикаторы распознавания и оценки |
|
Измерение региональных научных сетей |
Сравнение международных и китайских библиографических источников данных |
Оценка результатов исследований ученого |
Анализ ссылок и характера цитирования |
Выявление основных документов по теме |
Семантическая структура в потоке цитированной литературы. Кластеризация ссылок |
Выявление динамики ссылок на работы женщин-ученых |
Авторская структуры ПЦЛ |
Анализ структуры интеллектуальной организации науки |
Организационно-фирменная структура ПЦЛ |
Конфигурация знаний между структурными компонентами в сетях науки |
|
Эффективность ссылок |
Измерение экономических журналов |
H-индекс |
H-индекс одной публикации и косвенный H-индекс исследователя |
Поиск связей между индикаторами |
Закон Брэдфорда в ПЦЛ, продуктивность и импакт-факторы научных журналов |
Поиск связей между индикаторами |
Тип статьи, название, их влияние на количество загрузок и ссылок |
Поиск связей между индикаторами |
Корреляция между библиометрическими показателями и экспертной оценкой |
Поиск связей между индикаторами |
Динамика патентования и анализ ссылок Компании из списка Fortune 500 |
Проблемы естественного отбора научных работ |
Факторы цитирования, открытая экспертная оценка и динамика потока научных статей |
Исследование имен хостов в URL ссылки |
Степенное распределение |
Анализ сети ссылок |
Ссылки из взаимосвязанных журналов, их связи с другими дисциплинами |
Оценка формирования сети знаний |
Онтология |
Модель векторного пространства |
|
Атлас науки |
Средства визуализации, уровень восприятия |
*) На материале международных журналов Scientometrics и Journal of Informetrics (Нидерланды) за 2010–2011 гг. Не включались близкие по методике исследования микропотоков разных тематических областей – нанотехнологий, водных ресурсов, проблемы стволовыхклеток и др.
Отмечаются и другие факторы развития библиометрии– спрос на количественные исследования новостных потоков в сфере бизнеса, вебометрические измерения в социальных науках, разработка новых программных комплексов для семантической обработки текстов, попытки найти новые средства визуализации знания в инфографике [3–5].
О перспективах дальнейшей дифференциации библиометрии свидетельствует обсуждение предложенного в 2010 г. нового термина «альтметрика», обозначающего направление, альтернативное классическому индексу цитирования и импакт-фактора журналов. Оно ориентировано на комплексную оценку публикаций до их выхода в свет, предполагает обобщение показателей разного рода, включая формализованный анализ текстов рецензий и отзывов в форумах. В условиях создания масштабных полнотекстовых баз данных и электронных библиотек библиометрия на всех уровнях анализа документального потока становится необходимым инструментом. Решение глобальной проблемы семантического поиска приведет к существенным переменам в технологии прикладных библиометрических исследований.
[1] Модель Брэдфорда–Ципфа–Лотке используют сейчас для описания распределений объектов практически всех открытых систем, она применяется для построения карт науки, в алгоритмах поисковых систем при индексировании интернет-ресурсов.
Tel : +7 495 648 6241
Fax : +7 495 648 6241
E-mail : info@idbg.ru
Address : 101000, Москва. ул. Мясницкая, д. 13, стр. 2
Сейчас у нас проходит акция - издание научной монографии стоит всего 15 т.р.
Подробнее