К вопросу цитирования в Web of science и SCOPUS статей из российских журналов, имеющих переводные версии

Аксентьева М.С., Кириллова О.В., Москалева О.В.
On Paper Citation by Web of Science and Scopus From Translated Russian Journals - View in English
Статья в журнале
Об авторах:

Аксентьева М.С.1, Кириллова О.В.2, Москалева О.В.3
1 журнал "Успехи физических наук"
2 Учебно-консультационный центр НП НЭИКОН
3 Санкт-Петербургский государственный университет

 Скачать PDF

Аннотация:

Детально проанализированы особенности представления и цитирования статей из российских научных журналов, которые переводятся на английский язык и индексируются в библиографических базах данных Web of Science и Scopus.
Показано изменение во времени (с 1960-х по 2013 гг.) политики учета цитирований российских публикаций в базе данных Web of Science. Рассмотрены аналогичные особенности базы данных Scopus. Выявлены значительные потери в учете реального цитирования статей из российских журналов, не позволяющие использовать данные, получаемые непосредственно в системах анализа цитирования этих БД, для 
оценки результатов научного труда как отдельных авторов, так и научных коллективов и российской науки в целом.
Только при помощи сложных специальных поисков по дополнительным опциям этих баз данных и после существенных пересчетов всех полученных данных можно достичь корректных показателей цитируемости публикаций из российских журналов. Решение задачи корректного учета ссылок на статьи из переводных российских журналов возможно на основе использования DOI, и такой подход уже успешно продемонстрирован в базе Math Net.

Ключевые слова:

Web of Science, SCOPUS, глобальные индексы цитирования, библиометрический анализ, российские публикации, переводные российские журналы
Цитировать публикацию:
Аксентьева М.С., Кириллова О.В., Москалева О.В. К вопросу цитирования в Web of science и SCOPUS статей из российских журналов, имеющих переводные версии // Научная периодика: проблемы и решения. – С. 4-18. – doi: 10.18334/np3496

Aksentyeva, M.S., Kirillova, O.V., & Moskaleva, O.V. On Paper Citation by Web of Science and Scopus From Translated Russian Journals. Scholarly Communication Review , 4-18. doi: 10.18334/np3496 (in Russian)

Приглашаем к сотрудничеству авторов научных статей

Публикация научных статей по экономике в журналах РИНЦ, ВАК (высокий импакт-фактор). Срок публикации - от 1 месяца.

creativeconomy.ru Москва + 7 495 648 6241




* Работа М.С. Аксентьевой поддержана грантом РФФИ 13-07-00672 А».

ВВЕДЕНИЕ

При рассмотрении проблем, связанных с представлением результатов научных исследований РФ для мировой научной общественности, постоянно встает вопрос о занижении сведений о публикациях российских ученых и их цитируемости в международных базах цитирования Web of Science (WoS) и Scopus. На проблему учета цитирований российских авторов в WoS и Scopus можно было бы не обращать внимания, если бы эти показатели не возводились в высокую степень важности и не влияли на оценку деятельности наших ученых. Все чаще эти показатели являются определяющими как для материальной поддержки, так и для карьерного роста наших ученых (за рубежом, правда, такая же ситуация). Также эти показатели начинают играть определенную роль и в жизни самих журналов, входящих в индексы цитирования. Рассмотрим подробнее эти вопросы.

1. ОСОБЕННОСТИ ПРЕДСТАВЛЕНИЯ ПУБЛИКАЦИЙ ИЗ РОССИЙСКИХ ЖУРНАЛОВ В WEB OF SCIENCE

Немного истории. Web of Science (WoS) – библиографическая база данных, созданная основателем индекса научного цитирования (Science Citation Index, SCI) Юджином Гарфилдом (Eugene Garfield) в 1950-х – начале 1960-х годов, который впоследствии долгие годы (1960–1992) возглавлял Институт научной информации в США (и сейчас еще на сайте http://www.garfield.library.upenn.edu/ указано, что E. Garfield – Founder & Chairman Emeritus Institute for Scientific Information – now Thomson Reuters SCIENTIFIC).

В 1979 г. итоги почти двадцатилетнего использования SCI были проанализированы Гарфилдом в монографии [1]. В этой монографии, в частности, были представлены данные по 50-ти из 188 наиболее цитируемых журналов по физике (см. [1, c. 188]). В число этих 50-ти высокорейтинговых, как сейчас говорят, журналов по физике входили 10 (20%) русскоязычных журналов , издаваемых в СССР и переводившихся на английский язык Американским институтом физики (American Institute of Physics, AIP) (см. рис 1).

Рис. 1. Таблица из монографии [1], с. 188

Эти 50 журналов были ранжированы по общему числу ссылок, полученных данным журналом (всего в 1974 г. в SCI были проиндексированы 2443 журнала [1, c. 153]), а также были вычислены импакт-факторы (IF) этих журналов за 1974 г. (в последней колонке таблицы), впервые введенные также Гарфилдом, издавшим в 1975 г. первый Journal Citation Report (JRC) [2]. В предисловии к [2] были даны подробные определения, в частности: IF (например, 1974 г.) для журнала А – это отношение числа ссылок к статьям, опубликованным в 1973 г. и 1972 г. в журнале А, из всех журналов, опубликованных в 1974 г. и индексируемых в SCI. В частности, было отмечено, что ссылки на журналы, имеющие переводные версии, суммируются при подсчете IF, что отмечается в таблицах знаком «плюс» («+») рядом с сокращенным названием журнала в таблицах, где представлены IF журналов.

Данные, получившиеся по советским физическим журналам в 1974 г., несколько удивили даже Гарфилда, который так и написал: “An interesting feature of both lists is that Soviet physics journals ranked high on them” [1, c. 190]. В главе 9 из [1], посвященной физике, было две таблицы, только одна из которых представлена на рис. 1. Если пересортировать эту таблицу по значениям IF, то действительно обнаруживается, что в первую десятку входили два (те же 20% «top10-list») советских журнала: «Успехи физических наук» (УФН) (английская версия “Sov. Phys. Usp.”) и «Журнал экспериментальной и теоретической физики» (ЖЭТФ) (английская версия “Sov. Phys. JETP”), которые занимали в рейтинге 1974 г. по импакт-фактору 4-е и 6-е места в категории «физика» соответственно.

Это, правда, было неожиданностью лишь для Гарфилда, так как физики США уже давно определили ценность публикаций по физике в журналах, издаваемых в СССР. Именно они приложили массу усилий для организации программы переводов российских журналов на английский язык в AIP (см. [3]). Первыми на английский язык AIP начал переводить как раз ЖЭТФ и УФН в 1958 г., причем в каждом переводном номере в содержании указывались как выходные данные оригинальной (русскоязычной версии) каждой статьи, так и данные переводной версии той же статьи (см. рис. 2).

Рис. 2. Фрагмент содержания октябрьского номера журнала “Soviet Physics – Uspekhi” за 1987 г.

На рис. 2 приведены данные как переводной английской версии (Sov. Phys. Usp., Vol. 30, No. 10, October 1987 и номера страниц у каждой статьи слева), так и оригинальной русскоязычной версии (Uspekhi Fizicheskikh Nauk, Vol. 153, No. 2, October 1987 и номера страниц по русскому оригиналу также приведены, но в скобках).

Такое оформление позволяло авторам, редакторам, библиографам и др. поставить во взаимно-однозначное соответствие русскую оригинальную статью и ее переводную версию. Ссылки на обе версии учитывались в SCI и в JCR. Начиная с 1993 г. в конце каждого тома (года) печатались дополнительно еще и специальные таблицы соответствия страниц русской и английской версий для удобства переводчиков и библиографов.

В переводных версиях, согласно традиционным библиографическим стандартам AIP [4], в ссылках на советские переводные журналы цитировались под одним номером сначала оригинальная статья на русском языке, а уже потом в квадратных скобках ее переводная версия (см. [4, c. ix], а также рис. 3).

Рис. 3. Фрагмент страницы из руководства для переводчиков AIP [4] c указанием обязательного полного цитирования под одним номером как оригинальной, так и переводной версии статьи из переводных журналов

Естественно, что такая ссылка в библиометрических подсчетах учитывалась только один раз, но при подсчете IF, если встречались ссылки либо на русское, либо на английское издание одной и той же статьи в различных статьях, то они суммировались, что отмечалось знаком «+» при названии журнала (см. рис. 4, на котором переводные советские журналы отмечены знаком «+», что означает суммирование ссылок и на русскую, и на английскую версии одной и той же статьи из этих журналов).

Рис. 4. Журналы по физике, имеющие импакт-фактор больше единицы, за 1990 год

Если сравнить данные по IF на рис. 1 и рис. 4, то хорошо видно, что к 1990-му году показатели IF даже ведущих советских журналов по физике существенно упали по сравнению с 1974 г. Можно предположить, что причиной такого падения могли быть как снижение к началу 90-х гг. количества и уровня научных исследований в СССР, так и уменьшение интереса к советской науке в мире, ибо сейчас уже не секрет, что отечественная физическая наука интересовала зарубежных исследователей в значительной мере в связи с ее возможными военными приложениями.

Учет в WoS ссылок на публикации из русскоязычных журналов, имеющих переводную версию, в настоящее время. Как же сейчас представлены российские журналы в WoS? Всего на настоящий момент (август 2013 г.) в WoS индексируются 150 российских журналов, имеющих импакт-фактор, из которых только 27 журналов (18%) не отмечены знаком «+», то есть, не являются журналами, имеющими оригинальную и переводную версии. Это означает, что 82% российских журналов, индексируемых в WoS, являются переводными.

Посмотрим, какие особенности имеются в настоящий момент при рассмотрении публикаций одного росссийского автора, долгое время успешно работающего в области физики и публикующегося как в российских переводных, так и в зарубежных журналах, индексируемых в WoS. Следует отметить, что посмотреть в WoS данные о публикациях, вышедших до 1980 г., и их цитируемости, очень сложно, так как очень мало организаций, которые имеют доступ к этой базе данных раньше 1980 г. в России.

Может показаться, что это не так уж и существенно для современного состояния науки, однако такое ограничение доступа может привести к пропуску важных новых направлений, возникших на базе старых работ, получивших признание лишь в последнее время. Примером такой ситуации может служить статья В.Г. Веселаго, опубликованная в 1967 г. в русской версии и в 1968 г. в английской версии журнала УФН, цитирование которой «взрывным» образом началось после 2000 г. На настоящий момент только WoS учтено уже более 5000 ссылок на эту статью, разумеется, если смотреть базу WoS полной «глубины» (пояснения про «глубину» базы см. в [5]).

Статьи 1950–1970 гг. из переводных российских журналов представлены сейчас в базе WoS и английской, и оригинальной русскоязычной версиями, и подсчет ссылок по ним продолжает проводиться, правда, по каждой версии отдельно (см. рис. 6).

Рис. 6. Фрагмент поиска (выполненного 20.03.2013) по полной версии WoS в Институте Макса Планка (Германия) статей Келдыша Л.В.

На рис. 6 видно, что под номерами 7 и 9 в этом списке фигурирует одна и та же статья, опубликованная в английской и русской версиях журнала ЖЭТФ за 1958 год, причем число ссылок (299) на русскую версию почти в точности равно числу ссылок (297) на английскую версию этой статьи. Большинство ссылок были сделаны за последние 10–15 лет. Кроме того, обращает на себя внимание особенность написания фамилии Keldysh в записи в WoS русской версии из ЖЭТФ. Загадочные буквы «marc» в середине фамилии отражают ошибочное машинное распознавание принятых ранее правил транслитерации кириллицы, обозначавших, например букву «Ы» латинской «Y» с неким значком «ý» сверху. Понятно, что все эти 600 ссылок не будут учтены при поиске в WoS с «глубиной» до 1980 г. (см. также рис. 7). Кроме того, поиск по фамилии Keldysh не покажет все публикации со значком «ý» в фамилии.

Авторы [5, 6] утверждают, что получить все ссылки на данного автора (даже имея доступ к WoS «редуцированной глубины») можно, изпользуя опцию “Cited Reference Search” (CRS) (см. рис. 7).

Рис. 7. Фрагмент поиска “Cited Reference Search” по фамилии «Keld*sh» (для включения всех вариантов написания транслитерации буквы «ы» в фамилии используется «*»)

Во фрагменте на рис. 7 показано число ссылок на статью Л.В. Келдыша, опубликованную в ЖЭТФ в 1964 г. (848 ссылок) и переведенную на английский язык в 1965 г. (1644 ссылки). Поиск проведен 20.03.2013.

Однако в большинстве случаев все оценки библиометрических показателей основываются на прямых данных из WoS без использования опции CRS (исключением являются данные, представленные на сайте проекта «Корпус экспертов» http://expertcorps.ru/, рассчитываемые как раз с учетом опции CRS). Таким образом, для большинства исследователей более 3000 ссылок только по этим двум статьям Л.В. Келдыша будут «потеряны» при использовании базы WoS «редуцированной глубины» до 1980 г.

Как же представлены публикации из переводных российских журналов в WoS после 1980 г.? При «ближайшем рассмотрении» обнаруживается, что в 1980–1990 гг. в WoS явно представлена только русская версия переводных журналов, а после 2001 г. наоборот – только их английская версия. На рис. 8 видно, что наиболее цитируемая статья Малыгина опубликована в УФН в 1999 г. и имеет (по этим данным) 48 ссылок на 30.08.2013.

Поиск того же автора Malygin G. по “Cited Reference Search” (рис. 9) показывает, что эта же статья Малыгина Г.А. получила еще 46 цитирований в английской версии, таким образом, полное число цитирований этой статьи вдвое больше того, что показывает «прямой» отчет из WoS (рис. 8).

Рис. 8. “Citation report” по автору Malygin G.

Рис. 9. Фрагмент поиска по “Cited Reference Search” автора Malygin G., статья из УФН 1999 г.

В разобранном примере в отчете “Citation report” (рис. 8) «потеряно» столько же ссылок, сколько и учтено, а бывают и гораздо более «печальные» для авторов ситуации, когда число «потерянных» (неучтенных) в WoS ссылок вдвое больше числа учтенных (см. рис. 10 и пример в [7] по статье Цытовича В.Н., опубликованной в УФН в 1997 г.)

На рис. 10 учтено в WoS только 14 ссылок на русское издание, а ровно вдвое больше ссылок (28) на английское издание не учтено.

В том же 2001 г. учет публикаций из русскоязычных переводных журналов вновь меняется (причем не сразу, а в течение 2001 г.): теперь учитываются, наоборот, только ссылки на англоязычные версии статей из переводных журналов (см. пример на рис. 10) .

Рис. 10. Фрагмент поиска по “Cited Reference Search” автора Malygin G., статья из УФН 2001 г. (февральский номер УФН)

Рис. 11. Пример поиска статьи по автору Zybin K. за 2001 г. из УФН (ноябрьский номер)

Найдены ссылки и на русское, и на английское издания этой статьи. В WoS учтены ссылки только на английское издание статьи (в данном примере 20 ссылок «потеряны»)

В примерах, приведенных на рис. 10 и рис. 11, обращает на себя внимание наличие идентификатора (“Identifier”) и для русской, и для английской версий статьи из журнала УФН. Это так называемый “Digital Object Identifier” (DOI) – уникальный номер электронного документа, присваиваемый международной системой CrossRef. Наличие DOI у русской и английской версий позволяет их поставить во взамно-однозначное соответствие и осуществлять суммарный подсчет ссылок по обеим версиям. Такой файл (таблица соответствия) имеется для всех статей журнала УФН на русском и английском языках, что позволяет корректно собирать суммарное число ссылок на данную статью, как на ее русскую, так и на ее английскую версии. Такой подсчет проводится автоматически на сайте УФН (www.ufn.ru), а наиболее точно, скрупулезно и профессионально сбор ссылок проводится в базе MathNet, созданной и поддерживаемой коллективом специалистов из Математического института им. В.А. Стеклова РАН (МИАН) [8, 9].

Опыт работы базы MathNet и сайта УФН показывает, что наличие DOI в двух версиях одной и той же статьи технически позволяет осуществить корректный подсчет ссылок на оба варианта статьи. Поэтому наличие идентификатора DOI к обеим версиям журнала УФН в WoS (рис. 10 и 11) технически позволяет осуществить подобный совместный подсчет ссылок в WoS на оба варианта статьи, опубликованной в российском переводном журнале.

Пока же данные, получаемые из WoS, содержат систематическую ошибку, существенно занижающую общее количество цитат на статьи российских авторов, опубликованные в переводных журналах. Поэтому все библиометрические показатели, полученные на основе WoS, в значительной степени «недооценивают» российскую науку.

Причем «недооценка» является не только «количественной», но, иногда, и «качественной». Так, например, статья из декабрьского номера УФН за 2008 год М.В. Садовского, «Высокотемпературная сверхпроводимость в слоистых соединениях на основе железа» (УФН, т. 178, номер 12, стр. 1243 (2008)) была практически немедленно процитирована в Nature Physics в начале 2009 г. (Pickett W.E., “Ironbased superconductors: Timing is crucial”, Nat. Phys., vol. 5, issue 2, pp. 87 (2009)). Однако ссылка была сделана на русское издание журнала, которое сейчас не учитывается в WoS, поэтому такая важная ссылка не попала в «авторский профиль», снижая ценность этой статьи в глазах пользователей WoS.

2. ОСОБЕННОСТИ УЧЕТА В SCOPUS ЦИТИРОВАНИЯ АВТОРОВ ИЗ РОССИЙСКИХ ЖУРНАЛОВ, ИМЕЮЩИХ ПЕРЕВОДНУЮ ВЕРСИЮ

В 1996–2004 гг. в Scopus параллельно отражались русскоязычная и англоязычная версии около 50-ти журналов РАН. В 2005 г. Отражение русскоязычного варианта журналов при наличии их переводной версии было прекращено. В настоящее время осталось только 11 журналов, которые имеют две версии в Scopus. Сохранились они только потому, что русскоязычный вариант поступает из БД Medline, записи из которой в Scopus включаются в полном объеме.

Казалось бы, наличие двух версий должно существенно улучшить библиометрические показатели в системе не только журналов по сумме цитирований, но и самих авторов. Потенциально, если брать статью за одну единицу (т.е. если бы статья была представлена в системе один раз, независимо от версий журнала), автор, безусловно, получил бы значительно более высокие показатели. Однако статьи из двух версий учитываются, как мы понимаем, дважды, поэтому все библиометрические показатели автора существенно искажаются и затрудняют получение корректных данных. Система дает полностью искаженную картину показателей автора:

– по числу публикаций, когда каждая статья, представленная в двух версиях, считается дважды, т.е. показатели по числу публикаций искусственно завышаются;

– по показателю средней цитируемости одной статьи, рассчитываемой как число ссылок на число статей, когда увеличенный знаменатель, соответственно, уменьшает результат;

– по индексу Хирша, для которого также одна статья из двух версий считается как две разных статьи, и, соответственно, отдельный подсчет их цитируемости занижает этот показатель.

Рассмотрим это на одном очень характерном примере: автор Mikhailov, Yu.N., публиковавший статьи в «Журнале неорганической химии», «Координационная химия» (Russian Journal of Coordination Chemistry (RJCC) и Koordinatsionnya Khimiya (KK)) как раз в те годы, когда в Scopus находились обе версии этих журналов. Глядя на цифру, показывающую число статей в профиле автора, видим 181 (рис. 12).

Рис. 12. Страница персонального профиля автора Михайлова Ю.Н. в Scopus c библио-метрическими показателями

В этом профиле автор имеет 181 статью и 567 ссылок на эти статьи в 379 документах, а также индекс Хирша – 10 (т.е., хотя бы 10 статей цитировались 10 раз, остальные – меньше). Подсчитываем среднюю цитируемость статьи, которая равна 3,13.

Однако обнаруживаем, что этот автор имеет также другие профили в связи с тем, что в части его статей фамилия автора представлена в другом варианте, и процедура объединения его публикаций под один профиль (ID) в настоящее время не проведена. Причем анализ статей соавтора Митьковской Е.В. позволил выявить, что одна и та же статья Ю.Н. Михайлова, опубликованная в «Журнале неорганической химии» в русскоязычном варианте и в переводной версии, представлена разными вариантами фамилии на латинице (рис. 13) и попала в разные профили.

Рис. 13. Варианты представления фамилии автора одной статьи в русскоязычной версии и в англоязычной версии журнала

Поэтому для получения корректных данных для автора с таким «многовариантным» представлением фамилии наиболее приемлемым является получение показателей автора либо путем объединения в один поиск всех профилей, а также не привязанных к профилям единичных документов, либо путем проведения поиска на все варианты фамилии автора через функции “Advanced Search”. Для фиксирования этих данных в системе необходимо автору или информационным специалистам, занимающимся специально этим вопросом, провести «слияние» (“merge”) всех данных о статьях автора под один ID. В таком случае библиометрические данные будут формироваться более корректно и в одном месте. Мы пошли через выявление всех профилей автора, в результате получили 5 вариантов профилей и одну статью, не влитую ни в один профиль. Для охвата всех вариантов фамилии мы использовали усеченную форму фамилии и инициалов – Mikha* Y*. N. и провели поиск в опции “Author Search” (рис. 14).

Рис. 14. Перечень профилей авторов в опции Author Search

После выбора всех вариантов записей в перечне профилей переходим на просмотр документов автора (“Show Documents”) и получаем 235 статей. Через опцию “View citation overview” получаем библиометрические показатели автора: 235 статей цитируются 687 раз, индекс Хирша – 10. Средняя цитируемость на статью (без учета % цитируемых статей) – 2,92. Правда, автор имеет высокий показатель самоцитируемости, после исключения которого показатель цитирования снизился до 278 ссылок (40,4%), индекс Хирша – 7.

Из всей подборки автора выбираем публикации за 1996–2004 гг., когда в системе были две версии журналов, и получаем 180 документов (76,6% всех статей автора). Число публикаций за эти годы разительно отличается от показателей как предыдущих, так и последующих лет. Индекс Хирша 10 сформирован статьями этого периода, а общее число ссылок на статьи автора за эти годы составляет 647, т.е., 94% цитирования приходятся на период, когда были представлены 2 версии статей. Тем более, что анализ публикаций подборки показал, что кроме двух указанных журналов, статьи автора опубликованы также в других журналах, которые представлены двумя версиями в эти годы (рис. 15).

Рис. 15. Статьи одного автора Михайлова Ю.Н. в двух версиях журналов за 1996–2004 гг. в Scopus

Сортировка полученной выборки по убыванию числа ссылок сразу показала статью, которая была процитирована и на русскоязычную, и на англоязычную версии журнала, что в сумме дало 171 ссылку, тогда как в системе анализа наиболее высокий показатель по самой цитируемой статье у автора – 144 (рис. 16).

Рис. 16. Дублирующиеся статьи из журналов, имевших две версии в Scopus в 1996–2004 гг.

Представленные данные трудно поддаются точному подсчету, но на их основании можно попытаться спрогнозировать, насколько изменились бы библиометрические показатели автора, если бы каждая его статья из этих журналов была учтена не дважды, а один раз, а цитирование было учтено по всем версиям журнала.

В подборке за 1996–2004 гг. этого автора, состоящей из 180 статей, содержатся 138 цитируемых публикаций от 144 до 1 ссылки на публикацию, в сумме дающих 647 цитирований. То есть, средняя цитируемость статей всей подборки составляет 3,59 ссылки на статью, а цитируемых статей, соответственно, – 4,68. Если учесть, что в данной подборке фактически оригинальных статей в 2 раза меньше, то для подсчета средней цитируемости было бы корректнее цифру 647 делить не на 180, а примерно на 95–100 статей. Таким образом, средний показатель цитируемости статей автора возрос бы почти вдвое. В то же время, чтобы увеличился хотя бы на одну единицу имеющийся у автора индекс Хирша (10), надо, чтобы хотя бы 11 статей имели 11 цитирований. Возможно, что суммируя ссылки на каждую версию одной статьи, в результате этот показатель и возрос бы, но подсчет вручную является достаточно трудоемким и неблагодарным процессом в подборке из 138 цитируемых статей, поэтому в этом случае мы это не делаем.

Это еще раз говорит о том, что в индексах цитирования, с одной стороны, необходимо, чтобы присутствовала только одна версия статьи, но необходим учет всех вариантов цитирования этой статьи независимо от того, в какой версии она напечатана.

3. СРАВНЕНИЕ ПРЕДСТАВЛЕНИЯ ПУБЛИКАЦИЙ ИЗ РОССИЙСКИХ ЖУРНАЛОВ В WEB OF SCIENCE и SCOPUS

Рассмотрим одну и ту же статью российского автора, опубликованную в период, когда в базе Scopus учитывались и русская, и английская версии переводных росссийских журналов и сравним с данными, которые по этой же статье получены из WoS.

В [7] был приведен пример учета цитирования в WoS статьи Цытовича В.Н., опубликованной в журнале «Успехи физических наук» в 1997 году. Если коротко описать этот пример, получается, что в WoS при поиске «в лоб» на эту статью мы получаем (на 16.01.2013) 107 ссылок (на русскую версию этой статьи, которая только и учитывается в WoS до 2001 года). Если же мы проведем поиск по «скрытым ссылкам» (Cited References Search, CRS), то получим еще точных 185 ссылок на эту же статью, но на ее английскую версию. Таким образом, казалось бы, что всего ссылок в базе WoS на эту статью должно быть 292. Но это не совсем так. Дело в том, что в некоторых цитирующих статьях могут быть приведены ссылки и на русское, и на английское издание статьи (то есть, одна цитируемая статья может быть учтена дважды). Завершение поиска CRS в WoS по этим двум строкам дает 287 ссылок (что совершенно справедливо, так как в базе WoS каждая цитируемая статья учтена один раз, даже если на нее даны и русская, и английская ссылки). Однако при прямом поиске в WoS наиболее цитируемых статьей Цытовича мы видим, что учтены только ссылки на русскую версию этой статьи (всего 107 ссылок). Соответственно, и для самого Цытовича (как ученого), и для Института общей физики РАН, в котором работает В.Н. Цытович, и для Московского физико-технического института (МФТИ), в котором более 40 лет преподает Цытович, эти 180 ссылок на эту одну статью «потеряны» в WoS и не учитываются при библиометрическом анализе (например, в таких продуктах Thomson-Reuter, как Essential Science Indicators, а также в различных рейтингах вузов, сделанных на основе данных, представляемых WoS).

Как же обстоят дела с учетом ссылок на статьи этого автора и на эту конкретную статью в Scopus? Сначала продемонстрируем «потери» автора в целом. При поиске по фамилии автора получаем 274 публикации Цытовича В.Н., ссылок – 2742, h-index – 27. Если посредством опции “Secondary documents” мы перейдем к так называемым «скрытым» или «непривязанным» к публикациям ссылкам, то получим еще 829 публикаций автора, которые были процитированы (и не один раз) в Scopus, из них 306 публикаций относились к 1996–2004 гг., когда в системе индексировались обе версии.

Здесь необходимо отметить, что опция “Secondary documents” («Вторичные документы»), в идеале, предназначена для того, чтобы просматривать ссылки на публикации, которых нет в системе. Однако, чаще она помогает выявлять ссылки на статьи, которые в системе присутствуют, но только по какой-то причине (чаще по причине ошибок в ссылках) связка между статьей и ссылкой не установлена. И таких ошибок – миллионы. И авторы, журналы, организации, где работают авторы, в большом объеме теряют эти показатели. На рис. 17 показано число «вторичных документов» – «не привязанных» к публикациям ссылок и годы «не привязанных» публикаций В.Н. Цытовича, в т.ч. и те годы, когда сами публикации в системе были, только по какой-то причине их цитирование не было учтено в системе (понятно, что ссылки на публикации 1970–80-х гг. не могли быть учтены, т.к. самих публикаций в системе нет).

Рис. 17. Скриншот результата поиска «вторичных документов» (ссылок на публикации

Проверяемая в данном случае статья В.Н. Цытовича, опубликованная в УФН в 1997 г., имеет в Scopus две записи. На англоязычную версию имеется 177 ссылок, на русскоязычную – 3 ссылки. Причем авторы обнаружили, что в описании русскоязычной статьи были приведены неточные выходные данные, которые в ошибочном варианте также были даны в цитирующих ее документах (видимо, источником ссылок была как раз такая запись).

Выбираем обе статьи из подборки автора и по опции “Secondary documents” переходим к просмотру «не привязанных» ссылок. Мы видим, что на вариант русскоязычной статьи ссылаются еще 135 публикаций (рис. 18). (В этом случае ситуация поправима – можно обратиться в Scopus c просьбой исправить ошибку, для этого на сайте Scopus есть страница с формой для предложения корректировки данных: Missing Content Request Form http://info.sciencedirect.com/scopus/missing_content_request_form). Пропущенных ссылок на англоязычную версию обнаружить не удалось, т.е. цитирование этой версии статьи учтено полностью.

Рис. 18. Страница «вторичных документов» – не учтенных ссылок на статью В.Н. Цытовича из русскоязычной версии журнала «Успехи физических наук», 1997 г.

Таким образом, автор «потерял» только на этой статье 135 ссылок и вместо 177 ссылок в аналитической системе Scopus должны быть учтены, по крайней мере, 315 ссылок (177+3+135).

Если «потери» В.Н. Цытовича можно отнести, в том числе, к ошибкам в описании основной публикации в системе, то следующий пример таких ошибок не имеет, но «потери» еще более разительны, особенно если рассматривать в пропорциях «учтенные» и «не учтенные» ссылки.

Рассматриваем статью Г.А. Малыгина за 2001 г., представленную в Scopus двумя вариантами:

1. Малыгин Г А «Размытые мартенситные переходы и пластичность кристаллов с эффектом памяти формы» УФН , т. 171, номер 2, стр. 187–211;212 (2001) DOI: 10.3367/UFNr.0171.200102c.0187

2. Malygin G A “Diffuse martensitic transitions and the plasticity of crystals with a shape memory effect&”; Phys. Usp. 44 173 (2001); DOI: 10.1070/pu2001v044n02ABEH000760

Данные поиска по WoS этой статьи приведены выше (рис. 8–10).

В Scopus автор имеет учтенными 10 ссылок на английский и 1 ссылку на русский варианты статьи.

При дополнительном поиске потерянных ссылок мы видим еще 32 ссылки (рис. 19), которые не были учтены для русскоязычной версии.

Рис. 19. Скриншот на страницу результата поиска «не привязанных» ссылок на русскоязычную публикацию Г.А. Малыгина 2001 г. из журнала «Успехи физических наук»

Необходимо заметить, что достаточно часто англоязычный вариант статьи, присутствующей в индексе цитирования, имеет меньше ссылок, чем ее русскоязычный вариант, отсутствующий в системе (выявляется по той же опции “Secondary documents”). Но ссылок на русскоязычные варианты журналов было бы еще больше, если бы все русскоязычные ссылки были правильно представлены в латинице в списках литературы (рис. 20).

Рис. 20. Пример списка литературы в статье Г.А. Малыгина из УФН, в которой не обработаны ссылки на русскоязычные источники

Как видим из приведенных примеров на статьях конкретных авторов, по разным причинам, только частично здесь упомянутым, потери наших ученых, организаций и страны в целом по библиометрическим показателям в глобальных индексах цитирования могут достигать 200%. Корректный подсчет всех ссылок на обе версии статей переводных журналов существенно бы улучшил эти показатели.

Корректно учесть все ссылки на статью позволяет решить наличие DOI у русской и английской версии статей. Такой учет производится в базе MathNet и, например, по статье Цытовича В.Н. база MathNet показывает 334 ссылки, что лишь несколько больше, чем число ссылок, которые были найдены в WoS (287) и Scopus (315), но все эти ссылки представлены в MathNet интернет-линками прямо в описании данной статьи Цытовича В.Н. (рис. 21).

Рис. 21. Представление статьи Цытовича из УФН 1997 года в базе MathNet (учтены 334 ссылки на эту статью)

Аналогичные данные можно получить в MathNet и по обсуждавшейся выше статье Малыгина Г.А., причем число цитирований этой статьи (42 ссылки на 30.08.2013) также практически точно совпадет с числом цитирований этой статьи, которые можно обнаружить в WoS (42 ссылки, см. рис. 10) и Scopus (43 ссылки, см. рис. 19 и 20) с помощью специального дополнительного поиска, но только в базе MathNet эти данные представлены «явно» и учитываются во всех библиометрических параметрах (рис. 22).

Рис. 22. Представление статьи Малыгина Г.А. из УФН 2001 года в базе MathNet (учтены 42 ссылки на эту статью)

Таким образом, видно, что задача сбора ссылок и на русскую, и английскую версии одной и той же статьи из переводных российских журналов технически разрешима и уже успешно реализуется с использованием DOI в базе MathNet [8–12]. Хочется надеяться, что и в международных базах Web of Science и Scopus эта техническая проблема также будет успешно преодолена и российские публикации будут в этих базах представлены надлежащим образом.

4. ВЛИЯНИЕ УЧЕТА ЦИТИРОВАНИЯ РУССКОЯЗЫЧНОЙ И АНГЛОЯЗЫЧНОЙ ВЕРСИЙ РОССИЙСКИХ ПЕРЕВОДНЫХ ЖУРНАЛОВ НА ОБЩИЕ БИБЛИОМЕТРИЧЕСКИЕ ПОКАЗАТЕЛИ ЖУРНАЛОВ В БД SCOPUS

Проблему учета ссылок для журналов, имеющих две версии, и оценку целесообразности представления двух версий в индексах цитирования необходимо рассматривать отдельно для самого журнала и для авторов статей в этих журналах. Вопросы влияния учета ссылок для отдельных авторов рассмотрены в разделах 1–3. Здесь мы рассмотрим влияние такого учета ссылок на показатели журналов. Решает ли наличие двух версий журнала в таких индексах проблему полноты учета ссылок для этих двух категорий библиометрического анализа, корректен ли их подсчет, и каковы пути решения проблемы однозначного учета всех ссылок на статьи, представленные в двух вариантах?

Рассмотрим эту задачу с разных сторон на примере одного журнала – «Журнала неорганической химии», который в 1996–2004 гг. был представлен в Scopus двумя версиями – Russian Journal of Inorganic Chemistry (RJIC) и Zhurnal Neorganicheskoj Khimii (ZhNKh). С 2005 г. индексирование русскоязычного варианта журнала, как и практически всех журналов, представленных на тот момент двумя версиями в этой БД, было прекращено, и в системе остался только переводной вариант журнала.

Журналы, представленные двумя вариантами, имеют и два профиля, т.е. версии их сейчас рассматриваются как отдельные журналы (т.к. часто имеют разных издателей, язык и, соответственно, ISSN), и цитирование учитывается отдельно для каждого варианта. Для сравнения данных по показателям цитируемости обеих версий берем один период публикации статей – 1996–2004 гг. и один период цитирования 1996–2010 гг.

Итак, пример:

Russian Journal of Inorganic Chemistry, имеет в Scopus за 1996–2004 гг. 3310 статей (всего на 15.08.2013 – 6041 статья), в 1996–2010 гг. 1516 статей (46%) процитированы 3846 раз, h-index – 14, самое высокое цитирование – 40 ссылок на статью.

Zhurnal Neorganicheskoj Khimii, за 1996–2004 гг. в Scopus включены 3275* статей, в 1996–2010 гг. 2290 статей (70%) суммарно были процитированы 8169 раз, h-index – 17, самая высокая цифра цитирования – 144 ссылки на статью.

(Расхождения в количестве статей, возможно, связаны с тем, что из русскоязычной версии взяты только научные статьи (articles) и по какой-то причине пропущены некоторые типы публикаций, которые включены в английский вариант (review, conference paper, short surveys).

Таким образом, если грубо суммировать цитирование двух версий журнала, то получается, что его показатели, благодаря наличию русскоязычной версии, увеличиваются почти на 200%. Журнал в совокупности получает более 12 тыс. ссылок. И авторы получают в сумме также больше ссылок.

Анализ цитирования первых (англоязычных) 400 статей RJIC с наиболее высокими показателями их цитирования (процитированы в 1810 статьях с 1996 г. по настоящее время) показал, что 56% (1002) цитирующих статей в числе авторов имеют российских ученых и 44% цитирующих статей (808) принадлежат только иностранным авторам, без участия ученых России. 25 из 31 журнала, в которых процитированы статьи из RJIC хотя бы 10 раз (81%), относятся к ведущим зарубежным изданиям (переводные версии к зарубежным не отнесены). Однако 25% цитирующих статей являются статьями из самого журнала RJIC, что характеризует допустимое самоцитирование журнала.

(Необходимо заметить, что цифра может быть выше, т.к. здесь не учитывается число цитируемых статей из журнала в одной публикации).

Анализ цитирования первых (русскоязычных) 400 статей ZhNKh с наиболее высокими показателями (процитированы в 2751 статье с 1996 по настоящее время) показал, что основными цитирующими авторами являлись российские авторы (81%), а основными источниками цитирующих статей – российские переводные журналы (17 из 30-ти журналов, включавших не менее 10 ссылок). Причем 37% ссылок на русскоязычный вариант статей исходили из переводной версии этого журнала, т.е. из RJIC.

Эти общие показатели говорят о том, что:

1) англоязычный вариант при общих достаточно низких библиометрических показателях иностранными учеными цитируется значительно лучше, чем русскоязычный вариант; это естественно, хотя цитирование русскоязычной версии в иностранных источниках также имеет место, причем совсем необязательно, чтобы это были российские авторы;

2) отсутствие учета ссылок на русскоязычный вариант статей из журналов, входящих в индекс цитирования англоязычным вариантом, в этот период почти в 3 раза уменьшает число цитирований статей из журнала;

3) при подготовке англоязычных версий российских журналов не производится преобразование ссылок русскоязычного варианта названия в англоязычный. И таким образом, в переводных версиях находится большое число ссылок на русскоязычное название, не позволяющее в случае отсутствия русскоязычной версии учесть эти ссылки в системе анализа Scopus.

Потери в учете ссылок подтверждаются при поиске по названию русскоязычного варианта журнала в поле REFSRCTITLE. Поиск по сокращенному названию журнала «Zhur* Neorg* Khim*» по этому полю дает результат – 6004 статьи, из которых цитирование 545 статей (757 ссылок) не входит в систему анализа цитирования («secondary documents»), т.е. в ссылках отражены публикации журнала, отсутствующие в Scopus. Большинство из этих публикаций – 85–90% – статьи до 1996 г. Только незначительная часть – статьи после 2004 г. Журнал в них представлен в 40-ка вариантах сокращенных и полных названий.

Еще более значительную цифру дает поиск по полю REFSRCTITLE варианта названия журнала «Zh* neorg* khim*». Всего результат показал 17920 документов, в которых присутствует в поле источника такое сокращенное (или более полное) устойчивое словосочетание. Используя опцию «Secondary documents», позволяющую увидеть непривязанные к статьям ссылки, мы получаем 12866 цитируемых документов, имеющих в названии такое сокращение. На рисунке 21 видны варианты названия журнала и распределение этих непривязанных ссылок по годам. Видно, что в тот период, когда журнал в русскоязычном варианте находился в Scopus, не привязанных ссылок было меньше, но они все-таки остались. Кроме того, изучая варианты названия журнала в ссылках, мы видим, кроме странных сокращений, еще массу других ошибок, которые не позволили учесть значительную часть из них в системе анализа, в т.ч. и с англоязычным вариантом. Сюда, безусловно, входят и ссылки на несуществующие статьи, и некоторая часть ссылок на другие названия, включающие это словосочетание, однако «шума» здесь немного. Эти данные демонстрируют огромное пренебрежение авторов и редакторов к спискам литературы даже в ведущих российских журналах.

Рис. 23. Данные о непривязанных ссылках на статьи из Журнала неорганической химии в Scopus

ЗАКЛЮЧЕНИЕ

Из всего вышеизложенного можно сделать заключение, что в настоящее время прямое использование данных по цитированию российских авторов как из базы данных WoS, так и из базы Scopus существенно занижают реальные показатели цитируемости как отдельных авторов, так и коллективов. Занижены также и показатели журналов, получаемые при использовании баз данных WoS и Scopus.

Правда, по утверждениям сотрудников WoS, при подсчете импакт-факторов в Journal Citation Report производится поиск по всем «синонимам» названий журнала, в который включены и названия русскоязычной версии, но проверить это нет возможности, так как в JCR не приводятся списки цитирующих статей, учтенных при подсчете импакт-факторов.

Здесь озвучены далеко не все проблемы, затрудняющие корректный подсчет публикаций и ссылок автора. Кроме двух разных версий журналов и множественности вариантов написания фамилий авторов, также, например, искажает картину учета публикаций отсутствие аффилиации авторов. Для решения задач учета публикаций и ссылок авторов и организаций индексы цитирования предлагают дополнительные инструменты, позволяющие объединить и учесть все варианты фамилии в одном профиле автора и его аффилиации. Однако если для автора существуют инструменты объединения и корректировки его данных, то для организаций сделать такую корректировку практически невозможно, т.к. только наличие этих данных в статье позволяет определять принадлежность автора, а следовательно, и статьи, к организации. Поэтому очень важно, чтобы аффилиация была. Например, в описаниях статей из того же русскоязычного варианта «Журнала неорганической химии» полностью отсутствует аффилиация авторов. По этой причине цитирование этих статей в профиле организации не учитывается.

Кроме ответственности редакций за подготовку в требующемся формате всех необходимых данных для полного их использования индексами цитирования, очень важно, чтобы сами авторы выполняли эти требования, понимали необходимость постоянства в представлении своих фамилий в латинском алфавите, придерживаясь одного варианта ее написания, правильного и полного представления своей аффилиации и подготовки в нужном формате ссылок литературы. Авторы, как никто другой, должны осознавать, что их публикации и ссылки на используемые ими источники литературы должны быть учтены в системах анализа в индексах цитирования. Последнее особенно важно, т.к. влияет на показатели результатов научной деятельности как самих авторов, так и их коллег, статьи которых они цитируют.



Издание научных монографий от 15 т.р.!

Издайте свою монографию в хорошем качестве всего за 15 т.р.!
В базовую стоимость входит корректура текста, ISBN, DOI, УДК, ББК, обязательные экземпляры, загрузка в РИНЦ, 10 авторских экземпляров с доставкой по России.

creativeconomy.ru Москва + 7 495 648 6241



Источники:
Garfield, E. “Citation Indexing ― Its Theory and Application in Science, Technology, and Humanities” (John Wiley&Sons, 1979); второе издание (Philadelphia: ISI press, 1983).

Garfield, E. “Journal Citation Reports. A bibliometric Analysis of References Processed for the 1974 Science Citation Index” (Philadelphia: Institute for Scientific Information, 1975).

Амбегаокар, В. "Совместная программа школы Ландау и Американского института физики по переводу научной литературы" УФН 178 1359–1363 (2008); Ambegaokar V. “The Landau school and the American Institute of Physics translation program” Phys. Usp. 51 1287–1290 (2008).

Tybulewicz, A. “AIP translation manual for editors and translators of the American Institutes of Physics cover-to-cover translation journals” (New York: AIP, 1983).

“К вопросу об исчислении индексов цитирования научных статей”, на сайте «Трибуна УФН. Интервью М.С. Аксентьевой с М.В. Фейгельманом и Г.А. Цирлиной [Электронный ресурс]. – URL: http://ufn.ru/tribune/trib160512.pdf.

Фейгельман, М. В., Цирлина, Г. А. “Библиометрический азарт как следствие отсутствия научной экспертизы», в сб. Управление большими системами (Специальный выпуск 44 –

Наукометрия и экспертиза в управлении наукой) (ред. Д.А. Новикова, А.И. Орлова, П.Ю. Чеботарева) (М.: ИПУ РАН, 2013) с. 332.

Аксентьева, М.С., Захарова, Е.В. “Особенности представления российских публикаций в международных базах данных, используемых для оценки эффективности научной деятельности”, в сб. «Тезисы конференции “RELARN-2013”» (М.: РЕЛАРН, 2013) с. 18 (электронный ресурс: http://www.relarn.ru/conf/index.html).

Жижченко, А.Б., Изаак, А.Д., “Информационная система Math-Net.Ru. Современное состояние и перспективы развития. Импакт-факторы российских математических журналов”, УМН, 64:4(388) (2009), 195–204 [A. B. Zhizhchenko, A. D. Izaak, “The information system Math-Net.Ru. Current state and prospects. The impact factors of Russian mathematics journals”, Russian Math. Surveys, 64:4 (2009)]

Chebukov, D., Izaak, A., Misurina, O., Pupyrev, Yu., Zhizhchenko, A., “Math-Net.Ru as a digital archive of the Russian mathematical knowledge from the XIX century to today”, Lecture Notes in Computer Science, 7961, ed. J. Carette et al., 2013, 344–348, arXiv: 1305.5655.

Жижченко А.Б., Изаак А.Д. “Информационная система Math-Net.Ru. Применение современных технологий в научной работе математика”, УМН,62:5(377) (2007), 107–132; A. B. Zhizhchenko, A. D. Izaak, “The information system Math-Net.Ru. Application of contemporary technologies in the scientific work of mathematicians”, Russian Math. Surveys, 62:5 (2007), 943–966

Чебуков Д.Е., Изаак А.Д., Мисюрина О.Г., Пупырев Ю.А., “Электронный документооборот в информационной системе Math-Net.Ru как основа электронного издательства научного журнала”, Научный сервис в сети Интернет: поиск новых решений, Труды Международной суперкомпьютерной конференции (17–22 сентября 2012 г., г. Новороссийск), 2012

Чебуков Д.Е., Изаак А.Д., Мисюрина О.Г., Пупырев Ю.А., “Хранение списков литературы в базе данных математических журналов”, Научный сервис в сети Интернет: поиск новых решений, Труды Международной суперкомпьютерной конференции (17–22 сентября 2012 г., г. Новороссийск), Изд-во Моск. ун-та, М., 2012, 640–641