Pierwszą sesją po inauguracji konferencji ScienceCon 2022 była prezentacja Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego. OPI odpowiedzialny jest za wymiar techniczny i informatyczny ewaluacji oraz zarządzanie dorobkiem naukowym.

Podczas prezentacji Marek Michajłowicz, Zastępca Dyrektora ds. Rozwoju Oprogramowania OPI, opowiedział o procesie zbierania danych o dorobku naukowym, które zostały wykorzystane w procesie ewaluacji działalności naukowej za lata 2017-2021. Ekspert przedstawił nie tylko statystyczne podsumowanie, ale też architekturę procesu zarządzania dorobkiem naukowym oraz wizję tego, jak będzie ono realizowane w przyszłości.

Przepływ danych o osiągnięciach naukowych

Każda uczelnia wytwarza ogrom danych o dorobku naukowym. Technologii i baz do ich zbierania oraz przetwarzania jest bardzo wiele. Różnorodność ta stanowi wyzwanie dla gromadzenia danych na poziomie krajowym, gdzie potrzebna jest spójna, ujednolicona baza.

Z perspektywy architektury danych wszystko zmierza do modelu sieciowego przepływu danych, w którym istnieje wiele źródeł, lecz o uniwersalnej semantyce. Pozwala to na integrację maszynową pomiędzy systemami dzięki API i wielokrotne wykorzystywanie danych, które wystarczy wprowadzić tylko raz. Element takiego ekosystemu danych stanowią np. dobrze znane badaczom stałe identyfikatory jak DOI lub ORCID.

Celem tworzenia sieciowego ekosystemu jest osiągnięcie wartości dodanej w postaci analityki, czyli przyspieszenie pozyskiwania wiedzy z danych i uzyskiwania informacji zwrotnej dla środowiska akademickiego, aby umożliwić zarządzanie nauką oparte na danych.

Kształt obecnej ewaluacji wynika bezpośrednio z wprowadzenia Ustawy 2.0. W wyniku zmian zasad oceny działalności naukowej OPI-PIB uruchomiła SEDN – System Ewaluacji Dorobku Naukowego, który obsługuje cały proces. To właśnie do SEDN finalnie trafiły wszystkie dane o dorobku przekazane przez instytucje szkolnictwa wyższego do rejestrów POL-on i PBN.

Statystyczne podsumowanie raportowania dla celów ewaluacji

Ilość tych danych robi imponujące wrażenie. Ewaluowanych jest łącznie 283 podmiotów i niemal 118 tys. osób. Do systemu trafiły dane dotyczące m.in. blisko 708 tys. publikacji naukowych, 54 tys. osiągnieć artystycznych, ponad 12 tys. patentów, 27,5 tys. projektów badawczych oraz 172 tys. wpisów z przychodami z komercjalizacji lub usług badawczych. W systemach znalazło się również ponad 2,6 tys. opisów wpływu, będących nowością w tej ewaluacji.

Jeżeli przyjmiemy, że liczba N zgłoszona w ewaluacji stanowi jeden ze wskaźników intensywności prac naukowych, to przodujące pod tym względem są województwa mazowieckie i małopolskie, a w dalszej kolejności dolnośląskie, śląskie i wielkopolskie.

Po podzieleniu liczby N przez liczbę podmiotów na czoło wysuwają się jednak województwa świętokrzyskie i zachodniopomorskie, a mazowieckie plasuje się na samym końcu. Wynika to z liczby podmiotów: w świętokrzyskim ewaluowane są dwa podmioty o wysokim N, w zachodniopomorskim mała liczba podmiotów o stosunkowo dużym N, natomiast w mazowieckim duża grupa małych ośrodków naukowych o mniejszym N.

Największą liczbę N i ewaluowanych dyscyplin zgłosiły Uniwersytet Jagielloński i Uniwersytet Warszawski. Interesujący jest przypadek Uniwersytetu Mikołaja Kopernika w Toruniu, który zgłosił największą liczbę dyscyplin mimo znacznie niższej liczby N niż UW, UJ czy UAM.

W ewaluacji wzięło udział 29 uczelni niepublicznych, co stanowi 21% wszystkich uczelni poddających się ewaluacji, podczas gdy ogółem uczelnie niepubliczne stanowiły 65% wszystkich uczelni w Polsce w 2020 roku. Uczelnie niepubliczne, niezależnie od ich wielkości mierzonej liczbą studentów, przeważnie zgłaszały mniejszą liczbę dyscyplin i mniejszą liczbę N niż uczelnie publiczne.

Instytuty zaś najczęściej zgłaszały jedną dyscyplinę, czasem dwie, a rzadko 3 i więcej. W przypadku instytutów badawczych najczęściej zgłaszano nauki inżynieryjno-techniczne, natomiast wśród instytutów PAN nauki ścisłe i przyrodnicze. Spośród samych nauk z kolei dominującą pod względem liczby N dziedziną zgłaszaną w ewaluacji są nauki społeczne, natomiast dominującą dyscypliną są nauki medyczne.

Po więcej analiz zapraszamy na www.radon.nauka.gov.pl – platformę analityczną również tworzoną przez OPI. RAD-on umożliwia bezpłatny dostęp do danych o szkolnictwie wyższym i nauce, interaktywnych raportów tematycznych oraz pogłębionych opracowań dotyczących badań i innowacyjności.

Co ciekawe, ok. 40% aktualnego stanu osiągnięć w POL-on zostało zaraportowanych w ostatnim miesiącu przed terminem złożenia danych. Większość instytucji, zwłaszcza dużych podmiotów, zaraportowała dane do systemów odpowiednio wcześniej – w wielu jednak widoczna jest tendencja do zostawiania sprawozdawczości na ostatni moment. W miesiącu poprzedzającym deadline z systemu PBN skorzystało aż 235 tys. unikatowych użytkowników.

Warto jednak zająć się tym wcześniej, ponieważ, jak przypomniał prelegent, SEDN jest dostępny dla uczelni w czasie całego okresu podlegającego ewaluacji, dzięki czemu mogą one uzyskać cenne informacje zwrotne, które pomogą efektywnie zarządzać nauką. Bieżące raportowanie pozwala na predykcję wyniku i korygowanie kierunku zarządzania dorobkiem naukowym na uczelni, a także na zminimalizowanie kosztów administracyjnych związanych z przygotowaniem danych na potrzeby ewaluacji. Pamiętajmy również, że regulacje prawne wymagają od instytucji raportowania na bieżąco.

Zmiany technologiczne w procesie sprawozdawczości

W tej ewaluacji znacząco wzrosła rola narzędzi informatycznych. Wzrosły inwestycje instytucji w systemy zbierania dorobku naukowego – dzisiaj z PBN zintegrowanych jest maszynowo 98 podmiotów. Ponad 30% danych o publikacjach zostało przekazanych lub edytowanych do repozytoriów centralnych w ramach komunikacji system-system.

Nastąpił również istotny wzrost interoperacyjności, czyli zintegrowania z systemami zewnętrznymi, co jest istotnym elementem usieciowienia ekosystemu zarządzania dorobkiem naukowym. Przykładowo, poprzez połączenie z bazą ORCID zweryfikowano niemal 90 tys. profili, a blisko 420 tys. publikacji zostało poddanych weryfikacji z bazą Web of Science. Z kolei aż 70% wszystkich patentów zaimportowano z baz UPRP i EPO.

Ekosystem stworzony wokół SEDN w ramach ostatniej ewaluacji jest trwałym osiągnięciem i będzie stosowany w kolejnych procesach z uwzględnieniem niezbędnych modyfikacji, podkreślił Marek Michajłowicz. W przyszłości z pewnością dalej będzie wzrastać stopień interoperacyjności, a systemy centralne będą działały w symbiozie z systemami lokalnymi.

Najważniejsze trendy w rozwoju procesu oceny działalności naukowej będą związane z ruchem Open Science (Otwartej Nauki) i Open Access (Otwartego Dostępu). Szczególnie istotna jest inicjatywa European Science Cloud, której efektem ma być ogólnodostępna chmura łącząca różne rozproszone zbiory danych, w tym publikacji i danych badawczych. Coraz ważniejsze będą instytucjonalne repozytoria o odpowiednich standardach przetwarzania metadanych.