Center for Public Policy Studies

Nowy projekt finansowany przez MNISW (2023-2026). „Co Big Data wnoszą do badań kadry akademickiej? Od modeli teoretycznych do praktycznych zastosowań”.

Nowy projekt badawczy finansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego w ramach Programu Nauka dla Społeczeństwa II (2023-2026). Projekt realizowany przez Zespół pod kierunkiem prof. dr. hab. Marka Kwieka z Institute for Advanced Studies (IAS) i Centrum Studiów nad Polityką Publiczną (CPPS) UAM w Poznaniu. 

Numer projektu: NdS-II/SP/0010/2023/01. Wartość dofinansowania przez MNISW: 750 000 PLN.

„Co Big Data wnoszą do badań kadry akademickiej? Od modeli teoretycznych do praktycznych zastosowań”

Projekt łączy nauki społeczne i nauki o danych i zakłada, że nowe zbiory danych oraz możliwości dostępu do nich i ich przetwarzania (era cyfrowa w badaniach naukowych w szkolnictwie wyższym i badaniach naukowych ilościowych) stwarzają nowe możliwości dla badań społecznych stosowanych. Proponowane badania łączące heterogeniczne źródła danych w skali polskiego systemu naukowego oraz w skali krajów OECD byłyby niemożliwe do przeprowadzenia pięć lat temu. W ramach projektu zostaną w szczególności połączone dane z globalnych badań ankietowych (wysłano 1 milion ankiet) ze strukturalnymi danymi Big Data oraz dane z badań ankietowych z danymi bibliometrycznymi i administracyjnymi (metody probabilistyczne i deterministyczne). Projekt proponuje radykalną zmianę jednostki analizy w badaniach nad karierami akademickimi: nie publikacja (i jej cechy), ale indywidualny naukowiec (i jego cechy). Naukowiec ma cechy pochodzące ze zintegrowanych baz danych łączących duże zbiory danych, krajowe rejestry naukowców i dane instytucjonalne na różnych poziomach. Interesują nas agregacje na poziomie naukowców o indywidualnych cechach, a nie na poziomie publikacji i ich metadanych. Projekt badawczy ma charakter pionierski w skali globalnej: w celu przeprowadzenia innowacyjnych badań naukowych dotyczących kadry akademickiej w Polsce w szerokim kontekście krajów OECD, wykorzystujemy nowe metodologie i nowe źródła danych pierwotnych, stawiając nowe pytania teoretyczne i poszukując odpowiedzi na tradycyjne pytania socjologiczne dotyczące kariery akademickiej w oparciu o analizę nowych danych empirycznych wygenerowanych w ramach projektu. W ramach projektu pokazujemy możliwości, jakie otwierają się dla badań nad szkolnictwem wyższym i nauką w Polsce dzięki uporządkowanym zbiorom Big Data (surowym danym z baz Scopus, Web of Science i POLON).

Krajowe systemy szkolnictwa wyższego i nauki są w centrum publicznego zainteresowania w całej Europie. Wszyscy chcą je znać – prawie wszyscy chcą je reformować. Kadra akademicka stanowi najważniejszy koszt funkcjonowania instytucji akademickich.

Zmiany dotyczące charakteru pracy akademickiej są gwałtowne, ale po raz pierwszy można je poddawać szczegółowej ocenie dzięki ilościowym badaniom nauki. Rośnie presja na wykorzystywanie dużych zbiorów danych (i znacznie większej liczby obserwacji) do formułowania istotnych wniosków w polityce naukowej, również w Polsce.

Big Data to dane ustrukturyzowane, oczyszczone i aktualizowane na bieżąco kosztem dużych nakładów, o wysokim poziomie wiarygodności. W przypadku polskiej podpróby, Big Data są połączone z danymi administracyjnymi i biograficznymi z systemu POLON 2 – o charakterze niemal idealnym. W tym projekcie Big Data to dane surowe z baz Scopus i Web of Science znajdujące się na pierwotnym etapie, dostępne tylko dla specjalistów, o ogromnym zakresie i wysokim stopniu komplikacji (miliardy oddzielnych komórek).

Projekt korzysta w szczególności z łączenia ogromnych danych ankietowych naukowców z obszaru OECD, w tym z Polski, z danymi bibliometrycznymi i administracyjnymi. Wykorzystanie Big Data pozwala na uzyskanie równowagi między badaniami na małą skalę i na dużą skalę (z małymi i dużymi N), co ma ogromny pozytywny wpływ badania polityki szkolnictwa wyższego.

Słowem kluczowym projektu jest komplementarność (danych i metod): w przypadku badań kadry akademickiej, Big Data towarzyszą globalnym ankietom (1 milion) i wywiadom, a badania na poziomie makro towarzyszą badaniom na poziomie mikro. W projekcie wprowadzamy badania prowadzone na dużą skalę, wykorzystujące globalne bazy danych bibliometrycznych, nowe oprogramowania oraz nowe narzędzia analityczne i wizualizacyjne.

Polska staje się dla świata – jako system, poszczególne instytucje i ich wydziały oraz grupy badawcze i wreszcie pojedynczy naukowcy – niemal przezroczysta. Nadeszła bowiem epoka widzialności – a tym samym mierzalności – wszystkich najważniejszych badawczych wymiarów funkcjonowania uczelni – co niesie z sobą daleko idące konsekwencje dla naszych uczelni. Niemal wszystko jesteśmy w stanie ze sobą porównać w kontekście międzynarodowym. Jednak od danych, poprzez wiedzę, trzeba coraz szerzej sięgać do interpretacji badanych procesów globalizacji nauki.

Kilka czynników zwiększa presję na badanie kadry akademickiej przy użyciu Big Data: (1) dostępność danych cyfrowych dotyczących nakładów i efektów pracy naukowej na poziomie indywidualnym (finansowanie, publikacje, współpraca badawcza, mobilność); (2) dostępność komputerowych mocy obliczeniowych umożliwiających analizę ogromnych zestawów danych w chmurze; i (3) nacisk na zapewnienie społeczeństwu i społeczności naukowej skwantyfikowanego i opartego na danych obrazu zmian zachodzących w szkolnictwie wyższym i w ramach kadry akademickiej.

Nowe dane muszą być jednak ponownie przetworzone i mają swoje własne ograniczenia. Ich ilość i wzdłużny (longitudinalny) charakter (umożliwiający analizę zmian w karierze akademickiej na przestrzeni czasu) otwierają nowe horyzonty, w tym między innymi – umożliwiają ujęcia globalne obok ujęć krajowych.
 
Ze zbiorów danych, które są olbrzymie i złożone, możemy wydobywać przydatne informacje dotyczące naukowców i ich dorobku, zarówno w przeszłości, jak i obecnie. Możemy badać potężne ilości danych, aby odkryć wzorce, które w innym przypadku pozostawałyby niezauważone; analizować wartości skrajne, odchylenia i szczególne przypadki; oraz przeprowadzać analizy oparte na bezprecedensowej liczbie obserwacji. Przykładowo opracowana przez nas baza „Naukowcy w krajach OECD” liczy 4 miliardy komórek i obejmuje 4 TB ustrukturyzowanych danych przypisanych do indywidualnych naukowców.
 
Konkretne części ustrukturyzowanych, archiwizowanych i wiarygodnych Big Data (takich jak zbiory danych bibliometrycznych) mogą radykalnie poprawić nasz wgląd w funkcjonowanie kadry akademickiej. Można badać różne wymiary pracy akademickiej z coraz większą precyzją i na niezwykłym poziomie szczegółowości.

Wykorzystanie dobrze przygotowanych, rozbudowanych źródeł danych pozwala badać profesję akademicką na przestrzeni lat, w różnych krajach (instytucjach, miastach), w różnych dyscyplinach akademickich, na różnych poziomach granulacji oraz w odniesieniu do zespołów badawczych i poszczególnych naukowców, ich wieku, płci i dyscypliny.

W projekcie wprowadzamy nowy typ badań: badania ankietowe na dużą skalę (wspierane danymi bibliometrycznymi) i badania oparte o surowe dane bibliometryczne.

Dziewięć obszarów tematycznych w projekcie:

(1) Rola współpracy międzynarodowej w nauce

(2) Rola wysokiej produktywności badawczej w nauce

(3) Rola trwałość produktywności badawczej w ujęciu całości kariery naukowej

(4) Rola młodych naukowców i kobiet naukowców w globalnej nauce

(5) Rola wskaźników i metryk w karierze akademickiej

(6) Rola rodziny i wychowywania dzieci w karierze akademickiej

(7) Rola indywidualnego profilu publikacyjnego i jego zmian w czasie

(8) Napięcia badania krajowe / globalne

(9) Napięcia badania bibliometryczne / ankietowe / wywiady

Nauka dla Społeczeństwa II - Centrum Zarządzania Projektami

 

Home - Fundusze - Ministerstwo Nauki i Szkolnictwa wyższego