東北大学(本部:宮城県仙台市)は2023年3月22日、学内外に散在する研究者の情報を自動で集積する研究者データベースを構築したと発表した。狙いは、研究グループの活動を、多面的かつエビデンスベースで評価できるようにすること。外部データベースからは参照できない各種の情報、例えば、企業との共同研究費や論文指導実績といったデータを自動的に集計する。すでに試験運用を始めており、2023年4月に本稼働させる。システム要素として、Amazon Web Services(AWS)上に構築したデータレイクを利用する。
東北大学は、学内外に散在する研究者の情報を自動で集積する研究者データベースを構築した。狙いは、研究グループの活動を、多面的かつエビデンスベースで評価できるようにすること。すでに試験運用を始めており、2023年4月に本稼働させる。システム要素として、Amazon Web Services(AWS)上に構築したデータレイクを利用する(図1)。
拡大画像表示
教育・研究活動をエビデンスベースで評価するための仕組みとして、外部データベースからは参照できない各種の情報を、研究者自身の入力を必要とせずに自動で収集する。論文の被引用数といった画一的な指標だけでなく、企業との共同研究、論文指導実績、講義担当数、留学生受け入れ実績、管理運営実績などの情報を基に評価できるようにした。
拡大画像表示
データレイクには、学外の論文情報データベースに加えて、学内の人事給与統合システム、財務会計システム、学務情報システムなど各種フォーマットのファイルを格納する。研究者や評価担当者は、必要なときに必要なフォーマットで情報を取り出し、BI(ビジネスインテリジェンス)ツールで可視化する(画面1)。
論文数や被引用数のほかに研究活動を評価する術がなかった
研究者データベースを構築した背景として東北大学は、国際的なプレゼンスの向上や、若手研究者の登用、産学連携の推進などの課題を挙げている。そうした中で、研究者の業績を効率的に集積し、エビデンスベースで評価・分析するシステムが求められているという。
「近年、国内の研究者データベースや海外の論文情報データベースなどを参照することで、論文数や被引用数、科研費の獲得額などは比較的容易に集積・分析可能である。例えば、内閣府エビデンスシステム(e-CSTI)は、研究者数あたりの論文被引用数や寄付金額などを、大学・研究機関別に可視化している」(同学)
この一方で、大学には、秘匿性がある企業との共同研究や、論文指導、管理運営業務など、外部データベースに集積しにくい教育・研究活動があるという。「これらの実績は、研究者が自身の研究時間を割いて学内のデータベースに入力している。また、データの入力は研究者に依存するため、量や質に大きな差があり、エビデンスベースの評価・分析が難しかった」(同学)
さらに、大学や研究者に求められる評価基準は、固定されたものではなく、学問分野によって異なり、時代でも変化する。このため、入出力データの形式を事前に決めて設計する既存のデータベースでは、これら多面的な評価に迅速に対応できないという課題があったという。