3. ・デジタルリソースの作成者に対して何かを判断したり罰したりすることを目的としたもの
ではなく、標準に関する認識を促進することが目的。
・リソースの品質を評価することとそのFAIR度を評価することを混ぜないことが必要。
FAIR Evaluatior とはFAIRnessを評価するために設計されたものであり、FAIRスコアが低い
からといって、デジタルリソースの品質、有用性が足りないというわけではない。
・FAIRnessとオープン性の区別。 FAIRであることは、データ、ソースコード、ツール、ま
たはその他のデジタルリソースを無料でオープンに利用できるようにすることとイコールで
はない。FAIRガイドラインは、アクセスと使用のポリシーが提供され、明確に述べられてい
ることのみを要求している。
Daniel J.B. Clarke, Lily Wang, Alex Jones, Megan L. Wojciechowicz, Denis Torre, Kathleen M. Jagodnik, Sherry L. Jenkins, Peter
McQuilton, Zachary Flamholz, Moshe C. Silverstein, Brian M. Schilder, Kimberly Robasky, Claris Castillo, Ray Idaszak, Stanley C.
Ahalt, Jason Williams, Stephan Schurer, Daniel J. Cooper, Ricardo de Miranda Azevedo, Juergen A. Klenk, Melissa A. Haendel,
Jared Nedzel, Paul Avillach, Mary E. Shimoyama, Rayna M. Harris, Meredith Gamble, Rudy Poten, Amanda L. Charbonneau,
Jennie Larkin, C. Titus Brown, Vivien R. Bonazzi, Michel J. Dumontier, Susanna-Assunta Sansone, and Avi Ma’ayan (2019).
FAIRshake: Toolkit to Evaluate the FAIRness of Research Digital Resources; Cell Systems,
https://doi.org/10.1016/j.cels.2019.09.011
FAIR Evaluationの目的と注意点
E7: FAIRなデータキュレーションの実践
4.
5.
6.
7. FAIR Evaluationにおいて何を測定しているか
E7: FAIRなデータキュレーションの実践
Evaluating FAIR maturity through a scalable, automated, communitygoverned framework, Scientific Data | (2019) 6:174,
https://doi.org/10.1038/s41597-019-0184-5
F1A ユニークなID をもつ
F1B IDの永属性がある
F2A 構造化されたメタデータ:ハッシュまたはグラフ
F2B メタデータが構造化され共通語彙に基づいているか:グラフ
F3 メタデータにGUID(Globally Unique Identifier)があるか:データベースカタログ: URLが書いてあるメタデータ。
F4 メタデータが検索エンジンで検索結果として返ってくるか:50位以内。
A1.1 (メタ)データ検索のためのオープンな通信プロトコルになっているか:プロトコルはFAIRsharingでFAIRであることが記述されていること
A1.2 その通信プロトコルは認証・承認をサポートするか:認証が必要なものである場合、そのことがFAIRsharingに記載されるか、dc:accessRights
のプロパティとして記述されていること
A2 メタデータは永続的か:外部から対象リソースへリンクされている場合など、リンクが古くて繋がらなくなることがあるが、F3が永属性を満た
していればメタデータは得られる。
I1A 知識表現言語の使用(soft) :何が知識表現言語とされるかはコミュニティで議論があるべき。 soft : Any hash-style metadata (e.g. JSON or
microformat) or Linked Data
I1B 知識表現言語の使用(strict) :Formats that are ontologically-grounded and machine-resolvable(Linked Data)
I2A FAIRな言語の使用(loose) :データやメタデータの記述に使用されている言語自体がFAIRであるか。loose: 機械可読でなくてもFAIRな言語で書
かれていればよい。
I2B FAIRな言語の使用(strict) :機械可読であることが必要(Linked Data)
I3 的確な外部リンク:外部リンクがあることは5つ星のLinked Dataの条件
R1.1 メタデータがライセンスへのリンクを持っているか:ハッシュスタイル:「ライセンス」キーを検索。Linked Data:ライセンスに使用される述
語をもつかどうか。
9. Checklist to evaluate FAIRness of data(sets)
( https://docs.google.com/forms/d/e/1FAIpQLSf7t1Z9IOBoj5GgWqik8KnhtH3B819Ch6lD5KuAz7yn0I0Opw/formResponse )
Findability
Will your dataset have a Persistent Identifier after deposit?
A persistent identifier (PID) is a long-lasting reference to a single file or set of files. The DOI (Digital Object Identifier) is an
example of a commonly used PID for publications and data. Repositories with a CoreTrustSeal certification assign a PID to
each dataset. You can therefore answer yes if you answered the previous question with yes, too. (Note: even though this
question is listed under the letter F (findable), it also relates to A (accessible).)
YES / NO
Did you provide enough information (metadata) about your data for others to understand and reuse your data?
Metadata is the data that describes an object such as a dataset. It gives context to the research data, providing information
about the creator, provenance, purpose, time, geographic locations, access conditions, and terms of use of a data collection.
YES / NO
Did you provide rich additional documentation?
Additional documentation such as a summary of the content of the data, text about methodologies used or an explanation of
how data was collected helps other researchers assess and contextualize datasets (this question also relates to the letter R
(reusability) of FAIR).
YES / NO
10. FAIR
RDA : FAIR Data Assessment Model WG
https://www.rd-alliance.org/groups/fair-data-maturity-model-wg
本資料 : https://doi.org/10.15497/rda00035
13. E7: FAIRなデータキュレーションの実践
( https://fairsharing.org/ )
Identifier Schema: InChi keys, DOIs, Handles, URLs etc.
→ compliance testに使用するものはまずFAIRsharing に登録
→ compliance test 時はAPIを介してFAIRsharingから情報を取得
将来的には以下のものもFAIRsharingで対応予定
Web transport protocols, file formats, other standards and policies
14. E7: FAIRなデータキュレーションの実践
FAIR evaluationと学術分野・対象
FAIR原則の適用範囲
・分野:人文
社会学
科学(物理・地学・化学・生物・医学etc.)
etc.
・対象:データ
ソースコード
ツール
その他デジタルリソース全般
FAIR Evaluatior
・特定の目的に合わせてカスタマイズすることが可能
であり、期待される
・コミュニティで採用されたメトリックを設計してい
くことが必要
FAIRメトリックの初期セット
Identifier uniqueness (F1)
Identifier persistence (F1)
Structured metadata (F2)
Grounded metadata (F2)
Use of GUIDs in metadata (F3)
Metadata being indexed in a searchable resource (F4)
An open protocol for (meta)data retrieval (A1.1)
The protocol’s support for authentication/authorization (A1.2)
Metadata persistence (A2)
The use of a knowledge representation language (loose) (I1)
The use of a knowledge representation language (strict) (I1)
The use of FAIR vocabularies (loose) (I2)
The use of FAIR vocabularies (strict) (I2)
Qualified outward links (I3)
Metadata containing a link to a license (R1.1)