A Web Resource for Standardized Benchmark Datasets, Metrics, and Rosetta Protocols for Macromolecular Modeling and Design

Shane Ó Conchúir; Kyle A Barlow; Roland A Pache; Noah Ollikainen; Kale Kundert; Matthew J O'Meara; Colin A Smith; Tanja Kortemme

doi:10.1371/journal.pone.0130433

A Web Resource for Standardized Benchmark Datasets, Metrics, and Rosetta Protocols for Macromolecular Modeling and Design

PLoS One. 2015 Sep 3;10(9):e0130433. doi: 10.1371/journal.pone.0130433. eCollection 2015.

Authors

Shane Ó Conchúir¹, Kyle A Barlow², Roland A Pache¹, Noah Ollikainen², Kale Kundert³, Matthew J O'Meara⁴, Colin A Smith⁵, Tanja Kortemme⁶

Affiliations

¹ California Institute for Quantitative Biosciences (QB3), University of California San Francisco, San Francisco, California, United States of America; Department of Bioengineering and Therapeutic Sciences, University of California San Francisco, San Francisco, California, United States of America.
² Graduate Program in Bioinformatics, University of California San Francisco, San Francisco, California, United States of America.
³ Graduate Program in Biophysics, University of California San Francisco, San Francisco, California, United States of America.
⁴ Department of Pharmaceutical Chemistry, University of California San Francisco, San Francisco, California, United States of America.
⁵ California Institute for Quantitative Biosciences (QB3), University of California San Francisco, San Francisco, California, United States of America; Department of Bioengineering and Therapeutic Sciences, University of California San Francisco, San Francisco, California, United States of America; Graduate Program in Bioinformatics, University of California San Francisco, San Francisco, California, United States of America.
⁶ California Institute for Quantitative Biosciences (QB3), University of California San Francisco, San Francisco, California, United States of America; Department of Bioengineering and Therapeutic Sciences, University of California San Francisco, San Francisco, California, United States of America; Graduate Program in Bioinformatics, University of California San Francisco, San Francisco, California, United States of America; Graduate Program in Biophysics, University of California San Francisco, San Francisco, California, United States of America.

Abstract

The development and validation of computational macromolecular modeling and design methods depend on suitable benchmark datasets and informative metrics for comparing protocols. In addition, if a method is intended to be adopted broadly in diverse biological applications, there needs to be information on appropriate parameters for each protocol, as well as metrics describing the expected accuracy compared to experimental data. In certain disciplines, there exist established benchmarks and public resources where experts in a particular methodology are encouraged to supply their most efficient implementation of each particular benchmark. We aim to provide such a resource for protocols in macromolecular modeling and design. We present a freely accessible web resource (https://kortemmelab.ucsf.edu/benchmarks) to guide the development of protocols for protein modeling and design. The site provides benchmark datasets and metrics to compare the performance of a variety of modeling protocols using different computational sampling methods and energy functions, providing a "best practice" set of parameters for each method. Each benchmark has an associated downloadable benchmark capture archive containing the input files, analysis scripts, and tutorials for running the benchmark. The captures may be run with any suitable modeling method; we supply command lines for running the benchmarks using the Rosetta software suite. We have compiled initial benchmarks for the resource spanning three key areas: prediction of energetic effects of mutations, protein design, and protein structure prediction, each with associated state-of-the-art modeling protocols. With the help of the wider macromolecular modeling community, we hope to expand the variety of benchmarks included on the website and continue to evaluate new iterations of current methods as they become available.

Publication types

Research Support, N.I.H., Extramural
Research Support, Non-U.S. Gov't
Research Support, U.S. Gov't, Non-P.H.S.

MeSH terms

Amino Acids / chemistry
Benchmarking*
Datasets as Topic*
Evolution, Chemical
Internet*
Models, Molecular*
Mutation
Proteins / chemistry*
Proteins / genetics
Thermodynamics

Substances

Amino Acids
Proteins

Abstract

Publication types

MeSH terms

Substances

Grants and funding