SourceData делает данные доступными для обнаружения

«В биологических науках большая часть данных, производимых исследователями, публикуется в форме цифр. Рисунки — это сердце научной статьи. Однако инструменты поиска, используемые для поиска опубликованных статей, обычно ограничиваются текстовым поиском на основе ключевых слов, который исключить содержимое рисунков », — поясняет руководитель проекта SourceData Томас Лембергер из EMBO.

Это может привести к тому, что релевантные данные будут пропущены из результатов поиска из-за отсутствия последовательного метода представления фигур в доступной для поиска форме.С помощью SourceData создается машиночитаемое описание каждого рисунка, которое сохраняется в структурированной базе данных.

Биологические объекты, представленные на рисунке, такие как гены, белки или молекулы, связаны со стандартизованными таксономиями, чтобы избежать двусмысленности названий. Это означает, что каждое появление определенного биологического объекта на рисунке или наборе результатов можно быстро найти в базе данных SourceData. SourceData также хранит направление отношений между сущностями: манипулировали ли они или наблюдали, что позволяет осуществлять очень специфический поиск, основанный на экспериментальном дизайне.Соавтор статьи Робин Лихти из Швейцарского института биоинформатики SIB (SIB) объясняет: «SourceData связывает цифры с другими связанными цифрами в статьях и журналах для построения доступного для поиска графа знаний, качество которого контролируется кураторами-экспертами.

Читатели научных статей могут использовать это для более эффективного поиска нужных данных ".SourceData предоставляет набор приложений, включая SmartFigures: расширенные цифры, содержащие ссылки на связанные результаты и данные, которые могут быть встроены в онлайн-публикации, DataSearch: поисковая система, которая находит опубликованные цифры на основе их содержания данных, и MetaFig: интерфейс курирования, который предлагает компьютеру -сопровождение импорта новых рисунков в формат SourceData

Платформа SourceData в настоящее время находится в активной разработке, при этом EMBO и SIB взаимодействуют с академическими издателями, чтобы установить открытый и эффективный стандарт для обнаружения и повторного использования цифр и данных.


Портал обо всем