Aird-Slice
面向搜索
质谱仪的使用越来越广泛,导致了 质谱 (MS)数据的应用越来越多。现有的 MS 数据格式,包括mzML、mzMLb和Aird,都采用行压缩策略。提取离子色谱仪(XIC)是MS数据主流处理中必不可少的一步,它涉及遍历每个MS并为目标m/z搜索相应的强度值。在对整个MS文件执行全面的、非目标数据分析时,现有的行压缩格式可有效处理数据。但是,在针对单个m/z进行检索时,行压缩带来的数据读取效率大大降低,XIC的计算速度也受到很大影响。在这里,我们介绍Aird-Slice,一种存储在列中的 MS 数据格式。
在XIC计算中,数据读取效率可达100%,XIC加速在测试数据集上平均增加 116 倍。总的来说,XIC 过程需要 最少的CPU和内存,使物联网设备能够高效地执行质谱数据计算。Aird-Slice保持合理的压缩率并提供在大规模质谱库中搜索一小组 m/z 的技术基础。随着 MS 数据存储库的不断发展,数据再分析和采矿技术变得越来越重要。存储MS数据格式策略必须考虑各种应用场景,而Aird-Slice提供了一种在低硬件条件下在 MS 数据存储库上进行数据搜索的新方法。Aird-Slice支持所有主流供应商格式。