登錄
微信登錄
打開手機(jī)微信,掃描二維碼
掃描成功
請(qǐng)勿刷新本頁面,按手機(jī)提示操作
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您的微信還未注冊(cè)
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您可以同時(shí)關(guān)注中科曙光微信公眾號(hào)
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經(jīng)注冊(cè)賬號(hào)和
關(guān)注微信公眾號(hào)
2025年1月
服務(wù)熱線:400-810-0466
發(fā)布時(shí)間: 2018-06-20
2018年5月8日,闡述我國(guó)科研人員在棉花變異基因組研究中取得重大進(jìn)展的兩篇論文同時(shí)在國(guó)際學(xué)術(shù)權(quán)威刊物《Nature Genetics》在線發(fā)表,中國(guó)農(nóng)科院棉花研究所(棉研所)、安陽工學(xué)院重點(diǎn)參與了兩篇論文的研究項(xiàng)目。這兩項(xiàng)研究成果為棉花遺傳研究和分子育種奠定了科研基礎(chǔ),為深化作物基因組研究提供了重要依據(jù)。這其中離不開現(xiàn)代技術(shù)對(duì)樣本基因的深入研究。
在其中一篇論文所闡述的“亞洲棉多樣性及演化的遺傳學(xué)基礎(chǔ)研究”項(xiàng)目中,曙光針對(duì)項(xiàng)目特點(diǎn),為其提供了總體運(yùn)算峰值13.248 TFLOPS(13.248萬億次浮點(diǎn)運(yùn)算/秒)、總存儲(chǔ)容量2PB(聚合帶寬15GBps以上)的基礎(chǔ)環(huán)境,充分支撐了對(duì)243份二倍體棉花種質(zhì)材料的重測(cè)序,研究結(jié)果加深了我們對(duì)中國(guó)亞洲棉群體進(jìn)化的認(rèn)識(shí),為將二倍體棉花優(yōu)良抗逆性狀導(dǎo)入廣泛種植四倍體棉花奠定了重要的遺傳基礎(chǔ),同時(shí)也會(huì)加快棉花育種進(jìn)程。曙光自主研發(fā)的ParaStor系統(tǒng)在該研究的基礎(chǔ)環(huán)境中發(fā)揮了重要作用。
性能高效,縮短測(cè)序時(shí)間的利器
在基因數(shù)據(jù)的應(yīng)用過程中,科研人員都希望能夠在盡可能短的時(shí)間內(nèi)完成測(cè)序工作,使結(jié)果盡早實(shí)現(xiàn)科研或商業(yè)化應(yīng)用。但在測(cè)序過程中會(huì)產(chǎn)生大到GB,小到KB的數(shù)以十億計(jì)的業(yè)務(wù)數(shù)據(jù)。如何在隨機(jī)讀、并發(fā)讀、順序讀等多種讀寫模式下從海量存儲(chǔ)中快速獲取基因數(shù)據(jù)成了科研人員要面臨的挑戰(zhàn)。
曙光ParaStor系統(tǒng)通過獨(dú)有的小文件聚合技術(shù),將眾多較小的block聚合成一個(gè)較大的數(shù)據(jù)流,充分利用ParaStor數(shù)據(jù)節(jié)點(diǎn)10Gb的帶寬性能,滿足快速存儲(chǔ)與讀寫需求。在文件分布策略上,ParaStor通過文件切片及N+M糾刪碼的冗余機(jī)制,能夠把單個(gè)文件系統(tǒng)擴(kuò)展到EB級(jí)規(guī)模,極大地改善了磁盤子系統(tǒng)的性能。ParaStor在研究過程中連續(xù)多次擴(kuò)容,實(shí)現(xiàn)了存儲(chǔ)性能和容量的線性增長(zhǎng),大幅提升了業(yè)務(wù)計(jì)算性能。ParaStor的緩存加速功能,則自動(dòng)將熱點(diǎn)基因數(shù)據(jù)存放在快速訪問上,實(shí)現(xiàn)訪問加速。多項(xiàng)技術(shù)共同造就了ParaStor的卓越性能,幫助科研人員完成挑戰(zhàn),實(shí)現(xiàn)重測(cè)序工作的高效進(jìn)行。
運(yùn)行穩(wěn)定,保證測(cè)序業(yè)務(wù)的不中斷
大量重測(cè)序數(shù)據(jù)的處理,對(duì)存儲(chǔ)系統(tǒng)造成了非常大的訪存壓力。同時(shí),任何的IO中斷都會(huì)影響測(cè)序計(jì)劃。而在使用過程中,硬盤、節(jié)點(diǎn)、網(wǎng)絡(luò)等硬件設(shè)備卻是“故障高發(fā)地”,如何保證基因測(cè)序工作穩(wěn)定進(jìn)行顯得尤為重要。
ParaStor在設(shè)計(jì)時(shí)就把重要部件發(fā)生問題作為常態(tài)考慮在內(nèi),在控制器、網(wǎng)絡(luò)、磁盤等層面都設(shè)計(jì)了冗余保護(hù),可容忍多塊硬盤或多個(gè)節(jié)點(diǎn)同時(shí)失效,且失效后業(yè)務(wù)不中斷、數(shù)據(jù)不丟失,大大提高了系統(tǒng)的可靠性,為重測(cè)序工作的穩(wěn)步推進(jìn)提供了有力保障。
管理自動(dòng)化,簡(jiǎn)化測(cè)序工作的復(fù)雜度
在研究過程中,科研人員更愿意將精力投入到數(shù)據(jù)處理和分析中,盡可能減少在IT設(shè)施運(yùn)維上的精力分散,ParaStor易管理的特點(diǎn)則充分滿足其需求。
ParaStor內(nèi)置的自動(dòng)管理機(jī)制極大簡(jiǎn)化了管理員的操作,多樣的報(bào)警機(jī)制則可及時(shí)可靠地將故障通知給管理員,減少運(yùn)維時(shí)間成本。利用ParaStor的管理工具,管理員可通過瀏覽Web頁面輕松完成系統(tǒng)的部署、監(jiān)控、管理和維護(hù)。管理工具的架構(gòu)同樣具有良好的擴(kuò)展性,使管理員的工作量不會(huì)因數(shù)據(jù)的增加而加大。
曙光ParaStor分布式存儲(chǔ)系統(tǒng)有效提升了基因測(cè)序的工作效率,保證了測(cè)序工作的順利進(jìn)行,減輕了運(yùn)維人員的壓力,為科研人員專注于核心工作,取得成果突破提供了有力支撐。曙光將充分發(fā)揮在信息技術(shù)領(lǐng)域積累的豐富經(jīng)驗(yàn)與技術(shù)優(yōu)勢(shì),為前沿科學(xué)技術(shù)研究提供強(qiáng)有力的IT支持,助力建設(shè)創(chuàng)新型國(guó)家和世界科技強(qiáng)國(guó)目標(biāo)的早日實(shí)現(xiàn)。