
有一個神奇的小盒子,
只要把各種參數(shù)和設定往里面一扔,
你想要的仿真結果數(shù)據(jù)就會自動掉落。
——這可能是億萬仿真研發(fā)工程師的夢。
仿真外包在某種程度上就是這種盒子,但是,建議你先看下這篇:當仿真外包成為過氣網(wǎng)紅后…
現(xiàn)實讓人清醒。
除了操心仿真,研發(fā)工程師可能還有好多其他事情要做。
理想情況下,每一個仿真研發(fā)工程師身后都站著N個(N不一定是整數(shù),甚至可能N=0)IT工程師……IT搞定一切,研發(fā)啥都不用管,關心數(shù)據(jù)與模型就完事。
但事實上,研發(fā)與IT之間也是有壁的,他們說的是不同世界的語言。而且壁與壁之間還有一段不小的距離,不知道該歸誰管,需要懂交叉學科的人才。

仿真工程師們需要一個靠譜幫手來降低工作量,讓自己不再心累。
為了找到TA,我們考察了市面上幾乎所有類型的仿真平臺,充分評測了他們究竟能給研發(fā)(以及IT)減輕多少工作量,并搭建了一個仿真平臺【心累指數(shù)】模型:

該模型呈金字塔結構,覆蓋了目前市面上所有類型的仿真平臺產(chǎn)品/解決方案,從金字塔底層到塔尖,心累指數(shù)逐漸降低。
簡單點說,站得越高,用得越爽。
你可以跳過下文直接掃碼獲取白皮書閱讀完整報告,但看完會獲得一個全新的視角,也非常不錯。

我們從下往上,來看看在不同解決產(chǎn)品/解決方案中,研發(fā)的工作量與心累指數(shù)。

先說一下基本設定:
廚房基礎設施:偏硬件層的相關工作,包括但不限于機房建設與運維、服務器與存儲部署&配置&運維、網(wǎng)絡配置等事項,一般屬于IT的工作范疇。在少數(shù)情況下(比如有些公司沒有IT),可能由研發(fā)或其他人來負責。
配菜、調料、做飯:偏軟件層的相關工作,包括但不限于調度器運維與支持、操作系統(tǒng)兼容性調優(yōu)、數(shù)據(jù)保護與災備、仿真軟件部署與調優(yōu)、仿真軟件故障排除等事項。這些工作覆蓋的技能面較廣,權責不太明確,需要交叉型人才。
點菜、吃飯:研發(fā)負責點菜、吃飯,跑仿真任務。

我們先說買機器,相當于在自家廚房。
這里的“自家廚房”指本地硬件設施,單機、工作站、機房都有可能。

在自己家里的都是一家人。
研發(fā)大概是需要進廚房幫忙,與IT一起做飯的。如果沒有IT,可能廚房搭建也得幫忙。
而有些交叉領域問題,IT可能真不了解,研發(fā)也不得不自學大量技能,其中會涉及到大量的跨語種溝通,往往導致廚房里吵吵鬧鬧,一團亂麻。
自家廚房的容量,理論上沒有邊界,但擴建工程量相當大。
研發(fā)心累指數(shù):100
IT心累指數(shù):100
接著是使用超算中心和云廠商的資源兩種情況,可以看作租用公共廚房。

到了公共廚房,廚房基礎設施就是現(xiàn)成的了。
研發(fā)需要自己配菜,并帶上調料做飯,然后才能吃,這就很考驗研發(fā)的水平(和耐心)了。
當然如果自家廚房有IT,也是能叫過來幫幫忙的,不過這取決于IT對公共廚房的熟悉程度和水平,他主要還是在自家廚房里干活。
當然,公共廚房容量肯定是有限的。
超算中心還可能存在一種情況——有時研發(fā)正在廚房里忙,突然跑來一個陌生人也進來在旁邊做起飯來;甚至突然之間,公共廚房被宣布收回了,把研發(fā)趕了出來。。。
研發(fā)心累指數(shù):85
IT心累指數(shù):66

金字塔中層的四種平臺都可以看作自助餐廳。

到了自助餐廳,研發(fā)終于可以不用管做飯了,直接拿著菜就吃,這比金字塔底層已經(jīng)輕松太多了。
但自助餐廳供應的菜品有限,如果自己想吃的恰好沒有,那就是真沒有。。。。如果遇到問題,自家IT也可以幫忙,但僅限于口頭幫忙。
當有很多研發(fā)要吃飯的時候,一家自助餐廳的容量也是有限的。
研發(fā)心累指數(shù):58
IT心累指數(shù):30

以上情況,自家廚房跟餐廳之間沒有任何關系,都是各管各的。
我們屬于環(huán)球臻選餐廳模式。

這個環(huán)球臻選餐廳,后廚可以一鍵變大變小,如果你自己有一個或多個本地廚房,可以接入后廚統(tǒng)一管理。同時,餐廳還提供專屬管家服務,為研發(fā)和IT的交叉領域提供專業(yè)支持。
研發(fā)真正只需要吃飯就行了,再也不用操心廚房相關的事情了。
IT可以通過一個管理系統(tǒng)調用全部廚房設備做飯,自動化程度相當高,大大降低了工作量,比如可以隨時無限量采購全球特色食材、根據(jù)菜品的成熟度自動開關火、給每個研發(fā)設定能吃多少東西(響應光盤行動)。
研發(fā)心累指數(shù):0
IT心累指數(shù):0
接下來我們將用4大維度、25個小問題,從金字塔底到塔尖,為你詳細對比這些仿真平臺如何降低研發(fā)和IT的心累指數(shù):

以下為評測篇正文:
01 這究竟是個什么東西?
1.1、付了錢,那么你買到是什么?
底層:
硬件設備:臺式機、工作站、服務器等。
超算資源的使用權(因為要優(yōu)先服務國家級科研項目,可能會被無條件回收)。
云資源的使用權。
中層:
硬件資源/超算資源/云資源的使用權。
其中超算云的資源同樣有被無條件回收的可能性。
塔尖:
一整套即開即用的仿真研發(fā)環(huán)境,既連接上層應用,對應用本身的運行提供支持和優(yōu)化;同時連接底層資源,給用戶提供更靈活、更高效使用資源的能力。

1.2、兼容性怎么樣?能不能跟其他產(chǎn)品/方案混著用?
底層:
均不能混用。
中層:
均不能混用。
塔尖:
fastone云平臺的底層資源來自多家公有云廠商,可根據(jù)你的情況在多家云廠商之間匹配最合適的云端資源。
fastone云平臺也可將本地資源與云資源打通,完美支持混合云,詳見問題2.3。
1.3、多久可以開始用這個東西?
底層:
買機器首先得走項目審批采購流程,準備好相應的機器空間、網(wǎng)絡環(huán)境、風火水電……機器到位之后,還得部署環(huán)境、安裝軟件。
超算中心有一套固定的審批流程,對科研用戶較寬松且快捷,企業(yè)用戶很難申請成功。如果成功申請到了超算資源,系統(tǒng)是安裝好的(一般是各種版本的Linux),也會有一部分仿真軟件,沒有的需要自己搞定。
審批不是唯一的阻礙,由于超算資源總量不多,對外開放的又有限,還經(jīng)常需要供給國家級科研項目,超算資源一般都需要排隊。

云廠商的資源是即開即用的,你可以選擇好自己需要的系統(tǒng)和版本,軟件需要自己裝。
中層:
均支持分鐘級開通賬號。
其中云廠商的仿真平臺和軟件平臺在開通賬號后可立即開始使用資源。
硬件廠商的仿真平臺使用資源需要申請,平臺方電話審核通過后才能開始使用。
超算云的資源則與超算中心一樣,同樣面臨排隊的問題。
塔尖:
fastone云平臺的賬號和資源都是即開即用的,無需審批。
1.4、我用的仿真軟件能夠支持嗎?能支持多少?
底層:
買機器和云廠商均需要自己裝軟件。
超算中心支持常見的仿真軟件,但支持列表更新緩慢,無法針對個人需求調整。
中層:
一部分硬件廠商和云廠商的仿真平臺會與軟件商有合作關系,但這種合作較為松散,支持的軟件數(shù)量與程度也極其有限。對于沒有合作關系的平臺,那就只能自己搞定了。
超算云跟超算中心一樣,僅支持常見仿真軟件且更新緩慢。
軟件平臺只支持他們家自己的軟件。
塔尖:
作為一個開放的平臺,fastone云平臺支持市面上絕大部分商業(yè)/開源仿真軟件和AI框架。所有軟件裝在一個平臺上,使用方便。自編譯軟件也能安裝。

1.5、軟件支持深度怎么樣?
底層:
買機器和云廠商是完全不管軟件的。
超算中心上面說了,支持常見的仿真軟件,但這個“支持”僅限于特定版本的軟件,無法自由選擇。
中層:
硬件廠商和云廠商的仿真平臺對軟件的支持和管理由軟件廠商提供(如果有合作關系的話),一般只涉及到軟件使用層面。部分云廠商可能和特定的軟件廠商有深入合作,比如Ansys與微軟Azure推出的Ansys Cloud,主要支持海外區(qū)域。
超算云與超算中心一樣,僅限于支持特定版本的軟件。
軟件平臺本身是軟件的所有者,其對軟件的支持非常靈活,甚至可以達到產(chǎn)品級的修改(當然,這種級別的修改一般不面向用戶),不過,依然僅限自家軟件。
塔尖:
云平臺不僅支持的軟件數(shù)量多,支持深度也足夠。比如優(yōu)化軟件的運行方式,讓其可以充分利用云端海量資源的優(yōu)勢并行運算,大幅提升研發(fā)效率。

比如跑COMSOL任務,當核數(shù)逐漸增加后,由于節(jié)點間通信開銷指數(shù)級上升,性能的提升會隨著線程數(shù)增長逐漸變緩,使用網(wǎng)絡加強型實例可以有效解決該問題,具體戳這里:這樣跑COMSOL,是不是就可以發(fā)Nature了
原理可戳這里:揭秘20000個VCS任務背后的“搬桌子”系列故事
1.6、資源量夠不夠?
底層:
買機器的話,理論上你可以一直買買買,直到把自己買成一家公有云廠商。但實際操作中受到資金、人力、空間等各種因素的考量,不可能無限制地購買機器。
超算中心的資源量則沒有想象中那么“超級”,具體要看它的機器數(shù)量和規(guī)模。并且由于資源要優(yōu)先供給國家級科研項目,對外開放的實際可用資源非常少,對單個用戶開放的資源還存在上限,而且只提供固定套餐,可以選擇的范圍很小。

云廠商的資源則取決于其自身機房數(shù)量與規(guī)模。
中層:
總體來說,取決于該廠商/合作資源方的機房數(shù)量和規(guī)模。
需要指出的是,有些超算云與云廠商存在合作關系,資源總量可能會略高于超算中心。
塔尖:
fastone云平臺的全球數(shù)據(jù)中心能夠提供海量計算資源。

1.7、我對機器有要求,比如要新型號的CPU或GPU,有嗎?
底層:
買機器的話,錢到位就行了,一般不至于買不到。
超算中心的硬件更新頻率較慢,普遍缺少最新款或者某些指定型號的硬件。
不同云廠商之間特定資源的保有量存在很大差異,用戶實際能夠使用的資源量會受到相應限制。
中層:
與上一個問題一樣,廠商/合作資源方的機房數(shù)量和規(guī)模決定了特定資源能否滿足你的需求。
塔尖:
跨云跨區(qū)域數(shù)據(jù)中心不僅意味著資源量大,也能提供類型最豐富和最新型號的計算資源。
1.8、是怎么計費的?
底層:
買機器除了硬件費用,還有網(wǎng)絡設備、運維人力、機房空間、風火水電、時間成本等等各種隱形投入。
詳情可戳:幫助CXO解惑上云成本的迷思,看這篇就夠了
超算中心有排隊和預留兩種計費模式。前者參與任務排隊,按照實際使用的機時支付相關費用;后者單獨劃給你一塊資源使用一段時間并計費。
云廠商則可以提供按需、預留、競價等靈活的計費模式。
按需:用多少付多少,避免浪費,單位通常為小時,簡單易計算,缺點是價格比較高。
預留:針對長期需求(比如包年包月),相當于批發(fā),價格比按需便宜。
競價:可被搶占實例,相當于秒殺,又稱SPOT。手快有手慢無,價格可高可低波動大,隨時可能被搶占中斷,需要有一定的技術實力才能使用。

中層:
計費模式通常較為靈活,常見的包年、包月、按需都有。
塔尖:
按需、預留、競價均支持。
02 適用場景廣泛嗎?
2.1、主要服務對象是誰?
底層:
超算中心主要面向高校,對企業(yè)基本不開放。
買機器和云廠商對高校和企業(yè)均適用。
中層:
所有人。
塔尖:
所有人。
2.2、產(chǎn)品模式是怎樣的?
首先科普一下,產(chǎn)品模式包括IaaS、PaaS、SaaS三種。
我們用做披薩來打比方。
你可以從頭到尾自己生產(chǎn)披薩,也可以外包一部分工作。
根據(jù)外包的程度不同,我們就有了IaaS、PaaS、SaaS三種方案:

IaaS:有人提供廚房、爐子、煤氣,你使用這些基礎設施,來烤你的披薩。PaaS:除了基礎設施,還有人提供披薩餅皮。你只要把自己的配料灑在餅皮上,讓他幫你烤出來就行了。
SaaS:有人直接做好了披薩,不用你的介入,到手的就是一個成品,你可以直接開吃。
如果看不懂,歡迎查看《2023仿真宇宙漫游指南——工業(yè)仿真從業(yè)者必讀》白皮書Part 3
底層:
三者均屬于IaaS。
中層:
均為SaaS。
相比金字塔底層的IaaS,即開即用的優(yōu)勢十分明顯,同時對用戶的要求全面降低,硬件和環(huán)境完全不用管了,軟件也搞定了一部分,用戶注冊完賬號后即可馬上使用。
塔尖:
SaaS+PaaS,唯一有PaaS的存在。
云平臺的SaaS模式直接提供一整套即開即用的研發(fā)環(huán)境,而PaaS則增加了IT自動化、多地協(xié)同等好用的功能和R&D-IT服務,還能將本地資源一起利用起來。
2.3、可以跟自己本地的機器一起用嗎?
這相當于使用各種別人廚房/餐廳的同時,把自家廚房也利用起來。
保留本地的廚房規(guī)模和生產(chǎn)模式,充分利用,減少浪費。只是在生產(chǎn)量大的時候使用其他方案。這就是混合云了。

底層:
自己買機器當然可以跟本地機器一起用了。
超算中心與云廠商則均為獨立使用的資源,你用你的,我用我的,互不干涉。
中層:
所有平臺只能使用該廠商自己(和合作方)的資源,均不支持混合云。
塔尖:
唯一支持混合云的存在。
fastone云平臺在獲取外部資源的同時,能夠將本地的計算資源給充分利用起來。當用戶處理日常任務時,可以只在本地運行。
而當本地資源不足以應付時,直接自動連接云端海量資源進行運算,操作相當方便,完全不改變用戶的操作習慣。
而通常情況下,本地環(huán)境的持續(xù)維護需要消耗大量精力。我們的云上運行環(huán)境都是自動化配置的,不需要人工干預,用戶還可以通過平臺進行統(tǒng)一管理和監(jiān)控,方便易操作。

2.4、可以多地協(xié)同使用嗎?
有些大型制造企業(yè)擁有多個處于不同區(qū)域的研發(fā)中心,身處不同研發(fā)中心的工程師如何協(xié)同:
如何保證所有用戶體驗一致?
如何確保所有用戶網(wǎng)絡共通?
如何建立統(tǒng)一的身份認證?
如何進行統(tǒng)一的數(shù)據(jù)管理?
如何建立統(tǒng)一的安全體系?
如何對多區(qū)域用戶統(tǒng)一管理?
……
我們把這一系列問題統(tǒng)稱為多地協(xié)同。
底層:
均不支持。
中層:
均不支持。
塔尖:
唯一支持多地協(xié)同的存在。
fastone云平臺提供了統(tǒng)一且經(jīng)過優(yōu)化驗證的計算環(huán)境,一致性較高,不會由于環(huán)境問題導致計算出錯,極大提升了多地/遠程/海外的協(xié)同效率。

本次評測篇上半部分就到這里了,后續(xù)即將發(fā)布的下半部分將針對研發(fā)和IT的日常工作,解答“如何提升研發(fā)效率”與“如何降低IT工作量”,敬請關注哦~
歡迎直接掃碼獲取白皮書閱讀完整報告:

目錄先睹為快~

關于fastone云平臺在各種CAE應用上的表現(xiàn),可以點擊以下應用名稱查看: Bladed │ Fluent │ LS-DYNA │ COMSOL
- END -
我們有個CAE仿真研發(fā)云平臺
集成多種CAE/CFD應用,大量任務多節(jié)點并行
應對短時間爆發(fā)性需求,連網(wǎng)即用
跑任務快,原來幾個月甚至幾年,現(xiàn)在只需幾小時
5分鐘快速上手,拖拉點選可視化界面,無需代碼
支持高級用戶直接在云端創(chuàng)建集群
掃碼免費試用,送200元體驗金,入股不虧~

更多電子書
歡迎掃碼關注小F(ID:imfastone)獲取

你也許想了解具體的落地場景:
王者帶飛LeDock!開箱即用&一鍵定位分子庫+全流程自動化,3.5小時完成20萬分子對接
這樣跑COMSOL,是不是就可以發(fā)Nature了
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個分子要花多少錢
LS-DYNA求解效率深度測評 │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個VCS任務背后的“搬桌子”系列故事
155個GPU!多云場景下的Amber自由能計算
怎么把需要45天的突發(fā)性Fluent仿真計算縮短到4天之內?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個分子
從4天到1.75小時,如何讓Bladed仿真效率提升55倍?
從30天到17小時,如何讓HSPICE仿真效率提升42倍?
關于為應用定義的云平臺:
2023仿真宇宙漫游指南——工業(yè)仿真從業(yè)者必讀
當仿真外包成為過氣網(wǎng)紅后…
和28家業(yè)界大佬排排坐是一種怎樣的體驗?
這一屆科研計算人趕DDL紅寶書:學生篇
楊洋組織的“太空營救”中, 那2小時到底發(fā)生了什么?
一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP
Ansys最新CAE調研報告找到阻礙仿真效率提升的“元兇”
國內超算發(fā)展近40年,終于遇到了一個像樣的對手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費4小時5500美元,速石科技躋身全球超算TOP500
