解決現代大數據服務部署的最佳方案: Mesosphere DC/OS

作者：VEPHP 時間 2017-09-18

《解決現代大數據服務部署的最佳方案: Mesosphere DC/OS》要點：
本文介紹了解決現代大數據服務部署的最佳方案: Mesosphere DC/OS，希望對您有用。如果有疑問，可以聯系我們。

作者：Eryn Muetzel譯者：俞捷

MesosCon北京將于6月20日到22日在北京國家會議中心舉行.這是Linux基金會主辦的一年一度的Mesos盛會.報名詳情請見閱讀原文,購票記得使用7折優惠碼 MCA1730.如今,絕大部分的業務邏輯程序都是數據驅動的.這些程序必須能夠實時地訪問大數據,并基于大數據來處理客戶的請求.和以前不同,大部分的現代企業都在向分布式和微服務架構遷移.這些微服務通常包括消息隊列,分布式數據庫,大數據分析引擎等等.容器技術在這其中也扮演了很重要的角色.然而我們發現,構建并維護能夠支撐這些微服務的數據服務其實是一件極其復雜很耗時的工作.這是為什么呢?

1. 部署一個數據服務耗時耗力

首先,運維人員在安裝像Kafka或者Cassandra這類的數據服務時,需要掌握一些特殊的知識；即使對于大牛和專家來說,部署這類數據服務也是非常耗時間的.舉個例子,最早的時候,AirBnB的運維人員用了差不多幾個月的時間才部署Kafka成功.其間碰到了無數的問題,踩了無數的坑.還有一點就是,有一些沒有架構好的數據服務,可能只有少數大牛知道如何正確的維護這些系統,可能你都找不到填坑的方法.

在過去的5到10年間,涌現出了很多數據存儲和分析引擎.它們之中很多都是開源的.因為維護和部署這些系統相當復雜,工程師和數據專家沒法很方便地去嘗試這些新的數據技術和框架.這也是為什么簡化部署數據服務能夠大大提高開發者效率的原因.

存儲和分析引擎的井噴

2. 人工運維數據服務非常容易出錯

運維數據服務也是主要的挑戰之一；通常,運維人員需要人工地處理升級,更新,錯誤后回滾,健康監控,存儲管理等工作.這些人工處理的工作都是非常容易出簍子的.企業通常需要化很多人力在運維上,間接導致了在其他創新領域上投入的減少.

通常運維人員需要不斷的更新軟件使得開發人員能夠用上新的特性,修復重要的問題.同時,新的版本也通常可以降低運維的開銷.軟件更新通常是一個非常耗時的工作.運維人員要么人工進行更新,或者需要編寫一些腳本來進行自動化更新.同時,運維人員還需要保證在上生產環境之前,更新和回滾都在測試環境下被完整的測試過.

3. 低效的基礎設施利用率

還有一個很大的挑戰是保證數據服務能有一個很好的資源利用率.數據中心一般的平均利用率在6%到12%之間.這個數字在2006年到2012年之間基本沒有什么變化.究其主要原因,是大部分公司都希望能夠保證在流量頂峰時候服務的質量.

Spark

傳統的靜態分割,非常的低效

通過虛擬機來增加資源利用率的方法在分布式系統里面并不適用.運維人員通常創建單獨的Spark, Kafka, Cassandra等集群.這樣做的原因是因為這些系統是分布式系統,它們有著自己彈性伸縮邏輯,所以運維人員會在不同的集群里面運行這些系統,從而來保證沒有資源上的沖突.

舉個例子來說,Spark會希望拿到盡可能多的資源來完成一個任務.Kafka可能需要能夠支持高吞吐量的磁盤資源.Cassandra則需要穩定的磁盤資源來存儲數據.顯而易見,在單獨集群部署這些服務的后果就是資源的嚴重浪費.如果在集群層面上使得這些服務能夠共享資源,這樣就可以很好的提高資源利用率.

公有云是出路么?

很多公司正在往公有云(或者混合云)遷移數據服務.往公有云遷移主要有以下兩個原因：

?能過立馬獲得公有云平臺所提供的服務,比如很多分析工具和數據庫服務.像AWS和Azure這類的公有云通常會把這些服務做的非常容易安裝和運維.
公有云數據服務通常支持彈性伸縮和高可用.

在最近的一次調查中,只有不到三分之一的公司在私有云中部署數據流水線,其他的公司都在公有云中部署. 雖然公有云在數據服務上有著明顯的優勢,缺點也非常明顯.主要缺點是可能會被公有云提供商綁架.針對公有云服務開發的應用通常會和公有云提供的API綁定.當應用開發完成后,想要遷移基本沒有可能.

最近有個很好的例子：Snapchat上市前,在它們的公開招股書中提到了一些數據.從中不難發現,Snapchat其實已經被Google公有云綁架了.

在去年5億美金的虧損中,有80%是因為其在Google公有云上的花銷.在招股書中,Snapchat宣稱它們的應用非常針對Google公有云的服務,沒有其他公有云提供商可以提供備選.這樣導致的結果就是,除非Snapchat花很大的力氣去重新構建它們的應用,否則它們永遠地和Google公有云綁定了.

還有很多其他公司在盲目地往公有云里面跳,導致的被綁定的風險大大的提高.你可能會問,有沒有公有云之外的選擇呢?

Mesosphere DC/OS:

簡化數據服務的部署和運維

Mesosphere致力于簡化現代化彈性分布式軟件的開發. Mesosphere DC/OS是市面上唯一一個在生產環境中被驗證的能夠同時運行容器和數據服務的平臺. DC/OS 能夠提高很多數據服務的部署速度,并簡化它們的運維.這些數據服務包括數據庫,消息隊列,大數據分析引擎等等.

DC/OS的核心是Apache Mesos?,一個分布式系統內核. 它擁有一個兩層資源調度機制,使得分布式系統之間能夠更好的分享集群資源.正因為有了兩層調度機制,使得DC/OS能夠在和其他容器編排系統(Kubernetes,Docker Swarm)的對比中脫穎而出.它簡化了數據服務的部署和運維,并且大幅度提高了資源利用率.

?一鍵部署: DC/OS中,你只需要一個命令,就可以安裝Spark, Cassandra, Kafka, ElasticSearch等數據服務. DC/OS還極大的簡化了數據服務實例大小的配置和重新配置,以及添加更多的實例. 通過Mesosphere DC/OS, 運維人員可以輕松的實現在線伸縮.
?簡化運維: DC/OS極大地節省了運維所需要的時間. 利用DC/OS,你可以輕松的進行軟件升級,軟件監控,以及 管理持久卷.
彈性數據平臺: DC/OS能夠在一個集群里同時運行多個數據服務,容器應用,以及傳統的應用.這極大地提高了資源利用率.一些Mesos和DC/OS宣稱它們的集群資源利用率達到了驚人的90%,節省了超過 60%的硬件開銷.

數據服務

Mesosphere DC/OS:

部署數據服務最理想的平臺

文章來自微信公眾號：云計算開源產業聯盟

轉載請注明本頁網址：
http://www.fzlkiss.com/jiaocheng/3730.html

標簽：

乱爱性全过程免费视频/午夜毛片视频/中文字幕av三区/一级视频网址

PHP教程

WEB前端開發

數據庫

WEB服務器

APP開發

LINUX學習

后端開發課程

前端開發課程

數據庫課程

解決現代大數據服務部署的最佳方案: Mesosphere DC/OS

1. 部署一個數據服務耗時耗力

2. 人工運維數據服務非常容易出錯

3. 低效的基礎設施利用率

同類教程排行

特輯教程