2019-07-16 15:31:06 來(lái)源:互聯(lián)網(wǎng)
干垃圾or濕垃圾
你學(xué)會(huì)分類了嗎?
最近,上海的垃圾分類新聞成為了全國(guó)熱議的話題。先別急著笑,因?yàn)槔诸悓纳虾M崎_(kāi)到全國(guó)46個(gè)城市試點(diǎn),而且已經(jīng)提上日程,所以如何做好垃圾分類,是我們每個(gè)人都要做的功課。
而說(shuō)到了垃圾分類,小編就想到了數(shù)據(jù)分類,其實(shí)兩者何等的相似。曾經(jīng)認(rèn)為,數(shù)據(jù)只要安安靜靜地躺在磁盤(pán)里就好了,但隨著對(duì)數(shù)據(jù)的認(rèn)識(shí)越來(lái)越深刻,人們發(fā)現(xiàn)數(shù)據(jù)其實(shí)是一座閃閃發(fā)光的金礦。
而隨著AI、IoT的向前發(fā)展,數(shù)據(jù)的價(jià)值還在不斷上升,已經(jīng)成為企業(yè)最寶貴的資產(chǎn)。
從無(wú)人問(wèn)津到視若珍寶,這種轉(zhuǎn)變,真是有種恍若隔世的感覺(jué)。不過(guò),如果沒(méi)有正確地將數(shù)據(jù)因材施用,那么數(shù)據(jù)價(jià)值也無(wú)法真正實(shí)現(xiàn),如同錯(cuò)誤地把干垃圾放進(jìn)濕垃圾桶里一樣。
所以,對(duì)IT人來(lái)說(shuō),學(xué)會(huì)數(shù)據(jù)如何分類,同樣重要!
?
下面小編就出幾
道題來(lái)考考各位
01
辦公文檔、文本、XML等各類報(bào)表應(yīng)該歸類為結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)?
A. 結(jié)構(gòu)化數(shù)據(jù)。
C.非結(jié)構(gòu)化數(shù)據(jù)。
B. 兩者都不是。
D.兩者都是。
答案
C
解析:有些人誤以為只有圖像、影音之類的文件才是非結(jié)構(gòu)化數(shù)據(jù),其實(shí)凡是不適用于數(shù)據(jù)庫(kù)二維表來(lái)表現(xiàn)的都是非結(jié)構(gòu)化數(shù)據(jù),這包括所有格式的辦公文檔、XML、HTML、各類報(bào)表、圖片和咅頻、視頻信息等。
02
在結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)之間,還有半結(jié)構(gòu)化數(shù)據(jù),以下對(duì)半結(jié)構(gòu)化數(shù)據(jù)表述是正確的是?(多選)
A. 介于結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)之間。
B. 一種適用于數(shù)據(jù)庫(kù)集成的數(shù)據(jù)模型。
C. 半結(jié)構(gòu)化數(shù)據(jù)的構(gòu)成更為復(fù)雜和不確定,從而也具有更高的靈活性,能夠適應(yīng)更為廣泛的應(yīng)用需求。
D. 既是結(jié)構(gòu)化數(shù)據(jù),也是非結(jié)構(gòu)化數(shù)據(jù)。
答案
ABC
解析:半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)的數(shù)據(jù)之間的數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)的一種形式,它并不符合關(guān)系型數(shù)據(jù)庫(kù)或其他數(shù)據(jù)表的形式關(guān)聯(lián)起來(lái)的數(shù)據(jù)模型結(jié)構(gòu),但包含相關(guān)標(biāo)記,用來(lái)分隔語(yǔ)義元素以及對(duì)記錄和字段進(jìn)行分層。因此,它也被稱為自描述的結(jié)構(gòu)。
03
A.一個(gè)
C.三個(gè)
B.兩個(gè)
D.四個(gè)
答案
C
解析:一個(gè)證明存在性,一個(gè)證明唯一性,第三個(gè)推導(dǎo)出一種非構(gòu)建算法來(lái)實(shí)現(xiàn)他。
04
什么是熱數(shù)據(jù)?
A.溫度高于40度的數(shù)據(jù)。
B.指機(jī)房通風(fēng)不暢,吹不到空調(diào)的磁盤(pán)里的數(shù)據(jù)。
C.指需要被計(jì)算節(jié)點(diǎn)頻繁訪問(wèn)的數(shù)據(jù)。
D. 是指溫度高于60度的數(shù)據(jù)。
答案
C
解析:這就不需要解釋了吧
05
冷數(shù)據(jù)和熱數(shù)據(jù)如何進(jìn)行有效利用?
A.冷數(shù)據(jù)遠(yuǎn)離空調(diào),熱數(shù)據(jù)就近空調(diào)。
B.冷數(shù)據(jù)就近空調(diào),熱數(shù)據(jù)遠(yuǎn)離空調(diào)。
C.冷數(shù)據(jù)就近計(jì)算,熱數(shù)據(jù)集中存儲(chǔ)。
D. 冷數(shù)據(jù)集中存儲(chǔ),熱數(shù)據(jù)就近計(jì)算。
答案
D
解析:由于熱數(shù)據(jù)是需要被計(jì)算節(jié)點(diǎn)頻繁訪問(wèn)的在線類數(shù)據(jù),因此需要就近計(jì)算,而冷數(shù)據(jù)冷數(shù)據(jù)訪問(wèn)頻次低,效率要求慢,可以做集中化部署。
06
什么是流數(shù)據(jù)?
A. 會(huì)流動(dòng)的數(shù)據(jù)。
B. 是一組順序、大量、快速、連續(xù)到達(dá)的數(shù)據(jù)序列。
C. 在短時(shí)間內(nèi)被大量讀取或?qū)懭氲臄?shù)據(jù)。
D. 一種名為流數(shù)據(jù)的液體。
答案
B
解析:關(guān)于流數(shù)據(jù),可以看我們戴爾易安信中國(guó)研發(fā)中心的專家所寫(xiě)的文章。
07
按照粒度來(lái)劃分,數(shù)據(jù)分為以下哪幾個(gè)類別?
A. 明細(xì)數(shù)據(jù)、狀態(tài)數(shù)據(jù)。
B. 匯總數(shù)據(jù)、原始數(shù)據(jù)。
C.明細(xì)數(shù)據(jù)、匯總數(shù)據(jù)。
D.匯總數(shù)據(jù)、衍生數(shù)據(jù)。
答案
C
解析:所謂數(shù)據(jù)粒度,指的是數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)單元的細(xì)節(jié)程度或綜合程度的級(jí)別。這種分類方式的相關(guān)場(chǎng)景有兩種,一種是在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)時(shí),如何對(duì)數(shù)據(jù)進(jìn)行匯總,按什么方式進(jìn)行匯總,才能達(dá)到使用效率和匯總成本的平衡。另一種是數(shù)據(jù)分析人員在分析數(shù)據(jù)時(shí),在明細(xì)數(shù)據(jù)、各種匯總數(shù)據(jù)之間選擇合適的數(shù)據(jù),以提高分析效率。
08
A.按照字段類型劃分。
B.按照描述事物的角度劃分。
C. 按照數(shù)據(jù)粒度劃分。
D. 按照數(shù)據(jù)結(jié)構(gòu)劃分。
答案
A
解析:按照字段類型分類數(shù)據(jù)的是最基本的數(shù)據(jù)分類方式。
09
從描述事物的角度,數(shù)據(jù)有哪幾個(gè)分類?
A. 狀態(tài)類數(shù)據(jù)、事件類數(shù)據(jù)、混合類數(shù)據(jù)。
B. 事件類數(shù)據(jù)、匯總類數(shù)據(jù)、時(shí)間類數(shù)據(jù)。
C. 事件類數(shù)據(jù)、混合類數(shù)據(jù)、明細(xì)類數(shù)據(jù)。
D. 狀態(tài)類數(shù)據(jù)、衍生類數(shù)據(jù)、混合類數(shù)據(jù)。
答案
A
解析:這種分類方式在數(shù)據(jù)倉(cāng)庫(kù)建模是特別重要。數(shù)據(jù)倉(cāng)庫(kù)需要保存各種歷史數(shù)據(jù),不同類型的歷史數(shù)據(jù)保存方式差別很大。狀態(tài)類數(shù)據(jù)保存歷史的方式一般有兩種:存儲(chǔ)快照或者SCD方式。事件類數(shù)據(jù)一旦發(fā)生就已經(jīng)是歷史了,只需直接存儲(chǔ)或者按時(shí)間分區(qū)存儲(chǔ)。混合類數(shù)據(jù)保存歷史比較復(fù)雜,可以把變化的字段分離出來(lái),按狀態(tài)類數(shù)據(jù)保存,剩下不變的則按事件類數(shù)據(jù)保存,使用時(shí)再把兩者合并。
10
數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別?(多選)
A. 數(shù)據(jù)湖比數(shù)據(jù)倉(cāng)庫(kù)能存儲(chǔ)更多數(shù)據(jù)。
B. 數(shù)據(jù)湖是存儲(chǔ)大量原始數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)是存儲(chǔ)清洗加工過(guò)的,可信任的、結(jié)構(gòu)良好的數(shù)據(jù)。
C. 傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)工作方式是集中式的,數(shù)據(jù)湖是開(kāi)放式、自定義的。
D.數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)之前需要定義schema,數(shù)據(jù)湖是之后才需要定義。
答案
BCD
解析:數(shù)據(jù)湖建設(shè)思路從本質(zhì)上顛覆了傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)方法論。傳統(tǒng)的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)則強(qiáng)調(diào)的是整合、面向主題、分層次等思路。其兩者并不是對(duì)等的概念,更多是包含;即數(shù)據(jù)倉(cāng)庫(kù)作為數(shù)據(jù)湖的一類數(shù)據(jù)應(yīng)用存在。
11
D記有一款處理非結(jié)構(gòu)化數(shù)據(jù)的當(dāng)紅炸子雞,它是?
A. Unity XT
C.Isilon
B. XtremIO
D. SC Series
答案
C
解析:Dell EMC Isilon是業(yè)界排名第一的橫向擴(kuò)展NAS存儲(chǔ)平臺(tái),專用于存儲(chǔ)、管理和保護(hù)海量非結(jié)構(gòu)化數(shù)據(jù),同時(shí)大幅降低成本和復(fù)雜性。
12
滅霸響指一打,地球上的人口瞬間少了一半,請(qǐng)問(wèn)滅霸適合當(dāng)什么職業(yè)?
A.數(shù)據(jù)挖掘師
C.算法工程師
B.數(shù)據(jù)分析師
D.存儲(chǔ)管理員
答案
C
13
A. John R. Mashey于1998年發(fā)表的《大數(shù)據(jù)與下一代基礎(chǔ)架構(gòu)壓力》論文中最早提出。
B. 國(guó)際咨詢機(jī)構(gòu)麥肯錫于2011年發(fā)布的《大數(shù)據(jù):下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的前沿》研究報(bào)告中最早提出大數(shù)據(jù)概念。
C. Doug Laney在2001發(fā)表的《3D數(shù)據(jù)管理:控制數(shù)據(jù)數(shù)量、速度及種類》研究報(bào)告中最早提出了大數(shù)據(jù)概念。
D. 1987年,一個(gè)名為JohnP.Nelson的人在comp.sources.misc新聞組發(fā)布了一串代碼,其中有這樣一段說(shuō)明:#不管怎樣,它使用的是一個(gè)緊湊模型(小代碼,大數(shù)據(jù)),最早提出了大數(shù)據(jù)概念。
答案
A
解析:John R. Mashey最早提出了今天意義上的大數(shù)據(jù),而比他更早提出的大數(shù)據(jù)概念,指的并不是今天意義上的大數(shù)據(jù)。
14
小明是搞數(shù)據(jù)分析的,已經(jīng)學(xué)會(huì)了如何從DW中用SQL對(duì)數(shù)據(jù)ETL并建立Cube。目前想要找出今年2月份公司營(yíng)業(yè)收入遠(yuǎn)遠(yuǎn)小于其它月份的原因,但至今未果,為什么?Ps.使用過(guò)spss、sas中的數(shù)據(jù)挖掘模型。
A.小明技術(shù)不到家
C.今年二月只有28天
B.小明用錯(cuò)數(shù)據(jù)模型
D.二月是春節(jié)
答案
D
14道題,答對(duì)幾個(gè)了?
最后來(lái)一則廣告
現(xiàn)在購(gòu)買(mǎi)普通中端存儲(chǔ)
即可1:1免費(fèi)置換全閃存
更有多品類產(chǎn)品鉅惠出擊
買(mǎi)戴爾易安信存儲(chǔ)和服務(wù)器
買(mǎi)普通存儲(chǔ),免費(fèi)升級(jí)全閃,不加價(jià)!
獲取您的服務(wù)器專屬底價(jià)!
長(zhǎng)按二維碼立享存儲(chǔ)優(yōu)惠!