- 相關(guān)推薦
關(guān)于海量數據處理的面試題
YJBYS小編認為,當你為面試做了足夠的準備是時(shí)候,你的面試已經(jīng)成功了一半,下面來(lái)看看以下的面試題吧。
在處理海量數據問(wèn)題時(shí),首先要仔細分析問(wèn)題,明白問(wèn)題需要解決那些關(guān)鍵問(wèn)題,明白需要達到怎樣的存儲、性能要求,在這之前,應充分理解業(yè)務(wù)數據的分布、數據粒度、數據服務(wù)的質(zhì)量要求、數據的動(dòng)態(tài)性、數據的關(guān)聯(lián)性等真實(shí)數據、業(yè)務(wù)熟悉。通常我認為,處理海量數據問(wèn)題時(shí),心中要有一些基本概念:
1. 現有的開(kāi)源的優(yōu)秀工具那些是處理海量數據的;
2. 海量數據就因為數據大嗎,可以考慮對海量數據進(jìn)行分區操作;
3. 加快海量數據的訪(fǎng)問(wèn),數據索引必不可是;
4. 內存總是有限的,內存的速度是最好的,建立緩存機制是十分必要的;
5. 海量數據來(lái)源多樣,數據格式也不相同,最好是統一為字符串處理,邏輯處理交給上層應用;
6. 海量數據離不開(kāi)集群、分布式,分布式的出錯處理、負載均衡就必然要有一套可行的機制;
7. 所有底層的問(wèn)題或者說(shuō)存儲的問(wèn)題解決了,未來(lái)方便上層應用或者夸大底層支持的業(yè)務(wù),對外應該有一個(gè)明朗的邏輯視圖;
8. 系統設計和結構,會(huì )因為不同的語(yǔ)言、操作性在實(shí)現難以上不同,這也需要考慮;
9. 海量數據的一個(gè)應用就是數據挖掘服務(wù),多域數據來(lái)源統一管理下,數據倉庫和相關(guān)計算也應該了解一二;
10. 盡管說(shuō)存儲不是問(wèn)題,如果能對數據進(jìn)行壓縮處理,又可以接受的性能,這何樂(lè )而不為呢。
在參考前人博客、文摘加上個(gè)人一點(diǎn)理解,匯總以下一些基礎概念已幫助和我一樣面臨就業(yè)的學(xué)生,應對未來(lái)公司的面試考核。當然,有實(shí)際工作經(jīng)驗的大牛門(mén)來(lái)說(shuō),下面的問(wèn)題早已不是問(wèn)題,他們都在某個(gè)問(wèn)題上是專(zhuān)家了。歡迎大牛指導!
具有通用性的數據結構和算法思路匯總有:
1. Bloom filter
2. Hashing
3. bit-map
4. 堆
5. 雙層桶劃分,可以理解為多級索引
6. 數據庫索引
7. 倒排索引(Inverted index)
8. 外排序
9.trie樹(shù)
10.分布式處理
附:Android面試題
1、Activity的基本知識和Activity之間的跳轉
2、Service的基本知識和怎么樣用一個(gè)service來(lái)播放音樂(lè )
3、Service和Thread的區別,什么時(shí)候只能用Service不能用Thread
4、進(jìn)程之間的通信
5、SQLite的基本知識和操作,contentprovider和SQLite之前的聯(lián)系
6、怎么樣防止一個(gè)應用發(fā)生anr
7、AnycTask的基本知識
8、handler的操作,在一個(gè)子線(xiàn)程中的handler怎么被另一個(gè)子線(xiàn)程操作
9、所有的android控件都熟悉嗎
10、多分辨率的適配,dpi的定義,同一dpi,怎么區分不同大小的屏幕
11、對簡(jiǎn)歷中項目的描述(這個(gè)是重點(diǎn),描述的好壞直接決定了這次面試的成功與否)
12、對當前工作內容的描述
【海量數據處理的面試題】相關(guān)文章:
面試題精選?08-10
面試題精選07-11
網(wǎng)管面試題總結 面試題目分享08-10
分享面試題目 教育職業(yè)面試題09-26
應聘經(jīng)典面試題10-11
面試題總結08-23
用友的面試題07-07
.net面試題10-01
EMC面試題10-06
變態(tài)卻經(jīng)典的面試題10-22