書馨卡幫你省薪 2024個人購書報告 2024中圖網(wǎng)年度報告
歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理

大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理

作者:拉賈拉曼
出版社:人民郵電出版社出版時間:2012-09-01
開本: 16開 頁數(shù): 258
讀者評分:5分1條評論
中 圖 價:¥18.9(3.2折) 定價  ¥59.0 登錄后可看到會員價
加入購物車 收藏
運費6元,滿39元免運費
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>

大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 版權信息

大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 本書特色

  大數(shù)據(jù)時代的及時雨   全球著名數(shù)據(jù)庫技術專家*新力作   理論與實際算法實現(xiàn)并重

大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 內(nèi)容簡介

  本書源自作者在斯坦福大學教授多年的“web挖掘”課程材料,主要關注大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘的實際算法。書中分析了海量數(shù)據(jù)集數(shù)據(jù)挖掘常用的算法,介紹了目前web應用的許多重要話題。主要內(nèi)容包括:
  □ 分布式文件系統(tǒng)以及map-reduce工具;
  □ 相似性搜索;
  □ 數(shù)據(jù)流處理以及針對易丟失數(shù)據(jù)等特殊情況的專用處理算法;
  □ 搜索引擎技術,如谷歌的pagerank;
  □ 頻繁項集挖掘;
  □ 大規(guī)模高維數(shù)據(jù)集的聚類算法;
  □ web應用中的關鍵問題:廣告管理和推薦系統(tǒng)。
  本書配套網(wǎng)http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些課件和項目作業(yè)。

大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 目錄

 第1章  數(shù)據(jù)挖掘基本概念  
1.1  數(shù)據(jù)挖掘的定義  
1.1.1  統(tǒng)計建! 
1.1.2  機器學習  
1.1.3  建模的計算方法  
1.1.4  數(shù)據(jù)匯總  
1.1.5  特征抽取  
1.2  數(shù)據(jù)挖掘的統(tǒng)計限制  
1.2.1  整體情報預警  
1.2.2  邦弗朗尼原理  
1.2.3  邦弗朗尼原理的一個例子  
1.2.4  習題  
1.3  相關知識  
1.3.1  詞語在文檔中的重要性  
1.3.2  哈希函數(shù)
展開全部

大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 作者簡介

  Anand Rajaraman 數(shù)據(jù)庫和Web技術領域權威,創(chuàng)業(yè)投資基金Cambrian聯(lián)合創(chuàng)始人,斯坦福大學計算機科學系助理教授。Rajaraman職業(yè)生涯非常成功:1996年創(chuàng)辦Junglee公司,兩年后該公司被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬遜技術總監(jiān),推動亞馬遜從一個零售商轉型為零售平臺;2000年與人合創(chuàng)Cambrian,孵化出幾個后來被谷歌收購的公司;2005年創(chuàng)辦Kosmix公司并任CEO,該公司2011年被沃爾瑪集團收購。Rajaraman生于印度,在斯坦福大學獲得計算機科學碩士和博士學位。求學期間與人合著的一篇論文榮列近20年來被引用次數(shù)最多的論文之一。博客地址http://anand.typepad.com/datawocky/。
  Jeffrey David Ullman 美國國家工程院院士,計算機科學家,斯坦福大學教授。Ullman早年在貝爾實驗室工作,之后任教于普林斯頓大學,十年后加入斯坦福大學直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD貢獻獎、Knuth獎等多項科研大獎;他是“龍書”《編譯原理》、數(shù)據(jù)庫領域權威指南《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》的合著者;麾下多名學生成為了數(shù)據(jù)庫領域的專家,其中最有名的當屬谷歌創(chuàng)始人Sergey Brin;本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

商品評論(1條)
  • 主題:學習大數(shù)據(jù)的必備書

    數(shù)據(jù)科學領域的必備書,原書由美國大學講義整理而來,中文譯者也是負責人的中青年才俊,書中講的很多算法非常不錯,適合碩博士閱讀,推薦

    2015/4/5 22:18:48
    讀者:xie***(購買過本書)
書友推薦
編輯推薦
返回頂部
中圖網(wǎng)
在線客服